Konwertuj obraz na tekst za pomocą Python OCR API za pośrednictwem Java
Rozpoznaj tekst w obrazach z Pythonem
Więcej prezentacji ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Dlaczego aspose.ocr for Python przez Java?
Aspose.ocr for Python za pośrednictwem Java bezproblemowo integruje potężne możliwości rozpoznawania znaków optycznych (OCR) z notebookami i aplikacjami Python Python. Dzięki naszemu intuicyjnej i szybkiej interfejsu API możesz bez wysiłku wyodrębnić tekst ze skanów, zrzutów ekranu, linków internetowych lub zdjęć smartfonów, zapewniając wyniki gotowe do konsolidacji, analizy lub przechowywania. Rozpoznaj zeskanowane obrazy, zdjęcia ze smartfonów, zrzuty ekranu i zeskanowane pliki PDF, zapisując wyniki w popularnych formatach dokumentów. Zaawansowane filtry przed przetwarzaniem obsługują obrócone, wypaczone i hałaśliwe obrazy. Zoptymalizuj wydajność poprzez rozładowanie zadań do GPU.

Szybki i dokładny OCR
Osiągnij szybkie i dokładne wyniki OCR dzięki naszemu zaawansowanemu Pythonowi za pośrednictwem technologii Java.
Wsparcie wielojęzyczne
Rozpoznaj tekst w ponad 140 językach, w tym scenariusze łacińskie, cyryliczne, arabskie, perskie, wskaźniki i chińskie, zapewniając wszechstronność aplikacji Python za pośrednictwem Java.
Elastyczna obsługa obrazu
Przetwarzają obrazy ze skanerów, kamer i smartfonów płynnie z Pythonem przez Java.
Precyzja w rozpoznawaniu postaci chińskiej
Rozpoznaj ponad 6000 chińskich postaci z precyzją w swoich projektach Python za pośrednictwem Java.
Zachowaj style czcionek i formatowanie
Utrzymuj style czcionek i formatowanie w celu dokładnego przedstawienia rozpoznanego tekstu w aplikacjach Python za pośrednictwem Java.
Próbka kodu na żywo
Zainicjuj rozpoznawanie tekstu z obrazów w zaledwie trzech wierszach kodu. Doświadcz prostoty!
* Przesyłając swoje pliki lub korzystając z Usługi, z którą zgadzasz się z naszym Warunki użytkowania I Polityka prywatności.
Konwertuj obraz na tekst
Więcej przykładów ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wybierz swoje preferencje
Wybierz odpowiednią bibliotekę dla swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.
Wszechstronność
Python via .NET
Jednolitość
Python via Java
Wydajność
Python via C++
Kompatybilność Backend Java
Zaprojektowana jako moduł Python, nasza biblioteka zapewnia kompatybilność w głównych systemach operacyjnych obsługujących Java - w tym Microsoft Windows, Linux i MacOS lub platformach chmurowych. Umożliwia to tworzenie aplikacji na jednej platformie i bezproblemowe uruchamianie ich na drugiej, eliminując potrzebę modyfikacji kodu.
Obsługiwane formaty plików
Aspose.OCR for Python via Java może pracować z dowolnym plikiem Możesz dostać ze skanera lub aparatu. Wyniki rozpoznawania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Partia ocr
- Multi-page PDF
- ZIP
- Folder
Wyniki rozpoznawania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Bez wysiłku instalacja Pythona przez Java
Aspose.ocr for Python przez Java jest dostarczany jako pakiet Python lub jako plik do pobrania z minimalnymi zależnościami. Łatwo zainstaluj w swoim projekcie i jesteś gotowy do rozpoznania tekstów w wielu obsługiwanych językach i zapisanie wyników rozpoznawania w różnych formatach.
Poproś o licencję próbną , aby rozpocząć opracowanie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.
Potężny OCR do aplikacji Python
Nasza biblioteka łatwo integruje się, umożliwiając bezproblemowe aplikacje Python na dowolnej platformie - komputery Desktop Windows, Windows Server, MacOS, Linux i Cloud.
140 języków rozpoznawania
Nasz API Python i Java OCR rozpoznaje mnóstwo języków i popularne skrypty pisarskie, w tym języki mieszane:
Pozostaw wykrywanie języka do biblioteki lub sam zdefiniuj język, aby uzyskać zwiększoną wydajność i niezawodność rozpoznawania.
- ** Rozszerzona łacińska ** Alfabet: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i 80+ więcej;
- ** Cyrillic ** Alphabet: Rosjanin, Ukraińczyk, Kazach, Serbijski, Białoruski, Bułgarski;
- Arabski, perski, urdu;
- Skrypt chiński i devanagari, w tym hindi, marathi, bhojpuri i inni.
Ulepszone filtry przetwarzania obrazu
Precyzja optycznego rozpoznawania znaków opiera się w dużej mierze na jakości oryginalnego obrazu. Aspose.ocr for Python przez Java oferuje szeroką gamę zarówno zautomatyzowanych, jak i ręcznych filtrów przetwarzania obrazu w celu optymalizacji obrazu przed przesłaniem do silnika OCR:
- Automatycznie wyprostuj lekko przechylone obrazy.
- Ręcznie popraw obrót poważnie wypaczonych obrazów.
- Automatycznie usuń brud, plamy, zarysowania, olśnienia, niechciane gradienty i inne rodzaje hałasu.
- Automatycznie dostosuj kontrast obrazu.
- Automatycznie ekskluzywne lub ręczne rozmiaru obrazu.
- Konwertuj obrazy na czarno -białą lub szarość.
- Odwrócone kolory obrazu, dzięki czemu jasne obszary wydają się ciemne, a ciemne obszary wydają się jasne.
- Zwiększ grubość znaków na obrazie.
- Rozmycie hałaśliwe obrazy podczas zachowania krawędzi listów.
- Prostuj skośnie i popraw zniekształcenie obiektywu aparatu na zdjęciach stron.
Określone interfejsy API dla różnych typów dokumentów
Aspose.ocr for Python za pośrednictwem Java oferuje specjalnie przeszkolone sieci neuronowe do wyodrębnienia tekstu z niektórych rodzajów obrazów z maksymalną dokładnością:
- Zeskanowane lub sfotografowane dowody tożsamości i paszporty.
- Tablice rejestracyjne pojazdu.
- Faktury.
- Wpływy kasowe.
Wbudowany sprawdzanie pisowni
Chociaż aspose.ocr for Python za pośrednictwem Java zapewnia wysoką dokładność rozpoznawania, drukowanie wad, brudu lub niestandardowych czcionek może powodować niepoprawne rozpoznanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć sprawdzanie pisowni, który znajduje i automatycznie koryguje błędy pisowni w oparciu o wybrany język rozpoznawania.
Jeśli uznany tekst zawiera specjalistyczną terminologię, skrót i inne słowa, które nie są obecne we wspólnych słownikach pisowni, możesz podać własne listy słów.
Skuteczne rozpoznawanie partii
Nasz API Python OCR umożliwia usprawnienie rozpoznawania obrazu. Wykorzystaj wszechstronne metody przetwarzania wsadowego do wydajnego przetwarzania wielu obrazów w jednym wywołaniu:
- Rozpoznaj liczbę plików PDF, TIFF.
- Przetwarzaj wszystkie pliki w folderze.
- Obsługuj rozpoznawanie wszystkich plików w archiwum.
- Rozpoznaj obrazy z określonej listy.
Uczenie się za pośrednictwem przykładów Pythona
Zbadaj różne przykłady Pythona zaprojektowane tak, aby pomóc ci szybko uchwycić funkcje i możliwości naszego rozwiązania OCR. Szybko zyskuj wgląd w tworzenie niestandardowych rozwiązań, które spełniają konkretne wymagania biznesowe.
Funkcje i możliwości
Aspose.OCR for Python via Java Przeglądaj zaawansowane cechy aspose.ocr for Python
Photo OCR
Wyodrębnij tekst ze zdjęć ze smartfonów z dokładnością na poziomie skanowania.
Wyszukiwanie pdf
Konwertuj dowolny skan na w pełni możliwy do wyszukiwania dokument.
Uznanie URL
Rozpoznaj zdjęcie z adresu URL bez pobierania go lokalnie.
Rozpoznawanie masowe
Przeczytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Każda czcionka i styl
Zidentyfikuj i rozpoznaj tekst we wszystkich popularnych krojach krojów i stylach.
Rozpoznanie się
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie korygując błędnie napisane słowa.
Znajdź tekst w obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazu
Porównaj teksty na dwóch obrazach, niezależnie od obudowy i układu.
Próbki kodu Pythona
Odkryj próbki kodu, aby bezproblemowo zintegrować aspose.ocr dla Pythona przez Java do twoich aplikacji.
Instalacja bez wysiłku
Jako pakiet Python lub plik do pobrania z minimalnymi zależnościami, aspose.ocr for Python za pośrednictwem Java zapewnia łatwą dystrybucję. Zintegruj go z projektem bezpośrednio z Pythona, a jesteś przygotowany do wykorzystania pełnych możliwości OCR, oszczędzanie rozpoznawania w różnych formatach.
po instalacji, niezwłocznie rozpoczynając użycie aspose.ocr dla Pythona za pośrednictwem Java, choć z pewnymi ograniczeniami. Tymczasowa licencja usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby zainicjować opracowanie w pełni funkcjonalnej aplikacji OCR, umożliwiając podjęcie świadomej decyzji o zakupie aspose.ocr dla Pythona przez Java później.
Załaduj licencję
lic = License()
lic.set_license(self.licPath)
Rozpoznawanie obrazu
Podstawowym wyzwaniem w aplikacjach OCR jest niedobór skanerów dla użytkowników końcowych. Nasz interfejs API, płynnie zintegrowany z Pythonem przez Java, ma solidne wbudowane obrazy przed przetwarzaniem, obsługujące obracane, wypaczone i hałaśliwe obrazy. W połączeniu z obsługą wszystkich formatów obrazów umożliwia niezawodne rozpoznawanie, nawet ze zdjęć ze smartfonów. Większość przed przetwarzaniem i korekcją obrazu jest zautomatyzowana, co wymaga interwencji tylko w trudnych przypadkach.
Zastosuj automatyczne korekty obrazu - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Nasz interfejs API wręcz odczytuje każdy obraz ze skanerów, kamer lub smartfonów: dokumenty PDF, JPEG, PNG, TIFF, GIF, BMP. Pełne obsługę wielu stron dokumentów PDF, obrazów TIFF i DJVU zapewnia wszechstronność. Możesz także podać obraz z Internetu za pośrednictwem adresu URL.
Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.
Rozpoznaj PDF i zapisz wyniki w różnych formatach wyjściowych - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optymalizacja wykorzystania zasobów
OCR oferuje specjalny algorytm rozpoznawania do wydobywania zawartości z obrazów z rzadkim tekstem i głośnym/kolorowym tłem. Ta metoda znacznie poprawia dokładność OCR w następujących przypadkach biznesowych:
- Przeczytaj tekst ze zdjęć ulicznych.
- Segment i identyfikuj znaki drogowe i szyldy na zdjęciach ulicznych.
- Znajdź ceny i interpretuj wyodrębniony tekst jako ceny.
- Znajdź i agregowane regiony zainteresowania etykiet żywności, takie jak informacje o żywieniu lub listy składników.
- Zidentyfikuj i przeanalizuj tablice rejestracyjne samochodów.
- Wyodrębnij tekst z menu i katalogów.
OPR OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Wyodrębnienie tekstu ze zdjęć ulicznych
OCR dla Pythona oferuje specjalny algorytm rozpoznawania, który wyodrębnia tekst z płyt rejestracyjnych pojazdów, w tym ciemne i rozmyte zdjęcia. Powstały tekst można następnie automatycznie zapisać w bazie danych lub automatycznie weryfikowany.
Rozpoznaj numer samochodu - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)