Opanowanie konwersji obrazu na tekst w języku Python za pośrednictwem języka Java
Rozpoznawaj tekst na obrazach za pomocą języka Python
Więcej wystaw ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Dlaczego Aspose.OCR dla Pythona poprzez Javę?
Aspose.OCR dla Pythona poprzez Javę płynnie integruje potężne możliwości optycznego rozpoznawania znaków (OCR) z wieloplatformowymi notatnikami i aplikacjami Pythona. Dzięki naszemu intuicyjnemu i szybkiemu interfejsowi API możesz bez wysiłku wyodrębnić tekst ze skanów, zrzutów ekranu, łączy internetowych lub zdjęć ze smartfona, dostarczając wyniki gotowe do konsolidacji, analizy lub przechowywania. Rozpoznawaj zeskanowane obrazy, zdjęcia ze smartfonów, zrzuty ekranu i zeskanowane pliki PDF, zapisując wyniki w popularnych formatach dokumentów. Zaawansowane filtry wstępnego przetwarzania obsługują obrazy obrócone, przekrzywione i zaszumione. Zoptymalizuj wydajność, przenosząc zadania na procesor graficzny.
Szybki i dokładny OCR
Uzyskuj szybkie i dokładne wyniki OCR dzięki naszemu zaawansowanemu językowi Python i technologii Java.
Wsparcie wielojęzyczne
Rozpoznawaj tekst w ponad 130 językach, w tym w alfabecie łacińskim, cyrylicy, arabskim, perskim, indyjskim i chińskim, zapewniając wszechstronność aplikacji Python za pośrednictwem języka Java.
Elastyczna obsługa obrazu
Bezproblemowo przetwarzaj obrazy ze skanerów, aparatów i smartfonów za pomocą języka Python i języka Java.
Precyzja w rozpoznawaniu znaków chińskich
Rozpoznawaj z precyzją ponad 6000 chińskich znaków w swoich projektach w języku Python za pośrednictwem języka Java.
Zachowaj style i formatowanie czcionek
Zachowaj style i formatowanie czcionek, aby zapewnić dokładną reprezentację rozpoznanego tekstu w aplikacjach Pythona za pośrednictwem języka Java.
Próbka kodu na żywo
Rozpocznij rozpoznawanie tekstu z obrazów w zaledwie trzech liniach kodu. Poczuj prostotę!
* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki korzystania I Polityka prywatności.
Konwertuj obraz na tekst
Więcej przykładów ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wybierz swoje preferencje
Wybierz bibliotekę odpowiednią do swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.
Wszechstronność
Python via .NET
Jednolitość
Python via Java
Wydajność
Python via C++
Zgodność backendu Java
Zaprojektowana jako moduł Pythona, nasza biblioteka zapewnia kompatybilność z głównymi systemami operacyjnymi obsługującymi Java - w tym Microsoft Windows, Linux i macOS lub platformy chmurowe. Umożliwia to tworzenie aplikacji na jednej platformie i bezproblemowe uruchamianie ich na innej, eliminując potrzebę jakichkolwiek modyfikacji kodu.
Obsługiwane formaty plików
Aspose.OCR for Python via Java może pracować z praktycznie każdym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania zwracane są w najpopularniejszych formatach plików i wymiany danych, które można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Partia OCR
- Multi-page PDF
- ZIP
- Folder
Wyniki uznania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Bezproblemowa instalacja Pythona poprzez Javę
Aspose.OCR dla Pythona przez Javę jest dostarczany jako pakiet Pythona lub jako plik do pobrania z minimalnymi zależnościami. Z łatwością zainstaluj go w swoim projekcie i możesz rozpoznawać teksty w wielu obsługiwanych językach i zapisywać wyniki rozpoznawania w różnych formatach.
Poproś o licencję próbną , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.
Potężny OCR dla aplikacji Python
Naszą bibliotekę można łatwo integrować, umożliwiając bezproblemowe działanie aplikacji Python na dowolnej platformie — komputerowym systemie Windows, Windows Server, macOS, Linux i chmurze.
Ponad 130 języków rozpoznawania
Nasz interfejs API OCR w językach Python i Java rozpoznaje mnóstwo języków i popularnych skryptów pisarskich, w tym języki mieszane:
Pozostaw wykrywanie języka bibliotece lub zdefiniuj język samodzielnie, aby zwiększyć wydajność i niezawodność rozpoznawania.
- Rozszerzony alfabet łaciński: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
- Cyrylica alfabet: rosyjski, ukraiński, kazachski, serbski, białoruski, bułgarski;
- arabski, perski, urdu;
- Pismo chińskie i dewanagari, w tym hindi, marathi, bhojpuri i inne.
Ulepszone filtry przetwarzania obrazu
Precyzja optycznego rozpoznawania znaków zależy w dużej mierze od jakości oryginalnego obrazu. Aspose.OCR dla Pythona za pośrednictwem Java oferuje szeroką gamę filtrów automatycznego i ręcznego przetwarzania obrazu, które optymalizują obraz przed przesłaniem do silnika OCR:
- Automatycznie prostuj lekko pochylone obrazy.
- Ręcznie popraw obrót mocno przekrzywionych obrazów.
- Automatycznie usuwaj brud, plamy, zadrapania, odblaski, niepożądane nachylenia i inne rodzaje szumów.
- Automatycznie dostosuj kontrast obrazu.
- Automatycznie skaluj obraz lub ręcznie zmieniaj jego rozmiar.
- Konwertuj obrazy na czarno-białe lub w skali szarości.
- Odwróć kolory obrazu, sprawiając, że jasne obszary będą wyglądać na ciemne, a ciemne na jasne.
- Zwiększ grubość znaków na obrazie.
- Rozmyj zaszumione obrazy, zachowując krawędzie liter.
- Wyprostuj przekrzywienie strony i popraw zniekształcenie obiektywu aparatu na zdjęciach stron.
Specjalistyczne interfejsy API dla różnych typów dokumentów
Aspose.OCR dla Pythona za pośrednictwem Java oferuje specjalnie przeszkolone sieci neuronowe do wyodrębniania tekstu z określonych typów obrazów z maksymalną dokładnością:
- Zeskanowane lub sfotografowane dowody osobiste i paszporty.
- Tablice rejestracyjne pojazdów.
- Faktury.
- Wpływy kasowe.
Wbudowany moduł sprawdzania pisowni
Chociaż Aspose.OCR dla Pythona za pośrednictwem Java zapewnia wysoką dokładność rozpoznawania, defekty druku, brud lub niestandardowe czcionki mogą powodować nieprawidłowe rozpoznawanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć moduł sprawdzania pisowni, który wyszukuje i automatycznie poprawia błędy ortograficzne w oparciu o wybrany język rozpoznawania.
Jeśli rozpoznany tekst zawiera specjalistyczną terminologię, skróty i inne słowa, których nie ma w powszechnych słownikach ortograficznych, możesz udostępnić własne listy słów.
Efektywne rozpoznawanie partii
Nasz interfejs API OCR w języku Python umożliwia usprawnienie rozpoznawania obrazów. Wykorzystaj wszechstronne metody przetwarzania wsadowego w celu wydajnego przetwarzania wielu obrazów w jednym wywołaniu:
- Rozpoznaje wielostronicowe pliki PDF, TIFF.
- Przetwarzaj wszystkie pliki w folderze.
- Obsługuj rozpoznawanie wszystkich plików w archiwum.
- Rozpoznawanie obrazów z określonej listy.
Nauka na przykładach Pythona
Poznaj różne przykłady języka Python zaprojektowane, aby pomóc Ci szybko zrozumieć funkcje i możliwości naszego rozwiązania OCR. Szybko uzyskaj wgląd w tworzenie niestandardowych rozwiązań, które spełniają Twoje specyficzne wymagania biznesowe.
Funkcje i możliwości
Aspose.OCR for Python via Java Poznaj zaawansowane funkcje Aspose.OCR dla Pythona
Zdjęcie OCR
Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.
Przeszukiwalny plik PDF
Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.
Rozpoznawanie adresu URL
Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.
Rozpoznawanie zbiorcze
Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Dowolna czcionka i styl
Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.
Dostosuj rozpoznawanie
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.
Znajdź tekst na obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazów
Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.
Przykłady kodu Pythona
Odkryj próbki kodu, aby bezproblemowo zintegrować Aspose.OCR dla Pythona za pośrednictwem Java ze swoimi aplikacjami.
Łatwa instalacja
Jako pakiet Pythona lub plik do pobrania z minimalnymi zależnościami, Aspose.OCR dla Pythona za pośrednictwem Java zapewnia łatwą dystrybucję. Zintegruj go ze swoim projektem bezpośrednio z Pythona, a będziesz przygotowany na wykorzystanie pełnych możliwości OCR, zapisując wyniki rozpoznawania w różnych formatach.
Po instalacji natychmiast rozpocznij używanie Aspose.OCR dla Pythona za pośrednictwem Java, choć z pewnymi ograniczeniami. Licencja tymczasowa usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby rozpocząć rozwój w pełni funkcjonalnej aplikacji OCR, co pozwoli Ci później podjąć świadomą decyzję o zakupie Aspose.OCR dla Pythona za pośrednictwem Java.
Załaduj licencję
lic = License()
lic.set_license(self.licPath)
Rozpoznawanie obrazu
Podstawowym wyzwaniem w zastosowaniach OCR jest niedobór skanerów dla użytkowników końcowych. Nasze API, płynnie zintegrowane z Pythonem poprzez Javę, zawiera solidne, wbudowane filtry do wstępnego przetwarzania obrazu, obsługujące obrazy obrócone, przekrzywione i zaszumione. W połączeniu z obsługą wszystkich formatów obrazu umożliwia niezawodne rozpoznawanie, nawet ze zdjęć wykonanych smartfonem. Większość przetwarzania wstępnego i korekcji obrazu jest zautomatyzowana i wymaga interwencji użytkownika tylko w trudnych przypadkach.
Zastosuj automatyczną korektę obrazu - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Uniwersalny konwerter Pythona
Nasze API sprawnie odczytuje dowolny obraz ze skanerów, aparatów czy smartfonów: dokumenty PDF, pliki JPEG, PNG, TIFF, GIF, BMP. Pełna obsługa wielostronicowych dokumentów PDF, obrazów TIFF i DjVu zapewnia wszechstronność. Możesz także udostępnić obraz z Internetu za pośrednictwem adresu URL.
Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.
Rozpoznawaj pliki PDF i zapisuj wyniki w różnych formatach wyjściowych — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optymalizacja wykorzystania zasobów
OCR oferuje specjalny algorytm rozpoznawania do wyodrębniania treści z obrazów z rzadkim tekstem i zaszumionym/kolorowym tłem. Ta metoda znacznie poprawia dokładność OCR w następujących przypadkach biznesowych:
- Przeczytaj tekst ze zdjęć ulicznych.
- Segmentuj i identyfikuj znaki drogowe i szyldy na obrazach ulic.
- Znajdź metki z cenami i zinterpretuj wyodrębniony tekst jako ceny.
- Znajdź i agreguj interesujące Cię obszary na etykietach żywności, np. informacje o wartościach odżywczych lub listy składników.
- Identyfikuj i analizuj tablice rejestracyjne samochodów.
- Wyodrębnij tekst z menu i katalogów.
Otwarty obszar OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Wyodrębnianie tekstu ze zdjęć ulicznych
OCR dla Pythona oferuje specjalny algorytm rozpoznawania, który wyodrębnia tekst z tablic rejestracyjnych pojazdów, w tym ciemne i rozmazane zdjęcia. Powstały tekst można następnie automatycznie zapisać w bazie danych lub automatycznie zweryfikować.
Rozpoznaj numer samochodu - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)