Dlaczego aspose.ocr for Python przez Java?

Aspose.ocr for Python za pośrednictwem Java bezproblemowo integruje potężne możliwości rozpoznawania znaków optycznych (OCR) z notebookami i aplikacjami Python Python. Dzięki naszemu intuicyjnej i szybkiej interfejsu API możesz bez wysiłku wyodrębnić tekst ze skanów, zrzutów ekranu, linków internetowych lub zdjęć smartfonów, zapewniając wyniki gotowe do konsolidacji, analizy lub przechowywania. Rozpoznaj zeskanowane obrazy, zdjęcia ze smartfonów, zrzuty ekranu i zeskanowane pliki PDF, zapisując wyniki w popularnych formatach dokumentów. Zaawansowane filtry przed przetwarzaniem obsługują obrócone, wypaczone i hałaśliwe obrazy. Zoptymalizuj wydajność poprzez rozładowanie zadań do GPU.

Illustration ocr

Szybki i dokładny OCR

Osiągnij szybkie i dokładne wyniki OCR dzięki naszemu zaawansowanemu Pythonowi za pośrednictwem technologii Java.

Wsparcie wielojęzyczne

Rozpoznaj tekst w ponad 140 językach, w tym scenariusze łacińskie, cyryliczne, arabskie, perskie, wskaźniki i chińskie, zapewniając wszechstronność aplikacji Python za pośrednictwem Java.

Elastyczna obsługa obrazu

Przetwarzają obrazy ze skanerów, kamer i smartfonów płynnie z Pythonem przez Java.

Precyzja w rozpoznawaniu postaci chińskiej

Rozpoznaj ponad 6000 chińskich postaci z precyzją w swoich projektach Python za pośrednictwem Java.

Zachowaj style czcionek i formatowanie

Utrzymuj style czcionek i formatowanie w celu dokładnego przedstawienia rozpoznanego tekstu w aplikacjach Python za pośrednictwem Java.

Próbka kodu na żywo

Zainicjuj rozpoznawanie tekstu z obrazów w zaledwie trzech wierszach kodu. Doświadcz prostoty!

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przejrzeć *

* Przesyłając swoje pliki lub korzystając z Usługi, z którą zgadzasz się z naszym Warunki użytkowania I Polityka prywatności.

Wynik rozpoznawania
 

Konwertuj obraz na tekst

Więcej przykładów >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Wybierz swoje preferencje

Wybierz odpowiednią bibliotekę dla swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.

Wszechstronność

Python via .NET

Łatwy rozwój, czytelność i utrzymanie kodu
Oferuje najwięcej funkcji i otrzymuje najczęstsze aktualizacje
Ogólna prędkość może być nieco wolniejsza niż inne platformy

Jednolitość

Python via Java

Użyj tej samej biblioteki na dowolnej platformie
Bezproblemowo uruchom aplikację na dowolnym urządzeniu
Wymaga środowiska wykonawczego Java (JRE) wersja 8 lub nowszy

Wydajność

Python via C++

Najszybszy możliwy prędkość, niezależnie od platformy
Duża kontrola nad zarządzaniem zasobami
Skierowane do doświadczonych programistów

Kompatybilność Backend Java

Zaprojektowana jako moduł Python, nasza biblioteka zapewnia kompatybilność w głównych systemach operacyjnych obsługujących Java - w tym Microsoft Windows, Linux i MacOS lub platformach chmurowych. Umożliwia to tworzenie aplikacji na jednej platformie i bezproblemowe uruchamianie ich na drugiej, eliminując potrzebę modyfikacji kodu.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Obsługiwane formaty plików

Aspose.OCR for Python via Java może pracować z dowolnym plikiem Możesz dostać ze skanera lub aparatu. Wyniki rozpoznawania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.

Obrazy

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Partia ocr

  • Multi-page PDF
  • ZIP
  • Folder

Wyniki rozpoznawania

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Bez wysiłku instalacja Pythona przez Java

Aspose.ocr for Python przez Java jest dostarczany jako pakiet Python lub jako plik do pobrania z minimalnymi zależnościami. Łatwo zainstaluj w swoim projekcie i jesteś gotowy do rozpoznania tekstów w wielu obsługiwanych językach i zapisanie wyników rozpoznawania w różnych formatach.

Poproś o licencję próbną , aby rozpocząć opracowanie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.

Potężny OCR do aplikacji Python

Nasza biblioteka łatwo integruje się, umożliwiając bezproblemowe aplikacje Python na dowolnej platformie - komputery Desktop Windows, Windows Server, MacOS, Linux i Cloud.

140 języków rozpoznawania

Nasz API Python i Java OCR rozpoznaje mnóstwo języków i popularne skrypty pisarskie, w tym języki mieszane:

Pozostaw wykrywanie języka do biblioteki lub sam zdefiniuj język, aby uzyskać zwiększoną wydajność i niezawodność rozpoznawania.

  • ** Rozszerzona łacińska ** Alfabet: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i 80+ więcej;
  • ** Cyrillic ** Alphabet: Rosjanin, Ukraińczyk, Kazach, Serbijski, Białoruski, Bułgarski;
  • Arabski, perski, urdu;
  • Skrypt chiński i devanagari, w tym hindi, marathi, bhojpuri i inni.

Ulepszone filtry przetwarzania obrazu

Precyzja optycznego rozpoznawania znaków opiera się w dużej mierze na jakości oryginalnego obrazu. Aspose.ocr for Python przez Java oferuje szeroką gamę zarówno zautomatyzowanych, jak i ręcznych filtrów przetwarzania obrazu w celu optymalizacji obrazu przed przesłaniem do silnika OCR:

  • Automatycznie wyprostuj lekko przechylone obrazy.
  • Ręcznie popraw obrót poważnie wypaczonych obrazów.
  • Automatycznie usuń brud, plamy, zarysowania, olśnienia, niechciane gradienty i inne rodzaje hałasu.
  • Automatycznie dostosuj kontrast obrazu.
  • Automatycznie ekskluzywne lub ręczne rozmiaru obrazu.
  • Konwertuj obrazy na czarno -białą lub szarość.
  • Odwrócone kolory obrazu, dzięki czemu jasne obszary wydają się ciemne, a ciemne obszary wydają się jasne.
  • Zwiększ grubość znaków na obrazie.
  • Rozmycie hałaśliwe obrazy podczas zachowania krawędzi listów.
  • Prostuj skośnie i popraw zniekształcenie obiektywu aparatu na zdjęciach stron.

Określone interfejsy API dla różnych typów dokumentów

Aspose.ocr for Python za pośrednictwem Java oferuje specjalnie przeszkolone sieci neuronowe do wyodrębnienia tekstu z niektórych rodzajów obrazów z maksymalną dokładnością:

  • Zeskanowane lub sfotografowane dowody tożsamości i paszporty.
  • Tablice rejestracyjne pojazdu.
  • Faktury.
  • Wpływy kasowe.

Wbudowany sprawdzanie pisowni

Chociaż aspose.ocr for Python za pośrednictwem Java zapewnia wysoką dokładność rozpoznawania, drukowanie wad, brudu lub niestandardowych czcionek może powodować niepoprawne rozpoznanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć sprawdzanie pisowni, który znajduje i automatycznie koryguje błędy pisowni w oparciu o wybrany język rozpoznawania.

Jeśli uznany tekst zawiera specjalistyczną terminologię, skrót i inne słowa, które nie są obecne we wspólnych słownikach pisowni, możesz podać własne listy słów.

Skuteczne rozpoznawanie partii

Nasz API Python OCR umożliwia usprawnienie rozpoznawania obrazu. Wykorzystaj wszechstronne metody przetwarzania wsadowego do wydajnego przetwarzania wielu obrazów w jednym wywołaniu:

  • Rozpoznaj liczbę plików PDF, TIFF.
  • Przetwarzaj wszystkie pliki w folderze.
  • Obsługuj rozpoznawanie wszystkich plików w archiwum.
  • Rozpoznaj obrazy z określonej listy.

Uczenie się za pośrednictwem przykładów Pythona

Zbadaj różne przykłady Pythona zaprojektowane tak, aby pomóc ci szybko uchwycić funkcje i możliwości naszego rozwiązania OCR. Szybko zyskuj wgląd w tworzenie niestandardowych rozwiązań, które spełniają konkretne wymagania biznesowe.

Funkcje i możliwości

Aspose.OCR for Python via Java Przeglądaj zaawansowane cechy aspose.ocr for Python

Feature icon

Photo OCR

Wyodrębnij tekst ze zdjęć ze smartfonów z dokładnością na poziomie skanowania.

Feature icon

Wyszukiwanie pdf

Konwertuj dowolny skan na w pełni możliwy do wyszukiwania dokument.

Feature icon

Uznanie URL

Rozpoznaj zdjęcie z adresu URL bez pobierania go lokalnie.

Feature icon

Rozpoznawanie masowe

Przeczytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Feature icon

Każda czcionka i styl

Zidentyfikuj i rozpoznaj tekst we wszystkich popularnych krojach krojów i stylach.

Feature icon

Rozpoznanie się

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Feature icon

Sprawdzanie pisowni

Popraw wyniki, automatycznie korygując błędnie napisane słowa.

Feature icon

Znajdź tekst w obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Feature icon

Porównaj teksty obrazu

Porównaj teksty na dwóch obrazach, niezależnie od obudowy i układu.

Próbki kodu Pythona

Odkryj próbki kodu, aby bezproblemowo zintegrować aspose.ocr dla Pythona przez Java do twoich aplikacji.

Instalacja bez wysiłku

Jako pakiet Python lub plik do pobrania z minimalnymi zależnościami, aspose.ocr for Python za pośrednictwem Java zapewnia łatwą dystrybucję. Zintegruj go z projektem bezpośrednio z Pythona, a jesteś przygotowany do wykorzystania pełnych możliwości OCR, oszczędzanie rozpoznawania w różnych formatach.

po instalacji, niezwłocznie rozpoczynając użycie aspose.ocr dla Pythona za pośrednictwem Java, choć z pewnymi ograniczeniami. Tymczasowa licencja usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby zainicjować opracowanie w pełni funkcjonalnej aplikacji OCR, umożliwiając podjęcie świadomej decyzji o zakupie aspose.ocr dla Pythona przez Java później.

Załaduj licencję

lic = License()
lic.set_license(self.licPath)

Rozpoznawanie obrazu

Podstawowym wyzwaniem w aplikacjach OCR jest niedobór skanerów dla użytkowników końcowych. Nasz interfejs API, płynnie zintegrowany z Pythonem przez Java, ma solidne wbudowane obrazy przed przetwarzaniem, obsługujące obracane, wypaczone i hałaśliwe obrazy. W połączeniu z obsługą wszystkich formatów obrazów umożliwia niezawodne rozpoznawanie, nawet ze zdjęć ze smartfonów. Większość przed przetwarzaniem i korekcją obrazu jest zautomatyzowana, co wymaga interwencji tylko w trudnych przypadkach.

Zastosuj automatyczne korekty obrazu - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Nasz interfejs API wręcz odczytuje każdy obraz ze skanerów, kamer lub smartfonów: dokumenty PDF, JPEG, PNG, TIFF, GIF, BMP. Pełne obsługę wielu stron dokumentów PDF, obrazów TIFF i DJVU zapewnia wszechstronność. Możesz także podać obraz z Internetu za pośrednictwem adresu URL.

Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.

Rozpoznaj PDF i zapisz wyniki w różnych formatach wyjściowych - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optymalizacja wykorzystania zasobów

OCR oferuje specjalny algorytm rozpoznawania do wydobywania zawartości z obrazów z rzadkim tekstem i głośnym/kolorowym tłem. Ta metoda znacznie poprawia dokładność OCR w następujących przypadkach biznesowych:

  • Przeczytaj tekst ze zdjęć ulicznych.
  • Segment i identyfikuj znaki drogowe i szyldy na zdjęciach ulicznych.
  • Znajdź ceny i interpretuj wyodrębniony tekst jako ceny.
  • Znajdź i agregowane regiony zainteresowania etykiet żywności, takie jak informacje o żywieniu lub listy składników.
  • Zidentyfikuj i przeanalizuj tablice rejestracyjne samochodów.
  • Wyodrębnij tekst z menu i katalogów.

OPR OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Wyodrębnienie tekstu ze zdjęć ulicznych

OCR dla Pythona oferuje specjalny algorytm rozpoznawania, który wyodrębnia tekst z płyt rejestracyjnych pojazdów, w tym ciemne i rozmyte zdjęcia. Powstały tekst można następnie automatycznie zapisać w bazie danych lub automatycznie weryfikowany.

Rozpoznaj numer samochodu - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)