OCR for Java

OCR for C++

OCR for Python via .NET

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via Java

Konwertuj obraz na tekst za pomocą Python OCR API za pośrednictwem Java

Odblokuj moc OCR w Pythonie, korzystając z naszego bogatego w funkcje Aspose.OCR dla Pythona za pośrednictwem biblioteki Java. Bez wysiłku konwertuj obrazy i pliki PDF na edytowalny tekst.

Pobierać Test Zakup

Zobacz, co nowego

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-java or
download

Dlaczego Aspose.OCR dla Pythona przez Javę?

Aspose.OCR dla Pythona poprzez Javę płynnie integruje potężne możliwości optycznego rozpoznawania znaków (OCR) z wieloplatformowymi notatnikami i aplikacjami Pythona. Dzięki naszemu intuicyjnemu i szybkiemu interfejsowi API możesz bez wysiłku wyodrębnić tekst ze skanów, zrzutów ekranu, łączy internetowych lub zdjęć ze smartfona, dostarczając wyniki gotowe do konsolidacji, analizy lub przechowywania. Rozpoznawaj zeskanowane obrazy, zdjęcia ze smartfonów, zrzuty ekranu i zeskanowane pliki PDF, zapisując wyniki w popularnych formatach dokumentów. Zaawansowane filtry wstępnego przetwarzania obsługują obrazy obrócone, przekrzywione i zaszumione. Zoptymalizuj wydajność, przenosząc zadania na procesor graficzny.

Szybki i dokładny OCR

Uzyskuj szybkie i dokładne wyniki OCR dzięki naszemu zaawansowanemu językowi Python i technologii Java.

Wsparcie wielojęzyczne

Rozpoznawaj tekst w ponad 130 językach, w tym w alfabecie łacińskim, cyrylicy, arabskim, perskim, indyjskim i chińskim, zapewniając wszechstronność aplikacji Python za pośrednictwem języka Java.

Elastyczne wsparcie obrazu

Bezproblemowo przetwarzaj obrazy ze skanerów, aparatów i smartfonów za pomocą języka Python i języka Java.

Precyzja w rozpoznawaniu znaków chińskich

Rozpoznawaj z precyzją ponad 6000 chińskich znaków w swoich projektach w języku Python za pośrednictwem języka Java.

Zachowaj style i formatowanie czcionek

Zachowaj style i formatowanie czcionek, aby zapewnić dokładną reprezentację rozpoznanego tekstu w aplikacjach Pythona za pośrednictwem języka Java.

Próbka kodu na żywo

Rozpocznij rozpoznawanie tekstu z obrazów w zaledwie trzech liniach kodu. Poczuj prostotę!

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przeglądać *

* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki użytkowania I Polityka prywatności.

Wynik uznania

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Wybierz swoje preferencje

Wybierz bibliotekę odpowiednią do swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.

Python via .NET

Łatwy rozwój, czytelność i łatwość konserwacji kodu

Oferuje najwięcej funkcji i otrzymuje najczęstsze aktualizacje

Ogólna prędkość może być nieco mniejsza niż w przypadku innych platform

Python via Java

Korzystaj z tej samej biblioteki na dowolnej platformie

Bezproblemowo uruchamiaj aplikację na dowolnym urządzeniu

Wymaga środowiska Java Runtime Environment (JRE) w wersji 8 lub nowszej

Python via C++

Najszybsza możliwa prędkość niezależnie od platformy

Duża kontrola nad zarządzaniem zasobami

Skierowany do doświadczonych programistów

Zgodność backendu Java

Zaprojektowana jako moduł Pythona, nasza biblioteka zapewnia kompatybilność z głównymi systemami operacyjnymi obsługującymi Java - w tym Microsoft Windows, Linux i macOS lub platformy chmurowe. Umożliwia to tworzenie aplikacji na jednej platformie i bezproblemowe uruchamianie ich na innej, eliminując potrzebę jakichkolwiek modyfikacji kodu.

Obsługiwane formaty plików

Aspose.OCR for Python via Java może pracować z dowolnym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.

Obrazy

PDF
JPEG
PNG
TIFF
GIF
Bitmap

Partia OCR

Multi-page PDF
ZIP
Folder

Wyniki uznania

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Bezproblemowa instalacja Pythona poprzez Javę

Aspose.OCR dla Pythona przez Javę jest dostarczany jako pakiet Pythona lub jako plik do pobrania z minimalnymi zależnościami. Z łatwością zainstaluj go w swoim projekcie i możesz rozpoznawać teksty w wielu obsługiwanych językach i zapisywać wyniki rozpoznawania w różnych formatach.

Poproś o licencję próbną , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.

Potężny OCR dla aplikacji Python

Naszą bibliotekę można łatwo integrować, umożliwiając bezproblemowe działanie aplikacji Python na dowolnej platformie – komputerowym systemie Windows, Windows Server, macOS, Linux i chmurze.

Ponad 130 języków rozpoznawania

Nasz interfejs API OCR w językach Python i Java rozpoznaje mnóstwo języków i popularnych skryptów pisarskich, w tym języki mieszane:

Pozostaw wykrywanie języka bibliotece lub zdefiniuj język samodzielnie, aby zwiększyć wydajność i niezawodność rozpoznawania.

Rozszerzony alfabet łaciński: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
Cyrylica alfabet: rosyjski, ukraiński, kazachski, serbski, białoruski, bułgarski;
arabski, perski, urdu;
Pismo chińskie i dewanagari, w tym hindi, marathi, bhojpuri i inne.

Ulepszone filtry przetwarzania obrazu

Precyzja optycznego rozpoznawania znaków zależy w dużej mierze od jakości oryginalnego obrazu. Aspose.OCR dla Pythona za pośrednictwem Java oferuje szeroką gamę filtrów automatycznego i ręcznego przetwarzania obrazu, które optymalizują obraz przed przesłaniem do silnika OCR:

Automatycznie prostuj lekko pochylone obrazy.
Ręcznie popraw obrót mocno przekrzywionych obrazów.
Automatycznie usuwaj brud, plamy, zadrapania, odblaski, niepożądane gradienty i inne rodzaje szumów.
Automatycznie dostosuj kontrast obrazu.
Automatycznie skaluj obraz lub ręcznie zmieniaj jego rozmiar.
Konwertuj obrazy na czarno-białe lub w skali szarości.
Odwróć kolory obrazu, sprawiając, że jasne obszary będą wyglądać na ciemne, a ciemne na jasne.
Zwiększ grubość znaków na obrazie.
Rozmyj zaszumione obrazy, zachowując krawędzie liter.
Wyprostuj przekrzywienie strony i popraw zniekształcenie obiektywu aparatu na zdjęciach stron.

Specjalistyczne interfejsy API dla różnych typów dokumentów

Aspose.OCR dla Pythona za pośrednictwem Java oferuje specjalnie przeszkolone sieci neuronowe do wyodrębniania tekstu z określonych typów obrazów z maksymalną dokładnością:

Zeskanowane lub sfotografowane dowody osobiste i paszporty.
Tablice rejestracyjne pojazdów.
Faktury.
Wpływy kasowe.

Wbudowany moduł sprawdzania pisowni

Chociaż Aspose.OCR dla Pythona za pośrednictwem Java zapewnia wysoką dokładność rozpoznawania, defekty druku, brud lub niestandardowe czcionki mogą powodować nieprawidłowe rozpoznawanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć moduł sprawdzania pisowni, który wyszukuje i automatycznie poprawia błędy ortograficzne w oparciu o wybrany język rozpoznawania.

Jeśli rozpoznany tekst zawiera specjalistyczną terminologię, skróty i inne słowa, których nie ma w powszechnych słownikach ortograficznych, możesz udostępnić własne listy słów.

Efektywne rozpoznawanie partii

Nasz interfejs API OCR w języku Python umożliwia usprawnienie rozpoznawania obrazów. Wykorzystaj wszechstronne metody przetwarzania wsadowego w celu wydajnego przetwarzania wielu obrazów w jednym wywołaniu:

Rozpoznaje wielostronicowe pliki PDF, TIFF.
Przetwarzaj wszystkie pliki w folderze.
Obsługuj rozpoznawanie wszystkich plików w archiwum.
Rozpoznawanie obrazów z określonej listy.

Nauka na przykładach Pythona

Poznaj różne przykłady języka Python zaprojektowane, aby pomóc Ci szybko zrozumieć funkcje i możliwości naszego rozwiązania OCR. Szybko uzyskaj wgląd w tworzenie niestandardowych rozwiązań, które spełniają Twoje specyficzne wymagania biznesowe.

Funkcje i możliwości

Aspose.OCR for Python via Java Poznaj zaawansowane funkcje Aspose.OCR dla Pythona

Zdjęcie OCR

Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.

Przeszukiwalny plik PDF

Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.

Rozpoznawanie adresu URL

Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.

Rozpoznawanie zbiorcze

Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Dowolna czcionka i styl

Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.

Dostosuj rozpoznawanie

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Sprawdzanie pisowni

Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.

Znajdź tekst na obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Porównaj teksty obrazkowe

Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.

Przykłady kodu Pythona

Odkryj próbki kodu, aby bezproblemowo zintegrować Aspose.OCR dla Pythona za pośrednictwem Java ze swoimi aplikacjami.

Łatwa instalacja

Jako pakiet Pythona lub plik do pobrania z minimalnymi zależnościami, Aspose.OCR dla Pythona za pośrednictwem Java zapewnia łatwą dystrybucję. Zintegruj go ze swoim projektem bezpośrednio z Pythona, a będziesz przygotowany na wykorzystanie pełnych możliwości OCR, zapisując wyniki rozpoznawania w różnych formatach.

Po instalacji natychmiast rozpocznij używanie Aspose.OCR dla Pythona za pośrednictwem Java, choć z pewnymi ograniczeniami. Licencja tymczasowa usuwa wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby rozpocząć rozwój w pełni funkcjonalnej aplikacji OCR, co pozwoli Ci później podjąć świadomą decyzję o zakupie Aspose.OCR dla Pythona za pośrednictwem Java.

Załaduj licencję

lic = License()
lic.set_license(self.licPath)

Rozpoznawanie obrazu

Podstawowym wyzwaniem w zastosowaniach OCR jest niedobór skanerów dla użytkowników końcowych. Nasze API, płynnie zintegrowane z Pythonem poprzez Javę, zawiera solidne, wbudowane filtry do wstępnego przetwarzania obrazu, obsługujące obrazy obrócone, przekrzywione i zaszumione. W połączeniu z obsługą wszystkich formatów obrazu umożliwia niezawodne rozpoznawanie, nawet ze zdjęć wykonanych smartfonem. Większość przetwarzania wstępnego i korekcji obrazu jest zautomatyzowana i wymaga interwencji użytkownika tylko w trudnych przypadkach.

Zastosuj automatyczną korektę obrazu - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Uniwersalny konwerter Pythona

Nasze API sprawnie odczytuje dowolny obraz ze skanerów, aparatów czy smartfonów: dokumenty PDF, pliki JPEG, PNG, TIFF, GIF, BMP. Pełna obsługa wielostronicowych dokumentów PDF, obrazów TIFF i DjVu zapewnia wszechstronność. Możesz także udostępnić obraz z Internetu za pośrednictwem adresu URL.

Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.

Rozpoznawaj pliki PDF i zapisuj wyniki w różnych formatach wyjściowych — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optymalizacja wykorzystania zasobów

OCR oferuje specjalny algorytm rozpoznawania do wyodrębniania treści z obrazów z rzadkim tekstem i zaszumionym/kolorowym tłem. Ta metoda znacznie poprawia dokładność OCR w następujących przypadkach biznesowych:

Przeczytaj tekst ze zdjęć ulicznych.
Segmentuj i identyfikuj znaki drogowe i szyldy na obrazach ulic.
Znajdź metki z cenami i zinterpretuj wyodrębniony tekst jako ceny.
Znajdź i agreguj interesujące Cię obszary na etykietach żywności, np. informacje o wartościach odżywczych lub listy składników.
Identyfikuj i analizuj tablice rejestracyjne samochodów.
Wyodrębnij tekst z menu i katalogów.

Otwarty obszar OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Wyodrębnianie tekstu ze zdjęć ulicznych

OCR dla Pythona oferuje specjalny algorytm rozpoznawania, który wyodrębnia tekst z tablic rejestracyjnych pojazdów, w tym ciemne i rozmazane zdjęcia. Powstały tekst można następnie automatycznie zapisać w bazie danych lub automatycznie zweryfikować.

Rozpoznaj numer samochodu - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)