Biblioteka OCR w Pythonie
Konwertuj obrazy na tekst za pomocą Python OCR
Więcej wystaw ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Dlaczego Aspose.OCR dla Pythona przez .NET?
Wyrusz w podróż z Aspose OCR dla Pythona za pośrednictwem .NET – wszechstronnego i przyjaznego dla użytkownika API OCR. Osadź funkcję OCR w aplikacjach w języku Python za pomocą mniej niż 5 wierszy kodu, eliminując potrzebę stosowania skomplikowanych sieci matematycznych lub neuronowych. Nasz potężny silnik OCR zapewnia niezrównaną szybkość i dokładność, obsługując ponad 130 języków, w tym angielski, cyrylicę, arabski, perski, hindi, chiński, japoński, koreański, tamilski i wiele innych. Niezależnie od tego, czy są to zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu czy zeskanowane pliki PDF, wyniki można uzyskać w popularnych formatach wymiany dokumentów i danych. Wykorzystaj filtry wstępnego przetwarzania, aby poradzić sobie z obróconymi, przekrzywionymi i zaszumionymi obrazami.
Wydajny i precyzyjny OCR
Doświadcz niezrównanej szybkości i precyzji wyników OCR dzięki zaawansowanej technologii Python.
Wielojęzyczny
Rozpoznawaj tekst w ponad 140 językach: angielskim, francuskim, niemieckim, hiszpańskim, rosyjskim, chińskim, hindi, japońskim, koreańskim, tamilskim, arabskim, perskim i nie tylko.
Uniwersalny
Bez wysiłku przetwarzaj obrazy z różnych źródeł – skanerów, aparatów i smartfonów – za pomocą języka Python.
Języki azjatyckie
Osiągnij precyzyjne rozpoznawanie pisma chińskiego, arabskiego, dewanagari i dravidyjskiego, a także tekstów w językach mieszanych.
Zachowaj układ
Zachowaj formatowanie źródłowe w celu zapewnienia dokładnej reprezentacji tekstu i rozpoznaj tabele.
Próbka kodu na żywo
Konwertuj obraz na tekst w zaledwie TRZECH linijkach kodu Pythona. Spróbuj sam!
* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki użytkowania I Polityka prywatności.
Konwertuj obraz na tekst
Odkryj więcej przykładów ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wybierz swoje preferencje
Wybierz bibliotekę odpowiednią do swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.
Wszechstronność
Python via .NET
Jednolitość
Python via Java
Wydajność
Python via C++
Biega wszędzie
Niezależnie od nazwy, Aspose.OCR dla Pythona poprzez .NET nie wymaga instalacji .NET na platformie docelowej. Pakiet instalacyjny zawiera już wszystkie wymagane komponenty i może bezproblemowo działać na dowolnej platformie – czy to na komputerze lokalnym, serwerze internetowym czy w chmurze.
Obsługiwane formaty plików
Aspose.OCR for Python via .NET może pracować z dowolnym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- BMP
- GIF
Partia OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Wyniki uznania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalacja
Aspose.OCR dla Pythona przez .NET jest dostarczany jako pakiet Pythona z minimalnymi zależnościami lub jako plik do pobrania lub [pakiet PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Z łatwością zainstaluj go w swoim projekcie, a będziesz gotowy do rozpoznawania tekstów w ponad 140 językach i zapisywania wyników rozpoznawania w różnych formatach.
Poproś o licencję próbną , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.
OCR w Pythonie
Naszą bibliotekę można łatwo integrować, umożliwiając bezproblemowe działanie aplikacji Python na dowolnej platformie – komputerowym systemie Windows, Windows Server, macOS, Linux i chmurze.
Ponad 140 języków rozpoznawania
Nasza biblioteka Java OCR to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści na skalę globalną. Dzięki obsłudze szerokiej gamy skryptów pisarskich z Europy, Bliskiego Wschodu i Azji jest dobrze dostosowany do każdego kraju i firmy.
Aspose OCR for Java rozpoznaje tekst w dokumentach wielojęzycznych, takich jak chiński/angielski, arabski/francuski lub cyrylica/angielski. Obsługiwane są następujące języki:
- Rozszerzona łacina: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
- Cyrylica alfabet: rosyjski, ukraiński, kazachski, bułgarski, w tym teksty mieszane cyrylicy i języka angielskiego;
- arabski, perski, urdu, w tym teksty zmieszane z angielskim;
- Języki chiński, koreański, japoński, dewanagari i dravidyjski, w tym hindi, tamilski, marathi i inne. Obsługiwane są także teksty w różnych językach.
Wydajne filtry przetwarzające
Dokładność i niezawodność optycznego rozpoznawania znaków w dużym stopniu zależy od jakości oryginalnego obrazu. Aspose OCR dla Pythona za pośrednictwem .NET oferuje dużą liczbę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które ulepszają obraz przed wysłaniem go do silnika OCR:
- Automatycznie obracaj obrazy do góry nogami i obrócone.
- Wykrywaj odwrócone obrazy i wyodrębniaj tekst biały na czarnym.
- Automatycznie usuwaj brud, plamy, zadrapania, odblaski, niepożądane gradienty i inne szumy.
- Automatycznie dostosuj kontrast obrazu.
- Automatycznie zwiększ rozmiar obrazu lub ręcznie zmień jego rozmiar.
- Konwertuj obrazy na czarno-białe lub w skali szarości.
- Znajdź potencjalnie problematyczne obszary obrazu i zwróć informację o rodzaju wady i jej współrzędnych.
- Zwiększ grubość znaków na obrazie.
- Rozmyj zaszumione obrazy, zachowując krawędzie liter.
- Wyprostuj krzywiznę strony i napraw zniekształcenie obiektywu aparatu w przypadku zdjęć stron.
Zoptymalizowany dla określonych typów dokumentów
Aspose OCR dla Pythona za pośrednictwem .NET oferuje specjalnie przeszkolone sieci neuronowe do wyodrębniania tekstu z określonych typów obrazów z maksymalną dokładnością:
Wbudowany moduł sprawdzania pisowni
Chociaż nasza biblioteka OCR w języku Python zapewnia wysoką dokładność rozpoznawania, defekty druku, zabrudzenia lub niestandardowe czcionki mogą powodować nieprawidłowe rozpoznawanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć moduł sprawdzania pisowni, który wyszukuje i automatycznie poprawia błędy ortograficzne w oparciu o wybrany język rozpoznawania.
Jeśli rozpoznany tekst zawiera specjalistyczną terminologię, skróty i inne słowa, których nie ma w powszechnych słownikach ortograficznych, możesz udostępnić własne listy słów.
Rozpoznawanie partii
Nasz interfejs API OCR w języku Python uwalnia Cię od rozpoznawania obrazów jeden po drugim. Stosuj różne metody przetwarzania wsadowego, aby rozpoznawać wiele obrazów w jednym wywołaniu:
- Rozpoznawanie wielostronicowych plików PDF, TIFF i DjVu.
- Rozpoznawanie wszystkich plików w folderze.
- Rozpoznawanie wszystkich plików w archiwum.
- Rozpoznawanie wszystkich plików z listy.
Nauka przez próbkę
OCR dla Pythona udostępnia szereg przykładów napisanych w Pythonie, co pozwala szybko zapoznać się z jego funkcjami i możliwościami. Zdobądź wiedzę na temat tworzenia dostosowanych rozwiązań spełniających potrzeby biznesowe w języku Python.
Funkcje i możliwości
Aspose.OCR for Python via .NET rozwiązuje Twoje zadania szybko i łatwo.
Zdjęcie OCR
Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.
Przeszukiwalny plik PDF
Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania, indeksowania i edycji.
Rozpoznawanie adresu URL
Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.
Rozpoznawanie zbiorcze
Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Dowolna czcionka i styl
Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.
Dostosuj rozpoznawanie
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.
Znajdź tekst na obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazkowe
Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.
Przykłady kodu Pythona
Zagłęb się w próbki kodu, aby bezproblemowo zintegrować OCR z aplikacjami w języku Python.
Instalacja
Dystrybuowany jako koło Pythona lub samodzielny pakiet do pobrania, Aspose.OCR dla Pythona za pośrednictwem .NET jest łatwo dystrybuowany. Integracja z projektem w języku Python bezpośrednio z preferowanego zintegrowanego środowiska programistycznego (IDE) w języku Python przebiega bezproblemowo. Po prostu go zainstaluj i będziesz gotowy do wykorzystania pełnego zakresu możliwości OCR, zapisując wyniki rozpoznawania w różnych formatach.
Po instalacji możesz natychmiast rozpocząć korzystanie z Aspose.OCR dla Pythona poprzez .NET , choć z pewnymi ograniczeniami. Licencja tymczasowa znosi wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby rozpocząć rozwój w pełni funkcjonalnej aplikacji OCR, co pozwoli Ci na późniejszym etapie podjąć świadomą decyzję o zakupie Aspose.OCR dla Pythona za pośrednictwem .NET.
Załaduj licencję
lic = License()
lic.set_license(self.licPath)
Rozpoznawanie tekstu na zdjęciach
Czytanie tekstu z dowolnej treści w Aspose OCR dla Pythona jest tak proste, jak wywołanie uniwersalnej metody rozpoznawania.
Zamień zdjęcie na tekst - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Uniwersalny konwerter Pythona
Nasze API sprawnie odczytuje dowolny obraz ze skanerów, aparatów fotograficznych lub smartfonów: dokumenty PDF, obrazy JPEG, PNG, TIFF, GIF, BMP, a nawet pliki DjVu. Pełna obsługa wielostronicowych dokumentów PDF, obrazów TIFF i DjVu zapewnia wszechstronność. Możesz także udostępnić obraz z Internetu za pośrednictwem adresu URL.
Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.
Rozpoznawaj pliki PDF i zapisuj wyniki w różnych formatach wyjściowych — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optymalizacja zasobów w Pythonie
Optyczne rozpoznawanie znaków wymaga zasobów. Nasze API oferuje elastyczne sposoby równoważenia klasycznej triady czas-cena-jakość:
- Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
- Określ liczbę wątków przydzielonych do rozpoznawania lub pozwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
- Zwolnij procesor, przenosząc obliczenia do backendu .NET.
Szybkie rozpoznawanie – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Rozpoznaj pojedynczą linię
Jeśli obraz jest już przycięty do jednej linijki tekstu, można go rozpoznać w najszybszym możliwym trybie, bez automatycznych korekt, wykrywania struktury treści i innych czynności pochłaniających zasoby. Może przyspieszyć OCR nawet 7 razy szybciej niż normalny proces rozpoznawania.
Rozpoznaj pojedynczą linię tekstu na obrazie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)