Biblioteka Python OCR
Konwertuj obrazy na tekst z Python OCR
Więcej prezentacji ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Dlaczego aspose.ocr for Python przez .net?
Wyrusz w podróż z Aspose OCR dla Pythona przez .NET-wszechstronny i przyjazny dla użytkownika API OCR. Umieść funkcjonalność OCR w aplikacjach Python z mniej niż 5 wierszami kodu, eliminując potrzebę złożonych sieci matematycznych lub neuronowych. Nasz potężny silnik OCR zapewnia niezrównaną szybkość i dokładność, obsługując ponad 140 języków, w tym angielski, cyrylicy, arabski, perski, hindi, chiński, japoński, koreański, tamilski i wiele innych. Niezależnie od tego, czy są to zeskanowane obrazy, zdjęcia ze smartfonów, zrzuty ekranu, czy zeskanowane pliki PDF, uzyskaj wyniki w popularnych formatach dokumentów i wymiany danych. Wykorzystaj filtry przed przetwarzaniem do obsługi obracanych, wypaczonych i hałaśliwych obrazów.

Wydajny i precyzyjny OCR
Doświadcz niezrównanej prędkości i precyzji w wynikach OCR z zaawansowaną technologią Pythona.
Wielojęzyczne
Rozpoznaj tekst w ponad 140 językach: angielski, francuski, niemiecki, hiszpański, rosyjski, chiński, hindi, japoński, koreański, tamilski, arabski, perski i więcej.
Uniwersalny
Bez wysiłku przetwarzają obrazy z różnych źródeł - skanerów, kamer i smartfonów - za pomocą Pythona.
Języki azjatyckie
Osiągnij precyzyjne uznanie skryptów chińskich, arabskich, devanagari i dravidian, a także tekstów w języku mieszanym.
Zachowaj układ
Utrzymuj formatowanie źródła dla dokładnej reprezentacji tekstu i rozpoznaj tabele.
Próbka kodu na żywo
Konwertuj obraz na tekst w zaledwie trzech wierszach kodu Pythona. Spróbuj sam!
* Przesyłając swoje pliki lub korzystając z Usługi, z którą zgadzasz się z naszym Warunki użytkowania I Polityka prywatności.
Konwertuj obraz na tekst
Odkryj więcej przykładów ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wybierz swoje preferencje
Wybierz odpowiednią bibliotekę dla swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.
Wszechstronność
Python via .NET
Jednolitość
Python via Java
Wydajność
Python via C++
Biega wszędzie
Niezależnie od nazwy, aspose.ocr for Python przez .NET nie wymaga instalacji .NET na platformie docelowej. Pakiet instalacyjny jest już wyposażony w wszystkie wymagane komponenty i może płynnie działać na dowolnej platformie - czy to komputer lokalny, serwer internetowy czy chmura.
Obsługiwane formaty plików
Aspose.OCR for Python via .NET może pracować z dowolnym plikiem Możesz dostać ze skanera lub aparatu. Wyniki rozpoznawania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- BMP
- GIF
Partia ocr
- Multi-page PDF
- DjVu
- ZIP
- Folder
Wyniki rozpoznawania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalacja
Aspose.ocr for python via .NET jest dostarczany jako pakiet Python z minimalnymi zależnościami lub jako plik do pobrania lub pakiet PYPI . Łatwo zainstaluj w swoim projekcie i jesteś gotowy do rozpoznania tekstów w ponad 140 językach i zapisanie wyników rozpoznawania w różnych formatach.
Poproś o licencję próbną , aby rozpocząć opracowanie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.
OCR pod Pythonem
Nasza biblioteka łatwo integruje się, umożliwiając bezproblemowe aplikacje Python na dowolnej platformie - komputery Desktop Windows, Windows Server, MacOS, Linux i Cloud.
140 języków rozpoznawania
Nasza biblioteka Java OCR to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści w skali globalnej. Przy wsparciu szerokiej gamy europejskich, na Bliskim Wschodzie i azjatyckim pisaniu, jest dobrze przystosowany do każdego kraju i biznesu.
Aspose OCR dla Java rozpoznaje tekst w dokumentach wielojęzycznych, takich jak chiński/angielski, arabski/francuski lub cyrylicy/angielski. Obsługiwane są następujące języki:
- ** Rozszerzona łacińska **: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i 80+ więcej;
- ** Cyrillic ** Alphabet: Rosjanin, Ukraińczyk, Kazachs, Bułgar, w tym teksty cyrylicy/angielskiego;
- Arabski, perski, urdu, w tym teksty zmieszane z angielskim;
- Języki chińskie, koreańskie, japońskie, devanagari i dravidian, w tym hindi, tamilskie, marathi i inne. Obsługiwane są również teksty w języku mieszanym.
Potężne filtry przetwarzania
Dokładność i niezawodność rozpoznawania znaków optycznych zależy od jakości oryginalnego obrazu. Aspose OCR dla Pythona przez .NET oferuje dużą liczbę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które ulepszają obraz przed wysłaniem do silnika OCR:
- Automatycznie obracaj obrazy do góry nogami.
- Wykryj odwrócone obrazy i wyodrębnij biało-czarny tekst.
- Automatycznie usuń brud, plamy, zarysowania, olśnienia, niechciane gradienty i inne hałas.
- Automatycznie dostosuj kontrast obrazu.
- Automatycznie ekskluzywne lub ręcznie rozmiar obrazu.
- Konwertuj obrazy na czarno -białą lub szarość.
- Znajdź potencjalnie problematyczne obszary obrazu i zwróć informacje o rodzaju wady i jego współrzędnych.
- Zwiększ grubość znaków na obrazie.
- Rozmycie hałaśliwe obrazy podczas zachowania krawędzi liter.
- Prostuj krzywiznę strony i napraw zniekształcenie obiektywu aparatu dla zdjęć stron.
Zoptymalizowane pod kątem określonych typów dokumentów
Aspose OCR dla Pythona przez .NET oferuje specjalnie przeszkolone sieci neuronowe do wyodrębnienia tekstu z niektórych rodzajów obrazów z maksymalną dokładnością:
Wbudowany sprawdzanie pisowni
Chociaż nasza biblioteka Python OCR zapewnia wysoką dokładność rozpoznawania, drukowanie wad, brudu lub niestandardowych czcionek może powodować niepoprawne rozpoznanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć sprawdzanie pisowni, który znajduje i automatycznie koryguje błędy pisowni w oparciu o wybrany język rozpoznawania.
Jeśli uznany tekst zawiera specjalistyczną terminologię, skrót i inne słowa, które nie są obecne we wspólnych słownikach pisowni, możesz podać własne listy słów.
Rozpoznawanie partii
Nasz API Python OCR wyzwala cię od rozpoznawania zdjęć jeden po drugim. Zastosuj różne metody przetwarzania wsadowego, aby rozpoznać wiele obrazów w jednym połączeniu:
- Rozpoznawanie plików PDF, TIFF i DJVU.
- Rozpoznawanie wszystkich plików w folderze.
- Rozpoznawanie wszystkich plików w archiwum.
- Rozpoznawanie wszystkich plików z listy.
Uczenie się według próbki
OCR For Python zapewnia szereg przykładów napisane w Python, pozwalając ci szybko zapoznać się z jego funkcjami i możliwościami. Zdobądź informacje na temat tworzenia dostosowanych rozwiązań w celu zaspokojenia potrzeb biznesowych w Python.
Funkcje i możliwości
Aspose.OCR for Python via .NET Aspose.ocr for Python przez .NET rozwiązuje twoje zadania szybko i łatwe.
Photo OCR
Wyodrębnij tekst ze zdjęć ze smartfonów z dokładnością na poziomie skanowania.
Wyszukiwanie pdf
Konwertuj dowolny skan na w pełni możliwy do wyszukiwania, indeksowany i edytowalny dokument.
Uznanie URL
Rozpoznaj zdjęcie z adresu URL bez pobierania go lokalnie.
Rozpoznawanie masowe
Przeczytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Każda czcionka i styl
Zidentyfikuj i rozpoznaj tekst we wszystkich popularnych krojach krojów i stylach.
Rozpoznanie się
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie korygując błędnie napisane słowa.
Znajdź tekst w obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazu
Porównaj teksty na dwóch obrazach, niezależnie od obudowy i układu.
Próbki kodu Pythona
Zagłębiaj się w próbki kodu, aby bezproblemowo zintegrować OCR z aplikacjami Python.
Instalacja
Aspose.ocr dla Pythona za pośrednictwem .NET, dystrybuowane jako koło Python lub samodzielnie do pobrania. Integracja z projektem Python, bezpośrednio z preferowanego zintegrowanego środowiska programistycznego Pythona (IDE), jest procesem bezproblemowym. Po prostu zainstaluj go, a jesteś przygotowany do wykorzystania pełnego zakresu możliwości OCR, oszczędzając wyniki rozpoznawania w różnych formatach.
po instalacji, możesz niezwłocznie zacząć za pomocą aspose.ocr dla pythona za pośrednictwem .NET, choć z pewnymi ograniczeniami. Tymczasowa licencja podnosi wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby zainicjować opracowanie w pełni funkcjonalnej aplikacji OCR, umożliwiając podjęcie świadomej decyzji o zakupie aspose.ocr dla Pythona za pośrednictwem .NET na późniejszym etapie.
Załaduj licencję
lic = License()
lic.set_license(self.licPath)
Rozpoznaj tekst na zdjęciach
Czytanie tekstu z dowolnej treści w Aspose OCR dla Pythona jest tak łatwe, jak nazwanie uniwersalnej metody rozpoznawania.
Konwertuj zdjęcie na tekst - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
Nasz interfejs API wręcz odczytuje każdy obraz ze skanerów, kamer lub smartfonów: dokumenty PDF, JPEG, PNG, TIFF, GIF, obrazy BMP, a nawet pliki DJVU. Pełne obsługę wielu stron dokumentów PDF, obrazów TIFF i DJVU zapewnia wszechstronność. Możesz także podać obraz z Internetu za pośrednictwem adresu URL.
Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.
Rozpoznaj PDF i zapisz wyniki w różnych formatach wyjściowych - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optymalizacja zasobów w Python
Rozpoznawanie znaków optycznych wymaga zasobów. Nasz interfejs API oferuje elastyczne sposoby zrównoważenia klasycznej triady ceny czasowej:
- Wybierz między dokładnym rozpoznawaniem a szybkim rozpoznawaniem.
- Określ liczbę wątków przydzielonych do rozpoznawania lub pozwól bibliotece automatycznie skalować do liczby rdzeni procesora.
- Zwolnij CPU, rozładowując obliczenia do zaplecza .NET.
Szybkie rozpoznawanie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Rozpoznaj pojedynczą linię
Jeśli obraz jest już przycięty do jednego wiersza tekstu, można go rozpoznać w najszybszym możliwym trybie, bez zautomatyzowanych poprawek, wykrywania struktury treści i innych kroków. Może przyspieszyć OCR do 7 razy szybszy niż normalny proces rozpoznawania.
Rozpoznaj pojedynczy wiersz tekstu na obrazie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)