Dlaczego aspose.ocr for Python przez .net?

Wyrusz w podróż z Aspose OCR dla Pythona przez .NET-wszechstronny i przyjazny dla użytkownika API OCR. Umieść funkcjonalność OCR w aplikacjach Python z mniej niż 5 wierszami kodu, eliminując potrzebę złożonych sieci matematycznych lub neuronowych. Nasz potężny silnik OCR zapewnia niezrównaną szybkość i dokładność, obsługując ponad 140 języków, w tym angielski, cyrylicy, arabski, perski, hindi, chiński, japoński, koreański, tamilski i wiele innych. Niezależnie od tego, czy są to zeskanowane obrazy, zdjęcia ze smartfonów, zrzuty ekranu, czy zeskanowane pliki PDF, uzyskaj wyniki w popularnych formatach dokumentów i wymiany danych. Wykorzystaj filtry przed przetwarzaniem do obsługi obracanych, wypaczonych i hałaśliwych obrazów.

Illustration ocr

Wydajny i precyzyjny OCR

Doświadcz niezrównanej prędkości i precyzji w wynikach OCR z zaawansowaną technologią Pythona.

Wielojęzyczne

Rozpoznaj tekst w ponad 140 językach: angielski, francuski, niemiecki, hiszpański, rosyjski, chiński, hindi, japoński, koreański, tamilski, arabski, perski i więcej.

Uniwersalny

Bez wysiłku przetwarzają obrazy z różnych źródeł - skanerów, kamer i smartfonów - za pomocą Pythona.

Języki azjatyckie

Osiągnij precyzyjne uznanie skryptów chińskich, arabskich, devanagari i dravidian, a także tekstów w języku mieszanym.

Zachowaj układ

Utrzymuj formatowanie źródła dla dokładnej reprezentacji tekstu i rozpoznaj tabele.

Próbka kodu na żywo

Konwertuj obraz na tekst w zaledwie trzech wierszach kodu Pythona. Spróbuj sam!

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przejrzeć *

* Przesyłając swoje pliki lub korzystając z Usługi, z którą zgadzasz się z naszym Warunki użytkowania I Polityka prywatności.

Wynik rozpoznawania
 

Konwertuj obraz na tekst

Odkryj więcej przykładów >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Wybierz swoje preferencje

Wybierz odpowiednią bibliotekę dla swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.

Wszechstronność

Python via .NET

Łatwy rozwój, czytelność i utrzymanie kodu
Oferuje najwięcej funkcji i otrzymuje najczęstsze aktualizacje
Ogólna prędkość może być nieco wolniejsza niż inne platformy

Jednolitość

Python via Java

Użyj tej samej biblioteki na dowolnej platformie
Bezproblemowo uruchom aplikację na dowolnym urządzeniu
Wymaga środowiska wykonawczego Java (JRE) wersja 8 lub nowszy

Wydajność

Python via C++

Najszybszy możliwy prędkość, niezależnie od platformy
Duża kontrola nad zarządzaniem zasobami
Skierowane do doświadczonych programistów

Biega wszędzie

Niezależnie od nazwy, aspose.ocr for Python przez .NET nie wymaga instalacji .NET na platformie docelowej. Pakiet instalacyjny jest już wyposażony w wszystkie wymagane komponenty i może płynnie działać na dowolnej platformie - czy to komputer lokalny, serwer internetowy czy chmura.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Obsługiwane formaty plików

Aspose.OCR for Python via .NET może pracować z dowolnym plikiem Możesz dostać ze skanera lub aparatu. Wyniki rozpoznawania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.

Obrazy

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Partia ocr

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Wyniki rozpoznawania

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalacja

Aspose.ocr for python via .NET jest dostarczany jako pakiet Python z minimalnymi zależnościami lub jako plik do pobrania lub pakiet PYPI . Łatwo zainstaluj w swoim projekcie i jesteś gotowy do rozpoznania tekstów w ponad 140 językach i zapisanie wyników rozpoznawania w różnych formatach.

Poproś o licencję próbną , aby rozpocząć opracowanie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.

OCR pod Pythonem

Nasza biblioteka łatwo integruje się, umożliwiając bezproblemowe aplikacje Python na dowolnej platformie - komputery Desktop Windows, Windows Server, MacOS, Linux i Cloud.

140 języków rozpoznawania

Nasza biblioteka Java OCR to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści w skali globalnej. Przy wsparciu szerokiej gamy europejskich, na Bliskim Wschodzie i azjatyckim pisaniu, jest dobrze przystosowany do każdego kraju i biznesu.

Aspose OCR dla Java rozpoznaje tekst w dokumentach wielojęzycznych, takich jak chiński/angielski, arabski/francuski lub cyrylicy/angielski. Obsługiwane są następujące języki:

  • ** Rozszerzona łacińska **: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i 80+ więcej;
  • ** Cyrillic ** Alphabet: Rosjanin, Ukraińczyk, Kazachs, Bułgar, w tym teksty cyrylicy/angielskiego;
  • Arabski, perski, urdu, w tym teksty zmieszane z angielskim;
  • Języki chińskie, koreańskie, japońskie, devanagari i dravidian, w tym hindi, tamilskie, marathi i inne. Obsługiwane są również teksty w języku mieszanym.

Potężne filtry przetwarzania

Dokładność i niezawodność rozpoznawania znaków optycznych zależy od jakości oryginalnego obrazu. Aspose OCR dla Pythona przez .NET oferuje dużą liczbę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które ulepszają obraz przed wysłaniem do silnika OCR:

  • Automatycznie obracaj obrazy do góry nogami.
  • Wykryj odwrócone obrazy i wyodrębnij biało-czarny tekst.
  • Automatycznie usuń brud, plamy, zarysowania, olśnienia, niechciane gradienty i inne hałas.
  • Automatycznie dostosuj kontrast obrazu.
  • Automatycznie ekskluzywne lub ręcznie rozmiar obrazu.
  • Konwertuj obrazy na czarno -białą lub szarość.
  • Znajdź potencjalnie problematyczne obszary obrazu i zwróć informacje o rodzaju wady i jego współrzędnych.
  • Zwiększ grubość znaków na obrazie.
  • Rozmycie hałaśliwe obrazy podczas zachowania krawędzi liter.
  • Prostuj krzywiznę strony i napraw zniekształcenie obiektywu aparatu dla zdjęć stron.

Zoptymalizowane pod kątem określonych typów dokumentów

Aspose OCR dla Pythona przez .NET oferuje specjalnie przeszkolone sieci neuronowe do wyodrębnienia tekstu z niektórych rodzajów obrazów z maksymalną dokładnością:

Wbudowany sprawdzanie pisowni

Chociaż nasza biblioteka Python OCR zapewnia wysoką dokładność rozpoznawania, drukowanie wad, brudu lub niestandardowych czcionek może powodować niepoprawne rozpoznanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć sprawdzanie pisowni, który znajduje i automatycznie koryguje błędy pisowni w oparciu o wybrany język rozpoznawania.

Jeśli uznany tekst zawiera specjalistyczną terminologię, skrót i inne słowa, które nie są obecne we wspólnych słownikach pisowni, możesz podać własne listy słów.

Rozpoznawanie partii

Nasz API Python OCR wyzwala cię od rozpoznawania zdjęć jeden po drugim. Zastosuj różne metody przetwarzania wsadowego, aby rozpoznać wiele obrazów w jednym połączeniu:

  • Rozpoznawanie plików PDF, TIFF i DJVU.
  • Rozpoznawanie wszystkich plików w folderze.
  • Rozpoznawanie wszystkich plików w archiwum.
  • Rozpoznawanie wszystkich plików z listy.

Uczenie się według próbki

OCR For Python zapewnia szereg przykładów napisane w Python, pozwalając ci szybko zapoznać się z jego funkcjami i możliwościami. Zdobądź informacje na temat tworzenia dostosowanych rozwiązań w celu zaspokojenia potrzeb biznesowych w Python.

Funkcje i możliwości

Aspose.OCR for Python via .NET Aspose.ocr for Python przez .NET rozwiązuje twoje zadania szybko i łatwe.

Feature icon

Photo OCR

Wyodrębnij tekst ze zdjęć ze smartfonów z dokładnością na poziomie skanowania.

Feature icon

Wyszukiwanie pdf

Konwertuj dowolny skan na w pełni możliwy do wyszukiwania, indeksowany i edytowalny dokument.

Feature icon

Uznanie URL

Rozpoznaj zdjęcie z adresu URL bez pobierania go lokalnie.

Feature icon

Rozpoznawanie masowe

Przeczytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Feature icon

Każda czcionka i styl

Zidentyfikuj i rozpoznaj tekst we wszystkich popularnych krojach krojów i stylach.

Feature icon

Rozpoznanie się

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Feature icon

Sprawdzanie pisowni

Popraw wyniki, automatycznie korygując błędnie napisane słowa.

Feature icon

Znajdź tekst w obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Feature icon

Porównaj teksty obrazu

Porównaj teksty na dwóch obrazach, niezależnie od obudowy i układu.

Próbki kodu Pythona

Zagłębiaj się w próbki kodu, aby bezproblemowo zintegrować OCR z aplikacjami Python.

Instalacja

Aspose.ocr dla Pythona za pośrednictwem .NET, dystrybuowane jako koło Python lub samodzielnie do pobrania. Integracja z projektem Python, bezpośrednio z preferowanego zintegrowanego środowiska programistycznego Pythona (IDE), jest procesem bezproblemowym. Po prostu zainstaluj go, a jesteś przygotowany do wykorzystania pełnego zakresu możliwości OCR, oszczędzając wyniki rozpoznawania w różnych formatach.

po instalacji, możesz niezwłocznie zacząć za pomocą aspose.ocr dla pythona za pośrednictwem .NET, choć z pewnymi ograniczeniami. Tymczasowa licencja podnosi wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby zainicjować opracowanie w pełni funkcjonalnej aplikacji OCR, umożliwiając podjęcie świadomej decyzji o zakupie aspose.ocr dla Pythona za pośrednictwem .NET na późniejszym etapie.

Załaduj licencję

lic = License()
lic.set_license(self.licPath)

Rozpoznaj tekst na zdjęciach

Czytanie tekstu z dowolnej treści w Aspose OCR dla Pythona jest tak łatwe, jak nazwanie uniwersalnej metody rozpoznawania.

Konwertuj zdjęcie na tekst - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

Nasz interfejs API wręcz odczytuje każdy obraz ze skanerów, kamer lub smartfonów: dokumenty PDF, JPEG, PNG, TIFF, GIF, obrazy BMP, a nawet pliki DJVU. Pełne obsługę wielu stron dokumentów PDF, obrazów TIFF i DJVU zapewnia wszechstronność. Możesz także podać obraz z Internetu za pośrednictwem adresu URL.

Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.

Rozpoznaj PDF i zapisz wyniki w różnych formatach wyjściowych - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optymalizacja zasobów w Python

Rozpoznawanie znaków optycznych wymaga zasobów. Nasz interfejs API oferuje elastyczne sposoby zrównoważenia klasycznej triady ceny czasowej:

  • Wybierz między dokładnym rozpoznawaniem a szybkim rozpoznawaniem.
  • Określ liczbę wątków przydzielonych do rozpoznawania lub pozwól bibliotece automatycznie skalować do liczby rdzeni procesora.
  • Zwolnij CPU, rozładowując obliczenia do zaplecza .NET.

Szybkie rozpoznawanie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Rozpoznaj pojedynczą linię

Jeśli obraz jest już przycięty do jednego wiersza tekstu, można go rozpoznać w najszybszym możliwym trybie, bez zautomatyzowanych poprawek, wykrywania struktury treści i innych kroków. Może przyspieszyć OCR do 7 razy szybszy niż normalny proces rozpoznawania.

Rozpoznaj pojedynczy wiersz tekstu na obrazie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)