Dlaczego Aspose.OCR dla Pythona przez .NET?

Wyrusz w podróż z Aspose OCR dla Pythona za pośrednictwem .NET – wszechstronnego i przyjaznego dla użytkownika API OCR. Osadź funkcję OCR w aplikacjach w języku Python za pomocą mniej niż 5 wierszy kodu, eliminując potrzebę stosowania skomplikowanych sieci matematycznych lub neuronowych. Nasz potężny silnik OCR zapewnia niezrównaną szybkość i dokładność, obsługując ponad 130 języków, w tym angielski, cyrylicę, arabski, perski, hindi, chiński, japoński, koreański, tamilski i wiele innych. Niezależnie od tego, czy są to zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu czy zeskanowane pliki PDF, wyniki można uzyskać w popularnych formatach wymiany dokumentów i danych. Wykorzystaj filtry wstępnego przetwarzania, aby poradzić sobie z obróconymi, przekrzywionymi i zaszumionymi obrazami.

Illustration ocr

Wydajny i precyzyjny OCR

Doświadcz niezrównanej szybkości i precyzji wyników OCR dzięki zaawansowanej technologii Python.

Wielojęzyczny

Rozpoznawaj tekst w ponad 140 językach: angielskim, francuskim, niemieckim, hiszpańskim, rosyjskim, chińskim, hindi, japońskim, koreańskim, tamilskim, arabskim, perskim i nie tylko.

Uniwersalny

Bez wysiłku przetwarzaj obrazy z różnych źródeł – skanerów, aparatów i smartfonów – za pomocą języka Python.

Języki azjatyckie

Osiągnij precyzyjne rozpoznawanie pisma chińskiego, arabskiego, dewanagari i dravidyjskiego, a także tekstów w językach mieszanych.

Zachowaj układ

Zachowaj formatowanie źródłowe w celu zapewnienia dokładnej reprezentacji tekstu i rozpoznaj tabele.

Próbka kodu na żywo

Konwertuj obraz na tekst w zaledwie TRZECH linijkach kodu Pythona. Spróbuj sam!

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przeglądać *

* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki użytkowania I Polityka prywatności.

Wynik uznania
 

Konwertuj obraz na tekst

Odkryj więcej przykładów >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Wybierz swoje preferencje

Wybierz bibliotekę odpowiednią do swoich potrzeb. Przeglądaj dostępne interfejsy API i ich możliwości, aby wybrać najbardziej wydajne rozwiązanie.

Wszechstronność

Python via .NET

Łatwy rozwój, czytelność i łatwość konserwacji kodu
Oferuje najwięcej funkcji i otrzymuje najczęstsze aktualizacje
Ogólna prędkość może być nieco mniejsza niż w przypadku innych platform

Jednolitość

Python via Java

Korzystaj z tej samej biblioteki na dowolnej platformie
Bezproblemowo uruchamiaj aplikację na dowolnym urządzeniu
Wymaga środowiska Java Runtime Environment (JRE) w wersji 8 lub nowszej

Wydajność

Python via C++

Najszybsza możliwa prędkość niezależnie od platformy
Duża kontrola nad zarządzaniem zasobami
Skierowany do doświadczonych programistów

Biega wszędzie

Niezależnie od nazwy, Aspose.OCR dla Pythona poprzez .NET nie wymaga instalacji .NET na platformie docelowej. Pakiet instalacyjny zawiera już wszystkie wymagane komponenty i może bezproblemowo działać na dowolnej platformie – czy to na komputerze lokalnym, serwerze internetowym czy w chmurze.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Obsługiwane formaty plików

Aspose.OCR for Python via .NET może pracować z dowolnym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania można zapisać, zaimportować do bazy danych lub analizować w czasie rzeczywistym.

Obrazy

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Partia OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Wyniki uznania

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalacja

Aspose.OCR dla Pythona przez .NET jest dostarczany jako pakiet Pythona z minimalnymi zależnościami lub jako plik do pobrania lub [pakiet PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Z łatwością zainstaluj go w swoim projekcie, a będziesz gotowy do rozpoznawania tekstów w ponad 140 językach i zapisywania wyników rozpoznawania w różnych formatach.

Poproś o licencję próbną , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.

OCR w Pythonie

Naszą bibliotekę można łatwo integrować, umożliwiając bezproblemowe działanie aplikacji Python na dowolnej platformie – komputerowym systemie Windows, Windows Server, macOS, Linux i chmurze.

Ponad 140 języków rozpoznawania

Nasza biblioteka Java OCR to uniwersalne rozwiązanie do przetwarzania dokumentów, ekstrakcji danych i digitalizacji treści na skalę globalną. Dzięki obsłudze szerokiej gamy skryptów pisarskich z Europy, Bliskiego Wschodu i Azji jest dobrze dostosowany do każdego kraju i firmy.

Aspose OCR for Java rozpoznaje tekst w dokumentach wielojęzycznych, takich jak chiński/angielski, arabski/francuski lub cyrylica/angielski. Obsługiwane są następujące języki:

  • Rozszerzona łacina: angielski, hiszpański, francuski, indonezyjski, portugalski, niemiecki, wietnamski, turecki, włoski, polski i ponad 80 innych;
  • Cyrylica alfabet: rosyjski, ukraiński, kazachski, bułgarski, w tym teksty mieszane cyrylicy i języka angielskiego;
  • arabski, perski, urdu, w tym teksty zmieszane z angielskim;
  • Języki chiński, koreański, japoński, dewanagari i dravidyjski, w tym hindi, tamilski, marathi i inne. Obsługiwane są także teksty w różnych językach.

Wydajne filtry przetwarzające

Dokładność i niezawodność optycznego rozpoznawania znaków w dużym stopniu zależy od jakości oryginalnego obrazu. Aspose OCR dla Pythona za pośrednictwem .NET oferuje dużą liczbę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które ulepszają obraz przed wysłaniem go do silnika OCR:

  • Automatycznie obracaj obrazy do góry nogami i obrócone.
  • Wykrywaj odwrócone obrazy i wyodrębniaj tekst biały na czarnym.
  • Automatycznie usuwaj brud, plamy, zadrapania, odblaski, niepożądane gradienty i inne szumy.
  • Automatycznie dostosuj kontrast obrazu.
  • Automatycznie zwiększ rozmiar obrazu lub ręcznie zmień jego rozmiar.
  • Konwertuj obrazy na czarno-białe lub w skali szarości.
  • Znajdź potencjalnie problematyczne obszary obrazu i zwróć informację o rodzaju wady i jej współrzędnych.
  • Zwiększ grubość znaków na obrazie.
  • Rozmyj zaszumione obrazy, zachowując krawędzie liter.
  • Wyprostuj krzywiznę strony i napraw zniekształcenie obiektywu aparatu w przypadku zdjęć stron.

Zoptymalizowany dla określonych typów dokumentów

Aspose OCR dla Pythona za pośrednictwem .NET oferuje specjalnie przeszkolone sieci neuronowe do wyodrębniania tekstu z określonych typów obrazów z maksymalną dokładnością:

Wbudowany moduł sprawdzania pisowni

Chociaż nasza biblioteka OCR w języku Python zapewnia wysoką dokładność rozpoznawania, defekty druku, zabrudzenia lub niestandardowe czcionki mogą powodować nieprawidłowe rozpoznawanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć moduł sprawdzania pisowni, który wyszukuje i automatycznie poprawia błędy ortograficzne w oparciu o wybrany język rozpoznawania.

Jeśli rozpoznany tekst zawiera specjalistyczną terminologię, skróty i inne słowa, których nie ma w powszechnych słownikach ortograficznych, możesz udostępnić własne listy słów.

Rozpoznawanie partii

Nasz interfejs API OCR w języku Python uwalnia Cię od rozpoznawania obrazów jeden po drugim. Stosuj różne metody przetwarzania wsadowego, aby rozpoznawać wiele obrazów w jednym wywołaniu:

  • Rozpoznawanie wielostronicowych plików PDF, TIFF i DjVu.
  • Rozpoznawanie wszystkich plików w folderze.
  • Rozpoznawanie wszystkich plików w archiwum.
  • Rozpoznawanie wszystkich plików z listy.

Nauka przez próbkę

OCR dla Pythona udostępnia szereg przykładów napisanych w Pythonie, co pozwala szybko zapoznać się z jego funkcjami i możliwościami. Zdobądź wiedzę na temat tworzenia dostosowanych rozwiązań spełniających potrzeby biznesowe w języku Python.

Funkcje i możliwości

Aspose.OCR for Python via .NET rozwiązuje Twoje zadania szybko i łatwo.

Feature icon

Zdjęcie OCR

Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.

Feature icon

Przeszukiwalny plik PDF

Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania, indeksowania i edycji.

Feature icon

Rozpoznawanie adresu URL

Rozpoznaj obraz z adresu URL bez konieczności pobierania go lokalnie.

Feature icon

Rozpoznawanie zbiorcze

Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Feature icon

Dowolna czcionka i styl

Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.

Feature icon

Dostosuj rozpoznawanie

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Feature icon

Sprawdzanie pisowni

Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.

Feature icon

Znajdź tekst na obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Feature icon

Porównaj teksty obrazkowe

Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.

Przykłady kodu Pythona

Zagłęb się w próbki kodu, aby bezproblemowo zintegrować OCR z aplikacjami w języku Python.

Instalacja

Dystrybuowany jako koło Pythona lub samodzielny pakiet do pobrania, Aspose.OCR dla Pythona za pośrednictwem .NET jest łatwo dystrybuowany. Integracja z projektem w języku Python bezpośrednio z preferowanego zintegrowanego środowiska programistycznego (IDE) w języku Python przebiega bezproblemowo. Po prostu go zainstaluj i będziesz gotowy do wykorzystania pełnego zakresu możliwości OCR, zapisując wyniki rozpoznawania w różnych formatach.

Po instalacji możesz natychmiast rozpocząć korzystanie z Aspose.OCR dla Pythona poprzez .NET , choć z pewnymi ograniczeniami. Licencja tymczasowa znosi wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby rozpocząć rozwój w pełni funkcjonalnej aplikacji OCR, co pozwoli Ci na późniejszym etapie podjąć świadomą decyzję o zakupie Aspose.OCR dla Pythona za pośrednictwem .NET.

Załaduj licencję

lic = License()
lic.set_license(self.licPath)

Rozpoznawanie tekstu na zdjęciach

Czytanie tekstu z dowolnej treści w Aspose OCR dla Pythona jest tak proste, jak wywołanie uniwersalnej metody rozpoznawania.

Zamień zdjęcie na tekst - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Uniwersalny konwerter Pythona

Nasze API sprawnie odczytuje dowolny obraz ze skanerów, aparatów fotograficznych lub smartfonów: dokumenty PDF, obrazy JPEG, PNG, TIFF, GIF, BMP, a nawet pliki DjVu. Pełna obsługa wielostronicowych dokumentów PDF, obrazów TIFF i DjVu zapewnia wszechstronność. Możesz także udostępnić obraz z Internetu za pośrednictwem adresu URL.

Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.

Rozpoznawaj pliki PDF i zapisuj wyniki w różnych formatach wyjściowych — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optymalizacja zasobów w Pythonie

Optyczne rozpoznawanie znaków wymaga zasobów. Nasze API oferuje elastyczne sposoby równoważenia klasycznej triady czas-cena-jakość:

  • Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
  • Określ liczbę wątków przydzielonych do rozpoznawania lub pozwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
  • Zwolnij procesor, przenosząc obliczenia do backendu .NET.

Szybkie rozpoznawanie – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Rozpoznaj pojedynczą linię

Jeśli obraz jest już przycięty do jednej linijki tekstu, można go rozpoznać w najszybszym możliwym trybie, bez automatycznych korekt, wykrywania struktury treści i innych czynności pochłaniających zasoby. Może przyspieszyć OCR nawet 7 razy szybciej niż normalny proces rozpoznawania.

Rozpoznaj pojedynczą linię tekstu na obrazie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)