Dlaczego warto wybrać Aspose.OCR dla Pythona za pośrednictwem .NET?

Wyrusz w podróż z Aspose.OCR dla Pythona za pośrednictwem .NET – wszechstronnego i przyjaznego dla użytkownika API OCR. Osadzaj funkcję OCR w aplikacjach w języku Python za pomocą mniej niż 5 linii kodu, eliminując potrzebę stosowania skomplikowanych sieci matematycznych lub neuronowych. Nasz potężny silnik OCR zapewnia niezrównaną szybkość i dokładność, obsługując 28 języków, w tym alfabet łaciński, cyrylicę i chiński. Niezależnie od tego, czy są to zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu czy zeskanowane pliki PDF, wyniki można uzyskać w popularnych formatach wymiany dokumentów i danych. Wykorzystaj filtry wstępnego przetwarzania, aby poradzić sobie z obróconymi, przekrzywionymi i zaszumionymi obrazami. Zoptymalizuj wydajność rozpoznawania i obciążenie systemu, przenosząc zadania wymagające dużej ilości zasobów do backendu .NET.

Illustration ocr

Wydajne i precyzyjne opanowanie OCR

Doświadcz niezrównanej szybkości i precyzji wyników OCR dzięki zaawansowanej technologii Python i .NET.

Wielojęzyczna doskonałość

Z łatwością i precyzją rozpoznaje tekst w 28 językach, obejmujący alfabet łaciński, cyrylicę i chiński.

Adaptowalne przetwarzanie obrazu

Bez wysiłku przetwarzaj obrazy z różnych źródeł – skanerów, aparatów i smartfonów – za pomocą Pythona i .NET.

Znajomość chińskiego znaku

Osiągnij precyzyjne rozpoznawanie ponad 6000 chińskich znaków, zapewniając dokładność dzięki Pythonowi i .NET.

Zachowanie stylów i formatów czcionek

Zachowaj style czcionek i formatowanie, aby zapewnić dokładną reprezentację tekstu, zwiększając wszechstronność dzięki Pythonowi i .NET.

Próbka kodu na żywo

Poczuj prostotę: przekonwertuj obraz na tekst w zaledwie trzech linijkach kodu Pythona!

Gotowy do rozpoznania Gotowy do rozpoznania Upuść plik tutaj lub kliknij, aby przeglądać *

* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki korzystania I Polityka prywatności.

Wynik uznania
 

Konwertuj obraz na tekst

Odkryj więcej przykładów >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Wzmocnienie platformy .NET dla języka Python w każdym zakątku

Aspose.OCR dla Pythona za pośrednictwem .NET bezproblemowo działa na dowolnej platformie obsługującej .NET Framework 4.0 i nowsze – czy to maszyna lokalna, internet serwer lub chmura.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Obsługiwane formaty plików

Aspose.OCR for Python via .NET może pracować z praktycznie każdym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania zwracane są w najpopularniejszych formatach plików i wymiany danych, które można zapisać, zaimportować do bazy danych lub przeanalizować w czasie rzeczywistym.

Obrazy

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Partia OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Wyniki uznania

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalacja dla Pythona z backendem .NET

Aspose.OCR dla Pythona za pośrednictwem .NET jest dostarczany jako pakiet Pythona z minimalnymi zależnościami lub jako plik do pobrania . Z łatwością zainstaluj go w swoim projekcie, a będziesz gotowy do rozpoznawania tekstów w wielu obsługiwanych językach i zapisywania wyników rozpoznawania w różnych formatach.

Poproś o licencję próbną , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.

Potężny OCR dla aplikacji Python

Naszą bibliotekę można łatwo integrować, umożliwiając bezproblemowe działanie aplikacji Python na dowolnej platformie – komputerowym systemie Windows, Windows Server, macOS, Linux i chmurze.

28 języków rozpoznawania

Nasz interfejs API Python i .NET OCR rozpoznaje mnóstwo języków i popularnych skryptów pisarskich, w tym języki mieszane:

Pozostaw wykrywanie języka bibliotece lub zdefiniuj język samodzielnie, aby zwiększyć wydajność i niezawodność rozpoznawania.

  • Rozszerzony alfabet łaciński: chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki;
  • Cyrylica alfabet: białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński;
  • Chiński: Ponad 6000 znaków;
  • Hinduski.

Wydajne filtry przetwarzające

Dokładność i niezawodność optycznego rozpoznawania znaków w dużym stopniu zależy od jakości oryginalnego obrazu. Aspose.OCR dla Pythona za pośrednictwem .NET oferuje dużą liczbę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które ulepszają obraz przed wysłaniem go do silnika OCR:

  • Automatycznie prostuj obrazy ustawione pod niewielkim kątem do poziomu.
  • Ręcznie obracaj mocno przekrzywione obrazy.
  • Automatycznie usuwaj brud, plamy, zadrapania, odblaski, niepożądane gradienty i inne szumy.
  • Automatycznie dostosuj kontrast obrazu.
  • Automatycznie zwiększ rozmiar obrazu lub ręcznie zmień jego rozmiar.
  • Konwertuj obrazy na czarno-białe lub w skali szarości.
  • Odwróć kolory obrazu, tak aby jasne obszary wyglądały na ciemne, a ciemne na jasne.
  • Zwiększ grubość znaków na obrazie.
  • Rozmyj zaszumione obrazy, zachowując krawędzie liter.
  • Wyprostuj krzywiznę strony i napraw zniekształcenie obiektywu aparatu w przypadku zdjęć stron.

Zoptymalizowany dla określonych typów dokumentów

Aspose.OCR dla Pythona za pośrednictwem .NET oferuje specjalnie przeszkolone sieci neuronowe do wyodrębniania tekstu z określonych typów obrazów z maksymalną dokładnością:

Wbudowany moduł sprawdzania pisowni

Chociaż Aspose.OCR dla Pythona za pośrednictwem .NET zapewnia wysoką dokładność rozpoznawania, defekty druku, brud lub niestandardowe czcionki mogą powodować nieprawidłowe rozpoznawanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć moduł sprawdzania pisowni, który wyszukuje i automatycznie poprawia błędy ortograficzne w oparciu o wybrany język rozpoznawania.

Jeśli rozpoznany tekst zawiera specjalistyczną terminologię, skróty i inne słowa, których nie ma w powszechnych słownikach ortograficznych, możesz udostępnić własne listy słów.

Uproszczone rozpoznawanie partii

Nasz interfejs API OCR w języku Python uwalnia Cię od rozpoznawania obrazów jeden po drugim. Stosuj różne metody przetwarzania wsadowego, aby rozpoznawać wiele obrazów w jednym wywołaniu:

  • Rozpoznawanie wielostronicowych plików PDF, TIFF i DjVu.
  • Rozpoznawanie wszystkich plików w folderze.
  • Rozpoznawanie wszystkich plików w archiwum.
  • Rozpoznawanie wszystkich plików z listy.

Nauka poprzez przykłady Pythona

Aspose.OCR dla Pythona poprzez .NET udostępnia tablicę przykładów napisanych w Pythonie, co pozwala szybko zapoznać się z jego funkcjami i możliwości. Zdobądź wiedzę na temat tworzenia dostosowanych rozwiązań spełniających potrzeby biznesowe w języku Python.

Funkcje i możliwości

Aspose.OCR for Python via .NET Poznaj zaawansowane możliwości Aspose.OCR dla C++.

Feature icon

Zdjęcie OCR

Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.

Feature icon

Przeszukiwalny plik PDF

Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.

Feature icon

Rozpoznawanie adresu URL

Rozpoznaj obraz z adresu URL bez pobierania go lokalnie.

Feature icon

Rozpoznawanie zbiorcze

Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.

Feature icon

Dowolna czcionka i styl

Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.

Feature icon

Dostosuj rozpoznawanie

Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.

Feature icon

Sprawdzanie pisowni

Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.

Feature icon

Znajdź tekst na obrazach

Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.

Feature icon

Porównaj teksty obrazów

Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.

Przykłady kodu Pythona

Zagłęb się w próbki kodu, aby bezproblemowo zintegrować Aspose.OCR dla Pythona poprzez .NET z aplikacjami Pythona.

Biegłość w instalacji w Pythonie

Dystrybuowany jako koło Pythona lub samodzielny pakiet do pobrania, Aspose.OCR dla Pythona za pośrednictwem .NET jest łatwo dystrybuowany. Integracja z projektem w języku Python bezpośrednio z preferowanego zintegrowanego środowiska programistycznego (IDE) w języku Python przebiega bezproblemowo. Po prostu go zainstaluj i będziesz gotowy do wykorzystania pełnego zakresu możliwości OCR, zapisując wyniki rozpoznawania w różnych formatach.

Po instalacji możesz natychmiast rozpocząć korzystanie z Aspose.OCR dla Pythona poprzez .NET , choć z pewnymi ograniczeniami. Licencja tymczasowa znosi wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby rozpocząć rozwój w pełni funkcjonalnej aplikacji OCR, co pozwoli Ci na późniejszym etapie podjąć świadomą decyzję o zakupie Aspose.OCR dla Pythona za pośrednictwem .NET.

Załaduj licencję

lic = License()
lic.set_license(self.licPath)

Rozpoznawanie tekstu na zdjęciach

Czytanie tekstu z dowolnej zawartości w Aspose.OCR dla Pythona za pośrednictwem .NET jest tak proste, jak wywołanie uniwersalnej metody rozpoznawania().

Zamień zdjęcie na tekst - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Uniwersalny konwerter Pythona

Nasze API sprawnie odczytuje dowolny obraz ze skanerów, aparatów fotograficznych lub smartfonów: dokumenty PDF, obrazy JPEG, PNG, TIFF, GIF, BMP, a nawet pliki DjVu. Pełna obsługa wielostronicowych dokumentów PDF, obrazów TIFF i DjVu zapewnia wszechstronność. Możesz także udostępnić obraz z Internetu za pośrednictwem adresu URL.

Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.

Rozpoznawaj pliki PDF i zapisuj wyniki w różnych formatach wyjściowych — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optymalizacja zasobów w Pythonie

Optyczne rozpoznawanie znaków wymaga zasobów. Nasze API oferuje elastyczne sposoby równoważenia klasycznej triady czas-cena-jakość:

  • Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
  • Określ liczbę wątków przydzielonych do rozpoznawania lub pozwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
  • Uwolnij procesor, przenosząc obliczenia do backendu .NET.

Szybkie rozpoznawanie – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Rozpoznaj pojedynczą linię

Jeśli obraz jest już przycięty do jednej linijki tekstu, można go rozpoznać w najszybszym możliwym trybie, bez automatycznych korekt, wykrywania struktury treści i innych czynności pochłaniających zasoby. Może przyspieszyć OCR nawet 7 razy szybciej niż normalny proces rozpoznawania.

Rozpoznaj pojedynczą linię tekstu na obrazie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)