Mistrzostwo OCR w Pythonie: Obsługiwane przez Aspose.OCR dla Pythona za pośrednictwem .NET
OCR: Przekształcaj obrazy w tekst za pomocą Pythona
Więcej wystaw ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Dlaczego warto wybrać Aspose.OCR dla Pythona za pośrednictwem .NET?
Wyrusz w podróż z Aspose.OCR dla Pythona za pośrednictwem .NET – wszechstronnego i przyjaznego dla użytkownika API OCR. Osadzaj funkcję OCR w aplikacjach w języku Python za pomocą mniej niż 5 linii kodu, eliminując potrzebę stosowania skomplikowanych sieci matematycznych lub neuronowych. Nasz potężny silnik OCR zapewnia niezrównaną szybkość i dokładność, obsługując 28 języków, w tym alfabet łaciński, cyrylicę i chiński. Niezależnie od tego, czy są to zeskanowane obrazy, zdjęcia ze smartfona, zrzuty ekranu czy zeskanowane pliki PDF, wyniki można uzyskać w popularnych formatach wymiany dokumentów i danych. Wykorzystaj filtry wstępnego przetwarzania, aby poradzić sobie z obróconymi, przekrzywionymi i zaszumionymi obrazami. Zoptymalizuj wydajność rozpoznawania i obciążenie systemu, przenosząc zadania wymagające dużej ilości zasobów do backendu .NET.
Wydajne i precyzyjne opanowanie OCR
Doświadcz niezrównanej szybkości i precyzji wyników OCR dzięki zaawansowanej technologii Python i .NET.
Wielojęzyczna doskonałość
Z łatwością i precyzją rozpoznaje tekst w 28 językach, obejmujący alfabet łaciński, cyrylicę i chiński.
Adaptowalne przetwarzanie obrazu
Bez wysiłku przetwarzaj obrazy z różnych źródeł – skanerów, aparatów i smartfonów – za pomocą Pythona i .NET.
Znajomość chińskiego znaku
Osiągnij precyzyjne rozpoznawanie ponad 6000 chińskich znaków, zapewniając dokładność dzięki Pythonowi i .NET.
Zachowanie stylów i formatów czcionek
Zachowaj style czcionek i formatowanie, aby zapewnić dokładną reprezentację tekstu, zwiększając wszechstronność dzięki Pythonowi i .NET.
Próbka kodu na żywo
Poczuj prostotę: przekonwertuj obraz na tekst w zaledwie trzech linijkach kodu Pythona!
* Przesyłając swoje pliki lub korzystając z usługi, zgadzasz się z naszymi Warunki korzystania I Polityka prywatności.
Konwertuj obraz na tekst
Odkryj więcej przykładów ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Wzmocnienie platformy .NET dla języka Python w każdym zakątku
Aspose.OCR dla Pythona za pośrednictwem .NET bezproblemowo działa na dowolnej platformie obsługującej .NET Framework 4.0 i nowsze – czy to maszyna lokalna, internet serwer lub chmura.
Obsługiwane formaty plików
Aspose.OCR for Python via .NET może pracować z praktycznie każdym plikiem można uzyskać za pomocą skanera lub aparatu. Wyniki rozpoznania zwracane są w najpopularniejszych formatach plików i wymiany danych, które można zapisać, zaimportować do bazy danych lub przeanalizować w czasie rzeczywistym.
Obrazy
- JPEG
- PNG
- TIFF
- BMP
- GIF
Partia OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Wyniki uznania
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalacja dla Pythona z backendem .NET
Aspose.OCR dla Pythona za pośrednictwem .NET jest dostarczany jako pakiet Pythona z minimalnymi zależnościami lub jako plik do pobrania . Z łatwością zainstaluj go w swoim projekcie, a będziesz gotowy do rozpoznawania tekstów w wielu obsługiwanych językach i zapisywania wyników rozpoznawania w różnych formatach.
Poproś o licencję próbną , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez ograniczeń.
Potężny OCR dla aplikacji Python
Naszą bibliotekę można łatwo integrować, umożliwiając bezproblemowe działanie aplikacji Python na dowolnej platformie – komputerowym systemie Windows, Windows Server, macOS, Linux i chmurze.
28 języków rozpoznawania
Nasz interfejs API Python i .NET OCR rozpoznaje mnóstwo języków i popularnych skryptów pisarskich, w tym języki mieszane:
Pozostaw wykrywanie języka bibliotece lub zdefiniuj język samodzielnie, aby zwiększyć wydajność i niezawodność rozpoznawania.
- Rozszerzony alfabet łaciński: chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki;
- Cyrylica alfabet: białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński;
- Chiński: Ponad 6000 znaków;
- Hinduski.
Wydajne filtry przetwarzające
Dokładność i niezawodność optycznego rozpoznawania znaków w dużym stopniu zależy od jakości oryginalnego obrazu. Aspose.OCR dla Pythona za pośrednictwem .NET oferuje dużą liczbę w pełni zautomatyzowanych i ręcznych filtrów przetwarzania obrazu, które ulepszają obraz przed wysłaniem go do silnika OCR:
- Automatycznie prostuj obrazy ustawione pod niewielkim kątem do poziomu.
- Ręcznie obracaj mocno przekrzywione obrazy.
- Automatycznie usuwaj brud, plamy, zadrapania, odblaski, niepożądane gradienty i inne szumy.
- Automatycznie dostosuj kontrast obrazu.
- Automatycznie zwiększ rozmiar obrazu lub ręcznie zmień jego rozmiar.
- Konwertuj obrazy na czarno-białe lub w skali szarości.
- Odwróć kolory obrazu, tak aby jasne obszary wyglądały na ciemne, a ciemne na jasne.
- Zwiększ grubość znaków na obrazie.
- Rozmyj zaszumione obrazy, zachowując krawędzie liter.
- Wyprostuj krzywiznę strony i napraw zniekształcenie obiektywu aparatu w przypadku zdjęć stron.
Zoptymalizowany dla określonych typów dokumentów
Aspose.OCR dla Pythona za pośrednictwem .NET oferuje specjalnie przeszkolone sieci neuronowe do wyodrębniania tekstu z określonych typów obrazów z maksymalną dokładnością:
Wbudowany moduł sprawdzania pisowni
Chociaż Aspose.OCR dla Pythona za pośrednictwem .NET zapewnia wysoką dokładność rozpoznawania, defekty druku, brud lub niestandardowe czcionki mogą powodować nieprawidłowe rozpoznawanie niektórych znaków lub słów. Aby jeszcze bardziej poprawić wyniki rozpoznawania, możesz włączyć moduł sprawdzania pisowni, który wyszukuje i automatycznie poprawia błędy ortograficzne w oparciu o wybrany język rozpoznawania.
Jeśli rozpoznany tekst zawiera specjalistyczną terminologię, skróty i inne słowa, których nie ma w powszechnych słownikach ortograficznych, możesz udostępnić własne listy słów.
Uproszczone rozpoznawanie partii
Nasz interfejs API OCR w języku Python uwalnia Cię od rozpoznawania obrazów jeden po drugim. Stosuj różne metody przetwarzania wsadowego, aby rozpoznawać wiele obrazów w jednym wywołaniu:
- Rozpoznawanie wielostronicowych plików PDF, TIFF i DjVu.
- Rozpoznawanie wszystkich plików w folderze.
- Rozpoznawanie wszystkich plików w archiwum.
- Rozpoznawanie wszystkich plików z listy.
Nauka poprzez przykłady Pythona
Aspose.OCR dla Pythona poprzez .NET udostępnia tablicę przykładów napisanych w Pythonie, co pozwala szybko zapoznać się z jego funkcjami i możliwości. Zdobądź wiedzę na temat tworzenia dostosowanych rozwiązań spełniających potrzeby biznesowe w języku Python.
Funkcje i możliwości
Aspose.OCR for Python via .NET Poznaj zaawansowane możliwości Aspose.OCR dla C++.
Zdjęcie OCR
Wyodrębniaj tekst ze zdjęć smartfonów z dokładnością na poziomie skanowania.
Przeszukiwalny plik PDF
Konwertuj dowolny skan w dokument z możliwością pełnego przeszukiwania i indeksowania.
Rozpoznawanie adresu URL
Rozpoznaj obraz z adresu URL bez pobierania go lokalnie.
Rozpoznawanie zbiorcze
Czytaj wszystkie obrazy z wielostronicowych dokumentów, folderów i archiwów.
Dowolna czcionka i styl
Identyfikuj i rozpoznawaj tekst we wszystkich popularnych krojach i stylach.
Dostosuj rozpoznawanie
Dostosuj każdy parametr OCR, aby uzyskać najlepsze wyniki rozpoznawania.
Sprawdzanie pisowni
Popraw wyniki, automatycznie poprawiając błędnie napisane słowa.
Znajdź tekst na obrazach
Wyszukaj tekst lub wyrażenie regularne w zestawie obrazów.
Porównaj teksty obrazów
Porównaj teksty na dwóch obrazach, niezależnie od wielkości i układu.
Przykłady kodu Pythona
Zagłęb się w próbki kodu, aby bezproblemowo zintegrować Aspose.OCR dla Pythona poprzez .NET z aplikacjami Pythona.
Biegłość w instalacji w Pythonie
Dystrybuowany jako koło Pythona lub samodzielny pakiet do pobrania, Aspose.OCR dla Pythona za pośrednictwem .NET jest łatwo dystrybuowany. Integracja z projektem w języku Python bezpośrednio z preferowanego zintegrowanego środowiska programistycznego (IDE) w języku Python przebiega bezproblemowo. Po prostu go zainstaluj i będziesz gotowy do wykorzystania pełnego zakresu możliwości OCR, zapisując wyniki rozpoznawania w różnych formatach.
Po instalacji możesz natychmiast rozpocząć korzystanie z Aspose.OCR dla Pythona poprzez .NET , choć z pewnymi ograniczeniami. Licencja tymczasowa znosi wszystkie ograniczenia wersji próbnej na 30 dni. Wykorzystaj ten okres, aby rozpocząć rozwój w pełni funkcjonalnej aplikacji OCR, co pozwoli Ci na późniejszym etapie podjąć świadomą decyzję o zakupie Aspose.OCR dla Pythona za pośrednictwem .NET.
Załaduj licencję
lic = License()
lic.set_license(self.licPath)
Rozpoznawanie tekstu na zdjęciach
Czytanie tekstu z dowolnej zawartości w Aspose.OCR dla Pythona za pośrednictwem .NET jest tak proste, jak wywołanie uniwersalnej metody rozpoznawania().
Zamień zdjęcie na tekst - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Uniwersalny konwerter Pythona
Nasze API sprawnie odczytuje dowolny obraz ze skanerów, aparatów fotograficznych lub smartfonów: dokumenty PDF, obrazy JPEG, PNG, TIFF, GIF, BMP, a nawet pliki DjVu. Pełna obsługa wielostronicowych dokumentów PDF, obrazów TIFF i DjVu zapewnia wszechstronność. Możesz także udostępnić obraz z Internetu za pośrednictwem adresu URL.
Wyniki rozpoznawania są zwracane w popularnych formatach dokumentów i wymiany danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.
Rozpoznawaj pliki PDF i zapisuj wyniki w różnych formatach wyjściowych — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optymalizacja zasobów w Pythonie
Optyczne rozpoznawanie znaków wymaga zasobów. Nasze API oferuje elastyczne sposoby równoważenia klasycznej triady czas-cena-jakość:
- Wybierz pomiędzy dokładnym rozpoznaniem a szybkim rozpoznaniem.
- Określ liczbę wątków przydzielonych do rozpoznawania lub pozwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
- Uwolnij procesor, przenosząc obliczenia do backendu .NET.
Szybkie rozpoznawanie – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Rozpoznaj pojedynczą linię
Jeśli obraz jest już przycięty do jednej linijki tekstu, można go rozpoznać w najszybszym możliwym trybie, bez automatycznych korekt, wykrywania struktury treści i innych czynności pochłaniających zasoby. Może przyspieszyć OCR nawet 7 razy szybciej niż normalny proces rozpoznawania.
Rozpoznaj pojedynczą linię tekstu na obrazie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)