OCR mistrovství v Pythonu: Powered by Aspose.OCR pro Python přes .NET
Rozpoznejte text v obrázcích pomocí Pythonu
Více vitrín ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Proč Aspose.OCR pro Python přes Javu?
Aspose.OCR pro Python prostřednictvím Javy bezproblémově integruje výkonné funkce optického rozpoznávání znaků (OCR) do vašich notebooků a aplikací Python pro více platforem. S naším intuitivním a vysokorychlostním rozhraním API můžete bez námahy extrahovat text ze skenů, snímků obrazovky, webových odkazů nebo fotografií ze smartphonu a poskytovat výsledky, které jsou připraveny ke konsolidaci, analýze nebo ukládání. Rozpoznejte naskenované obrázky, fotografie smartphonu, snímky obrazovky a naskenované soubory PDF a ukládejte výsledky v oblíbených formátech dokumentů. Pokročilé filtry předběžného zpracování zvládají otočené, zkosené a zašuměné obrázky. Optimalizujte výkon přenesením úloh na GPU.
Rychlé a přesné OCR
Dosáhněte vysokorychlostních a přesných výsledků OCR pomocí našeho pokročilého jazyka Python prostřednictvím technologie Java.
Vícejazyčná podpora
Rozpoznejte text ve 28 jazycích, včetně latinky, azbuky a čínského písma, čímž zajistíte všestrannost pro vaše Python aplikace prostřednictvím Javy.
Flexibilní podpora obrázků
Bezproblémově zpracujte obrázky ze skenerů, fotoaparátů a chytrých telefonů pomocí Pythonu prostřednictvím Javy.
Přesnost v rozpoznávání čínských znaků
Rozpoznejte ve svých projektech Python přes Javu přes 6 000 čínských znaků.
Zachovat styly písma a formátování
Udržujte styly písem a formátování pro přesnou reprezentaci rozpoznaného textu ve vašich aplikacích Python prostřednictvím Javy.
Ukázka živého kódu
Spusťte rozpoznávání textu z obrázků pomocí pouhých tří řádků kódu. Zažijte jednoduchost!
* Nahráním souborů nebo používáním služby souhlasíte s našimi Podmínky použití a Zásady ochrany osobních údajů.
Převést obrázek na text
Další příklady ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Kompatibilita s Java Backend
Naše knihovna, navržená jako modul Pythonu, zajišťuje kompatibilitu napříč hlavními operačními systémy podporujícími Java – včetně Microsoft Windows, Linux a macOS nebo cloudové platformy. To vám umožní vyvíjet aplikace na jedné platformě a bezproblémově je spouštět na jiné, čímž se eliminuje potřeba jakýchkoli úprav kódu.
Podporované formáty souborů
Aspose.OCR for Python via Java může pracovat prakticky s jakýmkoli souborem můžete získat ze skeneru nebo fotoaparátu. Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu souborů a dat, které lze uložit, importovat do databáze nebo analyzovat v reálném čase.
snímky
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Dávkové OCR
- Multi-page PDF
- ZIP
- Folder
Výsledky rozpoznávání
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Snadná instalace pro Python přes Java
Aspose.OCR pro Python přes Java je dodáván jako balíček Python nebo jako soubor ke stažení s minimálními závislostmi. Snadno jej nainstalujte do svého projektu a jste připraveni rozpoznávat texty v několika podporovaných jazycích a ukládat výsledky rozpoznávání v různých formátech.
Požádejte o zkušební licenci , abyste mohli zahájit vývoj plně funkční aplikace OCR bez omezení.
Výkonné OCR pro aplikace Python
Naše knihovna se snadno integruje a umožňuje aplikacím Pythonu bezproblémově běžet na jakékoli platformě – stolní Windows, Windows Server, macOS, Linux a cloud.
28 Rozpoznávací jazyky
Naše Python a Java OCR API rozpoznává nepřeberné množství jazyků a populárních skriptů pro psaní, včetně smíšených jazyků:
Nechte detekci jazyka na knihovně nebo si jazyk definujte sami, abyste zvýšili výkon a spolehlivost rozpoznávání.
- Rozšířená latinská abeceda: chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština;
- Azbuka: běloruská, bulharská, kazašská, ruská, srbská, ukrajinská;
- čínština: Více než 6 000 znaků;
- Hindština.
Vylepšené filtry pro zpracování obrazu
Přesnost optického rozpoznávání znaků do značné míry závisí na kvalitě původního obrazu. Aspose.OCR pro Python prostřednictvím Javy nabízí širokou škálu automatických i manuálních filtrů pro zpracování obrazu pro optimalizaci obrazu před odesláním do OCR enginu:
- Automaticky narovnat mírně nakloněné obrázky.
- Ručně opravte otočení silně zkosených snímků.
- Automaticky odstraňte nečistoty, skvrny, škrábance, odlesky, nežádoucí přechody a další typy hluku.
- Automaticky upravte kontrast obrazu.
- Automaticky upscale nebo ručně změnit velikost obrázku.
- Převeďte obrázky na černobílé nebo ve stupních šedi.
- Invertujte barvy obrazu, aby se světlé oblasti jevily jako tmavé a tmavé oblasti jako světlé.
- Zvětšete tloušťku znaků v obrázku.
- Rozostření zašuměných obrázků při zachování okrajů písmen.
- Vyrovnejte zkosení stránky a opravte zkreslení čočky fotoaparátu na fotografiích stránek.
Specializovaná rozhraní API pro různé typy dokumentů
Aspose.OCR pro Python prostřednictvím Javy nabízí speciálně vyškolené neuronové sítě pro extrahování textu z určitých typů obrázků s maximální přesností:
- Naskenované nebo vyfotografované občanské průkazy a pasy.
- SPZ vozidel.
- Faktury.
- Příjmy.
Vestavěná kontrola pravopisu
Přestože Aspose.OCR pro Python prostřednictvím Java poskytuje vysokou přesnost rozpoznávání, tiskové vady, nečistoty nebo nestandardní písma mohou způsobit nesprávné rozpoznání určitých znaků nebo slov. Pro další zlepšení výsledků rozpoznávání můžete zapnout kontrolu pravopisu, která vyhledá a automaticky opraví pravopisné chyby na základě zvoleného jazyka rozpoznávání.
Pokud rozpoznaný text obsahuje specializovanou terminologii, zkratky a další slova, která se nevyskytují v běžných slovnících pravopisu, můžete poskytnout vlastní seznamy slov.
Efektivní rozpoznávání šarže
Naše Python OCR API vám umožňuje zefektivnit rozpoznávání obrázků. Využijte všestranné metody dávkového zpracování pro efektivní zpracování více obrázků v jednom volání:
- Rozpoznejte vícestránkové soubory PDF a TIFF.
- Zpracujte všechny soubory ve složce.
- Rozpoznávání všech souborů v archivu.
- Rozpoznejte obrázky ze zadaného seznamu.
Učení pomocí příkladů Pythonu
Prozkoumejte různé příklady jazyka Python , které vám pomohou rychle pochopit funkce a možnosti našeho řešení OCR. Rychle získejte přehled o vytváření přizpůsobených řešení, která splňují vaše specifické obchodní požadavky.
Vlastnosti a schopnosti
Aspose.OCR for Python via Java Prozkoumejte pokročilé funkce Aspose.OCR pro Python
Foto OCR
Extrahujte text z fotografií smartphonu s přesností na úrovni skenování.
PDF s možností vyhledávání
Převeďte jakýkoli sken na plně prohledávatelný a indexovatelný dokument.
Rozpoznávání URL
Rozpoznejte obrázek z adresy URL, aniž byste jej museli lokálně stahovat.
Hromadné rozpoznání
Přečtěte si všechny obrázky z vícestránkových dokumentů, složek a archivů.
Libovolné písmo a styl
Identifikujte a rozpoznávejte text ve všech oblíbených typech písma a stylech.
Dolaďte rozpoznávání
Upravte každý parametr OCR pro nejlepší výsledky rozpoznávání.
Kontrola pravopisu
Zlepšete výsledky automatickým opravováním chybně napsaných slov.
Najděte text v obrázcích
Hledejte text nebo regulární výraz v sadě obrázků.
Porovnejte texty obrázků
Porovnejte texty na dvou obrázcích bez ohledu na velikost písmen a rozvržení.
Ukázky kódu Python
Objevte ukázky kódu pro bezproblémovou integraci Aspose.OCR pro Python prostřednictvím Javy do vašich aplikací.
Instalace bez námahy
Aspose.OCR pro Python prostřednictvím Java zajišťuje snadnou distribuci jako balíček Python nebo soubor ke stažení s minimálními závislostmi. Integrujte jej do svého projektu přímo z Pythonu a jste připraveni využít kompletní schopnosti OCR a uložit výsledky rozpoznávání v různých formátech.
Po instalaci začněte okamžitě používat Aspose.OCR pro Python prostřednictvím Javy, i když s určitými omezeními. Dočasná licence odstraňuje všechna omezení zkušební verze na 30 dní. Využijte toto období k zahájení vývoje plně funkční OCR aplikace, která vám umožní učinit informované rozhodnutí o nákupu Aspose.OCR pro Python přes Javu později.
Načíst licenci
lic = License()
lic.set_license(self.licPath)
Rozpoznávání obrazu
Hlavním problémem v aplikacích OCR je nedostatek skenerů pro koncové uživatele. Naše API, hladce integrované s Pythonem přes Javu, obsahuje robustní vestavěné filtry pro předběžné zpracování obrázků, které zvládají otočené, zkosené a zašuměné obrázky. V kombinaci s podporou všech obrazových formátů umožňuje spolehlivé rozpoznání i z fotografií ze smartphonu. Většina předzpracování a korekce obrazu je automatizovaná a vyžaduje váš zásah pouze v náročných případech.
Použít automatické opravy obrázků - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Naše API obratně čte jakýkoli obrázek ze skenerů, fotoaparátů nebo chytrých telefonů: dokumenty PDF, soubory JPEG, PNG, TIFF, GIF, BMP. Plná podpora pro vícestránkové dokumenty PDF, TIFF a obrázky DjVu zajišťuje všestrannost. Můžete také poskytnout obrázek z webu prostřednictvím adresy URL.
Výsledky rozpoznávání se vracejí v oblíbených formátech pro výměnu dokumentů a dat: prostý text, PDF, Microsoft Word, Microsoft Excel, JSON a XML.
Rozpoznejte PDF a uložte výsledky do různých výstupních formátů - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimalizace využití zdrojů
OCR nabízí speciální rozpoznávací algoritmus pro extrahování obsahu z obrázků s řídkým textem a hlučným/barevným pozadím. Tato metoda výrazně zlepšuje přesnost OCR v následujících obchodních případech:
- Přečtěte si text z pouličních fotografií.
- Segmentujte a identifikujte dopravní značky a vývěsní štíty v obrázcích ulic.
- Najděte cenovky a interpretujte extrahovaný text jako ceny.
- Najděte a seskupte oblasti zájmu na etiketách potravin, jako jsou nutriční informace nebo seznamy přísad.
- Identifikujte a analyzujte poznávací značky automobilů.
- Extrahujte text z nabídek a katalogů.
Otevřená oblast OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extrahování textu z fotografií ulice
OCR pro Python nabízí speciální rozpoznávací algoritmus, který extrahuje text z poznávacích značek vozidel, včetně tmavých a rozmazaných fotografií. Výsledný text lze následně automaticky uložit do databáze nebo automaticky ověřit.
Rozpoznat číslo auta - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)