OCR mistrovství v Pythonu: Powered by Aspose.OCR pro Python přes .NET
OCR: Transformujte obrázky na text pomocí Pythonu
Více vitrín ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Proč se rozhodnout pro Aspose.OCR pro Python přes .NET?
Vydejte se na cestu s Aspose.OCR pro Python přes .NET – všestranné a uživatelsky přívětivé OCR API. Zabudujte do svých aplikací Python funkcionalitu OCR s méně než 5 řádky kódu, čímž eliminujete potřebu složitých matematických nebo neuronových sítí. Náš výkonný OCR engine poskytuje bezkonkurenční rychlost a přesnost, podporuje 28 jazyků, včetně latinky, azbuky a čínského písma. Ať už se jedná o naskenované obrázky, fotografie ze smartphonu, snímky obrazovky nebo naskenované soubory PDF, získejte výsledky v oblíbených formátech pro výměnu dokumentů a dat. Využijte filtry předběžného zpracování ke zpracování otočených, zkreslených a zašuměných obrázků. Optimalizujte výkon rozpoznávání a zatížení systému přesunutím úloh náročných na zdroje na backend .NET.
Efektivní a přesné ovládání OCR
Zažijte bezkonkurenční rychlost a přesnost výsledků OCR s pokročilou technologií Python a .NET.
Vícejazyčná dokonalost
Snadno a přesně rozpoznávejte text ve 28 jazycích zahrnujících latinku, azbuku a čínské písmo.
Adaptabilní zpracování obrazu
Bez námahy zpracujte obrázky z různých zdrojů – skenery, fotoaparáty a chytré telefony – pomocí Pythonu a .NET.
Znalost čínského znaku
Dosáhněte přesného rozpoznání více než 6 000 čínských znaků a zajistěte přesnost pomocí Pythonu a .NET.
Zachování stylů a formátů písem
Udržujte styly písem a formátování pro přesnou reprezentaci textu, čímž se zvyšuje všestrannost s Pythonem a .NET.
Ukázka živého kódu
Zažijte jednoduchost: Převeďte obrázek na text pomocí pouhých tří řádků kódu Pythonu!
* Nahráním souborů nebo používáním služby souhlasíte s našimi Podmínky použití a Zásady ochrany osobních údajů.
Převést obrázek na text
Objevte další příklady ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
.NET Empowerment pro Python v každém rohu
Aspose.OCR pro Python přes .NET bezproblémově funguje na jakékoli platformě podporující .NET Framework 4.0 a novější – ať už jde o místní počítač, web server nebo cloud.
Podporované formáty souborů
Aspose.OCR for Python via .NET může pracovat prakticky s jakýmkoli souborem můžete získat ze skeneru nebo fotoaparátu. Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu souborů a dat, které lze uložit, importovat do databáze nebo analyzovat v reálném čase.
snímky
- JPEG
- PNG
- TIFF
- BMP
- GIF
Dávkové OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Výsledky rozpoznávání
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalace pro Python s backendem .NET
Aspose.OCR pro Python přes .NET je dodáván jako balíček Python s minimálními závislostmi nebo jako soubor ke stažení . Snadno jej nainstalujte do svého projektu a jste připraveni rozpoznávat texty v několika podporovaných jazycích a ukládat výsledky rozpoznávání v různých formátech.
Požádejte o zkušební licenci , abyste mohli zahájit vývoj plně funkční aplikace OCR bez omezení.
Výkonné OCR pro aplikace Python
Naše knihovna se snadno integruje a umožňuje aplikacím Pythonu bezproblémově běžet na jakékoli platformě – stolní Windows, Windows Server, macOS, Linux a cloud.
28 Rozpoznávací jazyky
Naše Python a .NET OCR API rozpoznává nepřeberné množství jazyků a populárních psacích skriptů, včetně smíšených jazyků:
Nechte detekci jazyka na knihovně nebo si jazyk definujte sami, abyste zvýšili výkon a spolehlivost rozpoznávání.
- Rozšířená latinská abeceda: chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština;
- Azbuka: běloruská, bulharská, kazašská, ruská, srbská, ukrajinská;
- čínština: Více než 6 000 znaků;
- Hindština.
Výkonné filtry pro zpracování
Přesnost a spolehlivost optického rozpoznávání znaků je vysoce závislá na kvalitě původního obrazu. Aspose.OCR pro Python přes .NET nabízí velké množství plně automatizovaných a manuálních filtrů pro zpracování obrazu, které vylepšují obraz před jeho odesláním do OCR enginu:
- Automaticky narovnat obrázky zarovnané v mírném úhlu k horizontále.
- Ručně otočte silně zkosené obrázky.
- Automaticky odstraňte nečistoty, skvrny, škrábance, odlesky, nežádoucí přechody a další šum.
- Automaticky upravte kontrast obrazu.
- Automaticky upscale nebo ručně změnit velikost obrázku.
- Převeďte obrázky na černobílé nebo ve stupních šedi.
- Invertujte barvy obrazu tak, aby světlé oblasti vypadaly jako tmavé a tmavé oblasti světlé.
- Zvětšete tloušťku znaků v obrázku.
- Rozostření zašuměných obrázků při zachování okrajů písmen.
- Vyrovnejte zakřivení stránky a opravte zkreslení čočky fotoaparátu pro fotografie stránek.
Optimalizováno pro konkrétní typy dokumentů
Aspose.OCR pro Python přes .NET nabízí speciálně vyškolené neuronové sítě pro extrahování textu z určitých typů obrázků s maximální přesností:
Vestavěná kontrola pravopisu
Přestože Aspose.OCR pro Python přes .NET poskytuje vysokou přesnost rozpoznávání, tiskové vady, nečistoty nebo nestandardní písma mohou způsobit nesprávné rozpoznání určitých znaků nebo slov. Pro další zlepšení výsledků rozpoznávání můžete zapnout kontrolu pravopisu, která vyhledá a automaticky opraví pravopisné chyby na základě zvoleného jazyka rozpoznávání.
Pokud rozpoznaný text obsahuje specializovanou terminologii, zkratky a další slova, která se nevyskytují v běžných slovnících pravopisu, můžete poskytnout vlastní seznamy slov.
Zjednodušené rozpoznávání dávky
Naše Python OCR API vás osvobodí od rozpoznávání obrázků jeden po druhém. Použijte různé metody dávkového zpracování k rozpoznání více obrázků v jednom volání:
- Rozpoznávání vícestránkových souborů PDF, TIFF a DjVu.
- Rozpoznávání všech souborů ve složce.
- Rozpoznávání všech souborů v archivu.
- Rozpoznání všech souborů ze seznamu.
Učení pomocí příkladů Pythonu
Aspose.OCR pro Python přes .NET poskytuje řadu příkladů napsaných v Pythonu, což vám umožní rychle se seznámit s jeho funkcemi a schopnosti. Získejte přehled pro vytváření přizpůsobených řešení, která splňují vaše obchodní potřeby Pythonu.
Vlastnosti a schopnosti
Aspose.OCR for Python via .NET Prozkoumejte pokročilé možnosti Aspose.OCR pro C++.
Foto OCR
Extrahujte text z fotografií smartphonu s přesností na úrovni skenování.
PDF s možností vyhledávání
Převeďte jakýkoli sken na plně prohledávatelný a indexovatelný dokument.
Rozpoznávání URL
Rozpoznejte obrázek z adresy URL, aniž byste jej museli lokálně stahovat.
Hromadné rozpoznání
Přečtěte si všechny obrázky z vícestránkových dokumentů, složek a archivů.
Libovolné písmo a styl
Identifikujte a rozpoznávejte text ve všech oblíbených typech písma a stylech.
Dolaďte rozpoznávání
Upravte každý parametr OCR pro nejlepší výsledky rozpoznávání.
Kontrola pravopisu
Zlepšete výsledky automatickým opravováním chybně napsaných slov.
Najděte text v obrázcích
Hledejte text nebo regulární výraz v sadě obrázků.
Porovnejte texty obrázků
Porovnejte texty na dvou obrázcích bez ohledu na velikost písmen a rozvržení.
Ukázky kódu Python
Ponořte se do ukázek kódu a bezproblémově integrujte Aspose.OCR pro Python přes .NET do vašich Pythonových aplikací.
Zvládnutí instalace v Pythonu
Aspose.OCR pro Python přes .NET je distribuován jako Python Wheel nebo samostatný balíček ke stažení. Integrace do vašeho projektu Python přímo z vašeho preferovaného Python Integrated Development Environment (IDE) je bezproblémový proces. Jednoduše jej nainstalujte a jste připraveni využít kompletní řadu možností OCR a uložit výsledky rozpoznávání v různých formátech.
Po instalaci můžete okamžitě začít používat Aspose.OCR pro Python přes .NET , i když s určitými omezeními. Dočasná licence ruší všechna omezení zkušební verze na 30 dní. Využijte toto období k zahájení vývoje plně funkční OCR aplikace, která vám umožní učinit informované rozhodnutí o nákupu Aspose.OCR pro Python přes .NET v pozdější fázi.
Načíst licenci
lic = License()
lic.set_license(self.licPath)
Rozpoznejte text ve Fotkách
Čtení textu z libovolného obsahu v Aspose.OCR pro Python přes .NET je stejně snadné jako volání univerzální metody rozpoznat().
Převést fotografii na text - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
Naše API obratně čte jakýkoli obrázek ze skenerů, fotoaparátů nebo chytrých telefonů: dokumenty PDF, JPEG, PNG, TIFF, GIF, BMP a dokonce i soubory DjVu. Plná podpora pro vícestránkové dokumenty PDF, TIFF a obrázky DjVu zajišťuje všestrannost. Můžete také poskytnout obrázek z webu prostřednictvím adresy URL.
Výsledky rozpoznávání se vracejí v oblíbených formátech pro výměnu dokumentů a dat: prostý text, PDF, Microsoft Word, Microsoft Excel, JSON a XML.
Rozpoznejte PDF a uložte výsledky do různých výstupních formátů - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimalizace zdrojů v Pythonu
Optické rozpoznávání znaků vyžaduje zdroje. Naše API nabízí flexibilní způsoby, jak vyvážit klasickou triádu čas-cena-kvalita:
- Vyberte si mezi důkladným rozpoznáním a rychlým rozpoznáním.
- Zadejte počet vláken přidělených pro rozpoznávání nebo povolte knihovně automaticky se škálovat podle počtu jader procesoru.
- Uvolněte CPU přenesením výpočtů na backend .NET.
Rychlé rozpoznání - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Rozpoznat jeden řádek
Pokud je váš obrázek již oříznut na jeden řádek textu, lze jej rozpoznat v nejrychlejším možném režimu, bez automatických oprav, detekce struktury obsahu a dalších kroků náročných na zdroje. Dokáže zrychlit OCR až 7krát rychleji než normální proces rozpoznávání.
Rozpoznat jeden řádek textu na obrázku - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)