Proč se rozhodnout pro Aspose.OCR pro Python přes .NET?

Vydejte se na cestu s Aspose.OCR pro Python přes .NET – všestranné a uživatelsky přívětivé OCR API. Zabudujte do svých aplikací Python funkcionalitu OCR s méně než 5 řádky kódu, čímž eliminujete potřebu složitých matematických nebo neuronových sítí. Náš výkonný OCR engine poskytuje bezkonkurenční rychlost a přesnost, podporuje 28 jazyků, včetně latinky, azbuky a čínského písma. Ať už se jedná o naskenované obrázky, fotografie ze smartphonu, snímky obrazovky nebo naskenované soubory PDF, získejte výsledky v oblíbených formátech pro výměnu dokumentů a dat. Využijte filtry předběžného zpracování ke zpracování otočených, zkreslených a zašuměných obrázků. Optimalizujte výkon rozpoznávání a zatížení systému přesunutím úloh náročných na zdroje na backend .NET.

Illustration ocr

Efektivní a přesné ovládání OCR

Zažijte bezkonkurenční rychlost a přesnost výsledků OCR s pokročilou technologií Python a .NET.

Vícejazyčná dokonalost

Snadno a přesně rozpoznávejte text ve 28 jazycích zahrnujících latinku, azbuku a čínské písmo.

Adaptabilní zpracování obrazu

Bez námahy zpracujte obrázky z různých zdrojů – skenery, fotoaparáty a chytré telefony – pomocí Pythonu a .NET.

Znalost čínského znaku

Dosáhněte přesného rozpoznání více než 6 000 čínských znaků a zajistěte přesnost pomocí Pythonu a .NET.

Zachování stylů a formátů písem

Udržujte styly písem a formátování pro přesnou reprezentaci textu, čímž se zvyšuje všestrannost s Pythonem a .NET.

Ukázka živého kódu

Zažijte jednoduchost: Převeďte obrázek na text pomocí pouhých tří řádků kódu Pythonu!

Připraveno k rozpoznání Připraveno k rozpoznání Sem přetáhněte soubor nebo kliknutím procházejte *

* Nahráním souborů nebo používáním služby souhlasíte s našimi Podmínky použití a Zásady ochrany osobních údajů.

Výsledek uznání
 

Převést obrázek na text

Objevte další příklady >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

.NET Empowerment pro Python v každém rohu

Aspose.OCR pro Python přes .NET bezproblémově funguje na jakékoli platformě podporující .NET Framework 4.0 a novější – ať už jde o místní počítač, web server nebo cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Podporované formáty souborů

Aspose.OCR for Python via .NET může pracovat prakticky s jakýmkoli souborem můžete získat ze skeneru nebo fotoaparátu. Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu souborů a dat, které lze uložit, importovat do databáze nebo analyzovat v reálném čase.

snímky

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Dávkové OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Výsledky rozpoznávání

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalace pro Python s backendem .NET

Aspose.OCR pro Python přes .NET je dodáván jako balíček Python s minimálními závislostmi nebo jako soubor ke stažení . Snadno jej nainstalujte do svého projektu a jste připraveni rozpoznávat texty v několika podporovaných jazycích a ukládat výsledky rozpoznávání v různých formátech.

Požádejte o zkušební licenci , abyste mohli zahájit vývoj plně funkční aplikace OCR bez omezení.

Výkonné OCR pro aplikace Python

Naše knihovna se snadno integruje a umožňuje aplikacím Pythonu bezproblémově běžet na jakékoli platformě – stolní Windows, Windows Server, macOS, Linux a cloud.

28 Rozpoznávací jazyky

Naše Python a .NET OCR API rozpoznává nepřeberné množství jazyků a populárních psacích skriptů, včetně smíšených jazyků:

Nechte detekci jazyka na knihovně nebo si jazyk definujte sami, abyste zvýšili výkon a spolehlivost rozpoznávání.

  • Rozšířená latinská abeceda: chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština;
  • Azbuka: běloruská, bulharská, kazašská, ruská, srbská, ukrajinská;
  • čínština: Více než 6 000 znaků;
  • Hindština.

Výkonné filtry pro zpracování

Přesnost a spolehlivost optického rozpoznávání znaků je vysoce závislá na kvalitě původního obrazu. Aspose.OCR pro Python přes .NET nabízí velké množství plně automatizovaných a manuálních filtrů pro zpracování obrazu, které vylepšují obraz před jeho odesláním do OCR enginu:

  • Automaticky narovnat obrázky zarovnané v mírném úhlu k horizontále.
  • Ručně otočte silně zkosené obrázky.
  • Automaticky odstraňte nečistoty, skvrny, škrábance, odlesky, nežádoucí přechody a další šum.
  • Automaticky upravte kontrast obrazu.
  • Automaticky upscale nebo ručně změnit velikost obrázku.
  • Převeďte obrázky na černobílé nebo ve stupních šedi.
  • Invertujte barvy obrazu tak, aby světlé oblasti vypadaly jako tmavé a tmavé oblasti světlé.
  • Zvětšete tloušťku znaků v obrázku.
  • Rozostření zašuměných obrázků při zachování okrajů písmen.
  • Vyrovnejte zakřivení stránky a opravte zkreslení čočky fotoaparátu pro fotografie stránek.

Optimalizováno pro konkrétní typy dokumentů

Aspose.OCR pro Python přes .NET nabízí speciálně vyškolené neuronové sítě pro extrahování textu z určitých typů obrázků s maximální přesností:

Vestavěná kontrola pravopisu

Přestože Aspose.OCR pro Python přes .NET poskytuje vysokou přesnost rozpoznávání, tiskové vady, nečistoty nebo nestandardní písma mohou způsobit nesprávné rozpoznání určitých znaků nebo slov. Pro další zlepšení výsledků rozpoznávání můžete zapnout kontrolu pravopisu, která vyhledá a automaticky opraví pravopisné chyby na základě zvoleného jazyka rozpoznávání.

Pokud rozpoznaný text obsahuje specializovanou terminologii, zkratky a další slova, která se nevyskytují v běžných slovnících pravopisu, můžete poskytnout vlastní seznamy slov.

Zjednodušené rozpoznávání dávky

Naše Python OCR API vás osvobodí od rozpoznávání obrázků jeden po druhém. Použijte různé metody dávkového zpracování k rozpoznání více obrázků v jednom volání:

  • Rozpoznávání vícestránkových souborů PDF, TIFF a DjVu.
  • Rozpoznávání všech souborů ve složce.
  • Rozpoznávání všech souborů v archivu.
  • Rozpoznání všech souborů ze seznamu.

Učení pomocí příkladů Pythonu

Aspose.OCR pro Python přes .NET poskytuje řadu příkladů napsaných v Pythonu, což vám umožní rychle se seznámit s jeho funkcemi a schopnosti. Získejte přehled pro vytváření přizpůsobených řešení, která splňují vaše obchodní potřeby Pythonu.

Vlastnosti a schopnosti

Aspose.OCR for Python via .NET Prozkoumejte pokročilé možnosti Aspose.OCR pro C++.

Feature icon

Foto OCR

Extrahujte text z fotografií smartphonu s přesností na úrovni skenování.

Feature icon

PDF s možností vyhledávání

Převeďte jakýkoli sken na plně prohledávatelný a indexovatelný dokument.

Feature icon

Rozpoznávání URL

Rozpoznejte obrázek z adresy URL, aniž byste jej museli lokálně stahovat.

Feature icon

Hromadné rozpoznání

Přečtěte si všechny obrázky z vícestránkových dokumentů, složek a archivů.

Feature icon

Libovolné písmo a styl

Identifikujte a rozpoznávejte text ve všech oblíbených typech písma a stylech.

Feature icon

Dolaďte rozpoznávání

Upravte každý parametr OCR pro nejlepší výsledky rozpoznávání.

Feature icon

Kontrola pravopisu

Zlepšete výsledky automatickým opravováním chybně napsaných slov.

Feature icon

Najděte text v obrázcích

Hledejte text nebo regulární výraz v sadě obrázků.

Feature icon

Porovnejte texty obrázků

Porovnejte texty na dvou obrázcích bez ohledu na velikost písmen a rozvržení.

Ukázky kódu Python

Ponořte se do ukázek kódu a bezproblémově integrujte Aspose.OCR pro Python přes .NET do vašich Pythonových aplikací.

Zvládnutí instalace v Pythonu

Aspose.OCR pro Python přes .NET je distribuován jako Python Wheel nebo samostatný balíček ke stažení. Integrace do vašeho projektu Python přímo z vašeho preferovaného Python Integrated Development Environment (IDE) je bezproblémový proces. Jednoduše jej nainstalujte a jste připraveni využít kompletní řadu možností OCR a uložit výsledky rozpoznávání v různých formátech.

Po instalaci můžete okamžitě začít používat Aspose.OCR pro Python přes .NET , i když s určitými omezeními. Dočasná licence ruší všechna omezení zkušební verze na 30 dní. Využijte toto období k zahájení vývoje plně funkční OCR aplikace, která vám umožní učinit informované rozhodnutí o nákupu Aspose.OCR pro Python přes .NET v pozdější fázi.

Načíst licenci

lic = License()
lic.set_license(self.licPath)

Rozpoznejte text ve Fotkách

Čtení textu z libovolného obsahu v Aspose.OCR pro Python přes .NET je stejně snadné jako volání univerzální metody rozpoznat().

Převést fotografii na text - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

Naše API obratně čte jakýkoli obrázek ze skenerů, fotoaparátů nebo chytrých telefonů: dokumenty PDF, JPEG, PNG, TIFF, GIF, BMP a dokonce i soubory DjVu. Plná podpora pro vícestránkové dokumenty PDF, TIFF a obrázky DjVu zajišťuje všestrannost. Můžete také poskytnout obrázek z webu prostřednictvím adresy URL.

Výsledky rozpoznávání se vracejí v oblíbených formátech pro výměnu dokumentů a dat: prostý text, PDF, Microsoft Word, Microsoft Excel, JSON a XML.

Rozpoznejte PDF a uložte výsledky do různých výstupních formátů - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimalizace zdrojů v Pythonu

Optické rozpoznávání znaků vyžaduje zdroje. Naše API nabízí flexibilní způsoby, jak vyvážit klasickou triádu čas-cena-kvalita:

  • Vyberte si mezi důkladným rozpoznáním a rychlým rozpoznáním.
  • Zadejte počet vláken přidělených pro rozpoznávání nebo povolte knihovně automaticky se škálovat podle počtu jader procesoru.
  • Uvolněte CPU přenesením výpočtů na backend .NET.

Rychlé rozpoznání - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Rozpoznat jeden řádek

Pokud je váš obrázek již oříznut na jeden řádek textu, lze jej rozpoznat v nejrychlejším možném režimu, bez automatických oprav, detekce struktury obsahu a dalších kroků náročných na zdroje. Dokáže zrychlit OCR až 7krát rychleji než normální proces rozpoznávání.

Rozpoznat jeden řádek textu na obrázku - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)