Proč Aspose.OCR pro Python přes Javu?

Aspose.OCR pro Python prostřednictvím Javy bezproblémově integruje výkonné funkce optického rozpoznávání znaků (OCR) do vašich notebooků a aplikací Python pro více platforem. S naším intuitivním a vysokorychlostním rozhraním API můžete bez námahy extrahovat text ze skenů, snímků obrazovky, webových odkazů nebo fotografií ze smartphonu a poskytovat výsledky, které jsou připraveny ke konsolidaci, analýze nebo ukládání. Rozpoznejte naskenované obrázky, fotografie smartphonu, snímky obrazovky a naskenované soubory PDF a ukládejte výsledky v oblíbených formátech dokumentů. Pokročilé filtry předběžného zpracování zvládají otočené, zkosené a zašuměné obrázky. Optimalizujte výkon přenesením úloh na GPU.

Illustration ocr

Rychlé a přesné OCR

Dosáhněte vysokorychlostních a přesných výsledků OCR pomocí našeho pokročilého jazyka Python prostřednictvím technologie Java.

Vícejazyčná podpora

Rozpoznejte text ve 28 jazycích, včetně latinky, azbuky a čínského písma, čímž zajistíte všestrannost pro vaše Python aplikace prostřednictvím Javy.

Flexibilní podpora obrázků

Bezproblémově zpracujte obrázky ze skenerů, fotoaparátů a chytrých telefonů pomocí Pythonu prostřednictvím Javy.

Přesnost v rozpoznávání čínských znaků

Rozpoznejte ve svých projektech Python přes Javu přes 6 000 čínských znaků.

Zachovat styly písma a formátování

Udržujte styly písem a formátování pro přesnou reprezentaci rozpoznaného textu ve vašich aplikacích Python prostřednictvím Javy.

Ukázka živého kódu

Spusťte rozpoznávání textu z obrázků pomocí pouhých tří řádků kódu. Zažijte jednoduchost!

Připraveno k rozpoznání Připraveno k rozpoznání Sem přetáhněte soubor nebo kliknutím procházejte *

* Nahráním souborů nebo používáním služby souhlasíte s našimi Podmínky použití a Zásady ochrany osobních údajů.

Výsledek uznání
 

Převést obrázek na text

Další příklady >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Kompatibilita s Java Backend

Naše knihovna, navržená jako modul Pythonu, zajišťuje kompatibilitu napříč hlavními operačními systémy podporujícími Java – včetně Microsoft Windows, Linux a macOS nebo cloudové platformy. To vám umožní vyvíjet aplikace na jedné platformě a bezproblémově je spouštět na jiné, čímž se eliminuje potřeba jakýchkoli úprav kódu.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Podporované formáty souborů

Aspose.OCR for Python via Java může pracovat prakticky s jakýmkoli souborem můžete získat ze skeneru nebo fotoaparátu. Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu souborů a dat, které lze uložit, importovat do databáze nebo analyzovat v reálném čase.

snímky

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Dávkové OCR

  • Multi-page PDF
  • ZIP
  • Folder

Výsledky rozpoznávání

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Snadná instalace pro Python přes Java

Aspose.OCR pro Python přes Java je dodáván jako balíček Python nebo jako soubor ke stažení s minimálními závislostmi. Snadno jej nainstalujte do svého projektu a jste připraveni rozpoznávat texty v několika podporovaných jazycích a ukládat výsledky rozpoznávání v různých formátech.

Požádejte o zkušební licenci , abyste mohli zahájit vývoj plně funkční aplikace OCR bez omezení.

Výkonné OCR pro aplikace Python

Naše knihovna se snadno integruje a umožňuje aplikacím Pythonu bezproblémově běžet na jakékoli platformě – stolní Windows, Windows Server, macOS, Linux a cloud.

28 Rozpoznávací jazyky

Naše Python a Java OCR API rozpoznává nepřeberné množství jazyků a populárních skriptů pro psaní, včetně smíšených jazyků:

Nechte detekci jazyka na knihovně nebo si jazyk definujte sami, abyste zvýšili výkon a spolehlivost rozpoznávání.

  • Rozšířená latinská abeceda: chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština;
  • Azbuka: běloruská, bulharská, kazašská, ruská, srbská, ukrajinská;
  • čínština: Více než 6 000 znaků;
  • Hindština.

Vylepšené filtry pro zpracování obrazu

Přesnost optického rozpoznávání znaků do značné míry závisí na kvalitě původního obrazu. Aspose.OCR pro Python prostřednictvím Javy nabízí širokou škálu automatických i manuálních filtrů pro zpracování obrazu pro optimalizaci obrazu před odesláním do OCR enginu:

  • Automaticky narovnat mírně nakloněné obrázky.
  • Ručně opravte otočení silně zkosených snímků.
  • Automaticky odstraňte nečistoty, skvrny, škrábance, odlesky, nežádoucí přechody a další typy hluku.
  • Automaticky upravte kontrast obrazu.
  • Automaticky upscale nebo ručně změnit velikost obrázku.
  • Převeďte obrázky na černobílé nebo ve stupních šedi.
  • Invertujte barvy obrazu, aby se světlé oblasti jevily jako tmavé a tmavé oblasti jako světlé.
  • Zvětšete tloušťku znaků v obrázku.
  • Rozostření zašuměných obrázků při zachování okrajů písmen.
  • Vyrovnejte zkosení stránky a opravte zkreslení čočky fotoaparátu na fotografiích stránek.

Specializovaná rozhraní API pro různé typy dokumentů

Aspose.OCR pro Python prostřednictvím Javy nabízí speciálně vyškolené neuronové sítě pro extrahování textu z určitých typů obrázků s maximální přesností:

  • Naskenované nebo vyfotografované občanské průkazy a pasy.
  • SPZ vozidel.
  • Faktury.
  • Příjmy.

Vestavěná kontrola pravopisu

Přestože Aspose.OCR pro Python prostřednictvím Java poskytuje vysokou přesnost rozpoznávání, tiskové vady, nečistoty nebo nestandardní písma mohou způsobit nesprávné rozpoznání určitých znaků nebo slov. Pro další zlepšení výsledků rozpoznávání můžete zapnout kontrolu pravopisu, která vyhledá a automaticky opraví pravopisné chyby na základě zvoleného jazyka rozpoznávání.

Pokud rozpoznaný text obsahuje specializovanou terminologii, zkratky a další slova, která se nevyskytují v běžných slovnících pravopisu, můžete poskytnout vlastní seznamy slov.

Efektivní rozpoznávání šarže

Naše Python OCR API vám umožňuje zefektivnit rozpoznávání obrázků. Využijte všestranné metody dávkového zpracování pro efektivní zpracování více obrázků v jednom volání:

  • Rozpoznejte vícestránkové soubory PDF a TIFF.
  • Zpracujte všechny soubory ve složce.
  • Rozpoznávání všech souborů v archivu.
  • Rozpoznejte obrázky ze zadaného seznamu.

Učení pomocí příkladů Pythonu

Prozkoumejte různé příklady jazyka Python , které vám pomohou rychle pochopit funkce a možnosti našeho řešení OCR. Rychle získejte přehled o vytváření přizpůsobených řešení, která splňují vaše specifické obchodní požadavky.

Vlastnosti a schopnosti

Aspose.OCR for Python via Java Prozkoumejte pokročilé funkce Aspose.OCR pro Python

Feature icon

Foto OCR

Extrahujte text z fotografií smartphonu s přesností na úrovni skenování.

Feature icon

PDF s možností vyhledávání

Převeďte jakýkoli sken na plně prohledávatelný a indexovatelný dokument.

Feature icon

Rozpoznávání URL

Rozpoznejte obrázek z adresy URL, aniž byste jej museli lokálně stahovat.

Feature icon

Hromadné rozpoznání

Přečtěte si všechny obrázky z vícestránkových dokumentů, složek a archivů.

Feature icon

Libovolné písmo a styl

Identifikujte a rozpoznávejte text ve všech oblíbených typech písma a stylech.

Feature icon

Dolaďte rozpoznávání

Upravte každý parametr OCR pro nejlepší výsledky rozpoznávání.

Feature icon

Kontrola pravopisu

Zlepšete výsledky automatickým opravováním chybně napsaných slov.

Feature icon

Najděte text v obrázcích

Hledejte text nebo regulární výraz v sadě obrázků.

Feature icon

Porovnejte texty obrázků

Porovnejte texty na dvou obrázcích bez ohledu na velikost písmen a rozvržení.

Ukázky kódu Python

Objevte ukázky kódu pro bezproblémovou integraci Aspose.OCR pro Python prostřednictvím Javy do vašich aplikací.

Instalace bez námahy

Aspose.OCR pro Python prostřednictvím Java zajišťuje snadnou distribuci jako balíček Python nebo soubor ke stažení s minimálními závislostmi. Integrujte jej do svého projektu přímo z Pythonu a jste připraveni využít kompletní schopnosti OCR a uložit výsledky rozpoznávání v různých formátech.

Po instalaci začněte okamžitě používat Aspose.OCR pro Python prostřednictvím Javy, i když s určitými omezeními. Dočasná licence odstraňuje všechna omezení zkušební verze na 30 dní. Využijte toto období k zahájení vývoje plně funkční OCR aplikace, která vám umožní učinit informované rozhodnutí o nákupu Aspose.OCR pro Python přes Javu později.

Načíst licenci

lic = License()
lic.set_license(self.licPath)

Rozpoznávání obrazu

Hlavním problémem v aplikacích OCR je nedostatek skenerů pro koncové uživatele. Naše API, hladce integrované s Pythonem přes Javu, obsahuje robustní vestavěné filtry pro předběžné zpracování obrázků, které zvládají otočené, zkosené a zašuměné obrázky. V kombinaci s podporou všech obrazových formátů umožňuje spolehlivé rozpoznání i z fotografií ze smartphonu. Většina předzpracování a korekce obrazu je automatizovaná a vyžaduje váš zásah pouze v náročných případech.

Použít automatické opravy obrázků - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Naše API obratně čte jakýkoli obrázek ze skenerů, fotoaparátů nebo chytrých telefonů: dokumenty PDF, soubory JPEG, PNG, TIFF, GIF, BMP. Plná podpora pro vícestránkové dokumenty PDF, TIFF a obrázky DjVu zajišťuje všestrannost. Můžete také poskytnout obrázek z webu prostřednictvím adresy URL.

Výsledky rozpoznávání se vracejí v oblíbených formátech pro výměnu dokumentů a dat: prostý text, PDF, Microsoft Word, Microsoft Excel, JSON a XML.

Rozpoznejte PDF a uložte výsledky do různých výstupních formátů - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimalizace využití zdrojů

OCR nabízí speciální rozpoznávací algoritmus pro extrahování obsahu z obrázků s řídkým textem a hlučným/barevným pozadím. Tato metoda výrazně zlepšuje přesnost OCR v následujících obchodních případech:

  • Přečtěte si text z pouličních fotografií.
  • Segmentujte a identifikujte dopravní značky a vývěsní štíty v obrázcích ulic.
  • Najděte cenovky a interpretujte extrahovaný text jako ceny.
  • Najděte a seskupte oblasti zájmu na etiketách potravin, jako jsou nutriční informace nebo seznamy přísad.
  • Identifikujte a analyzujte poznávací značky automobilů.
  • Extrahujte text z nabídek a katalogů.

Otevřená oblast OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extrahování textu z fotografií ulice

OCR pro Python nabízí speciální rozpoznávací algoritmus, který extrahuje text z poznávacích značek vozidel, včetně tmavých a rozmazaných fotografií. Výsledný text lze následně automaticky uložit do databáze nebo automaticky ověřit.

Rozpoznat číslo auta - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)