Perché aspirare.ocr per Python via Java?

Aspose.ocr per Python tramite Java integra perfettamente le capacità di riconoscimento dei caratteri ottici (OCR) nei tuoi notebook e applicazioni Python multipiattaforma. Con la nostra API intuitiva e ad alta velocità, è possibile estrarre senza sforzo il testo da scansioni, schermate, collegamenti Web o foto di smartphone, offrendo risultati pronti per il consolidamento, l’analisi o l’archiviazione. Riconoscere immagini scansionate, foto di smartphone, schermate e PDF scansionati, salvando i risultati in formati di documenti popolari. I filtri di pre-elaborazione avanzati maneggevano immagini ruotate, distorte e rumorose. Ottimizza le prestazioni scaricando le attività alla GPU.

Illustration ocr

OCR rapido e accurato

Ottieni risultati OCR ad alta velocità e accurati con il nostro Python avanzato tramite la tecnologia Java.

Supporto multilingue

Riconosci il testo in oltre 140 lingue, tra cui script latino, cirillico, arabo, persiano, indic e cinesi, garantendo la versatilità per le tue applicazioni Python tramite Java.

Supporto immagine flessibile

Elabora le immagini da scanner, telecamere e smartphone senza soluzione di continuità con Python tramite Java.

Precisione nel riconoscimento del personaggio cinese

Riconosci oltre 6.000 caratteri cinesi con precisione nei tuoi progetti Python tramite Java.

Preservare gli stili di carattere e la formattazione

Mantieni gli stili di carattere e la formattazione per una rappresentazione accurata del testo riconosciuto nelle tue applicazioni Python tramite Java.

Esempio di codice live

Avvia il riconoscimento del testo dalle immagini in sole tre righe di codice. Sperimenta la semplicità!

Pronto a riconoscere Pronto a riconoscere Lascia cadere un file qui o fai clic per navigare *

* Caricando i tuoi file o utilizzando il servizio, sei d'accordo con il nostro Termini di utilizzo E politica sulla riservatezza.

Risultato di riconoscimento
 

Converti l'immagine in testo

Altri esempi >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Scegli la tua preferenza

Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro capacità per selezionare la soluzione più efficiente.

Versatilità

Python via .NET

Facile sviluppo, leggibilità e manutenibilità del codice
Vanta il maggior numero di funzionalità e riceve gli aggiornamenti più frequenti
La velocità complessiva può essere un po ‘più lenta di altre piattaforme

Uniformità

Python via Java

Usa la stessa libreria su qualsiasi piattaforma
Esegui perfettamente l’applicazione su qualsiasi dispositivo
Richiede l’ambiente di runtime Java (JRE) versione 8 o successiva

Prestazione

Python via C++

La velocità più rapida possibile indipendentemente dalla piattaforma
Un grande controllo sulla gestione delle risorse
Mirato agli sviluppatori esperti

Compatibilità del backend di Java

Progettato come un modulo Python, la nostra libreria garantisce la compatibilità tra i principali sistemi operativi a supporto Java - tra cui Microsoft Windows, Linux e MacOS o le piattaforme cloud. Ciò consente di sviluppare applicazioni su una piattaforma e di eseguirle perfettamente su un’altra, eliminando la necessità di eventuali modifiche al codice.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for Python via Java può funzionare con qualsiasi file Puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.

Immagini

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Batch OCR

  • Multi-page PDF
  • ZIP
  • Folder

Risultati di riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installazione senza sforzo per Python tramite Java

Assepse.ocr per Python tramite Java viene consegnato come pacchetto Python o come file scaricabile con dipendenze minime. Facilmente installa nel tuo progetto e sei pronto a riconoscere i testi in più lingue supportate e salvare i risultati di riconoscimento in vari formati.

Richiedi una licenza di prova per dare il via allo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.

Potente OCR per applicazioni Python

La nostra libreria si integra facilmente, consentendo alle applicazioni Python di eseguire perfettamente su qualsiasi piattaforma: Desktop Windows, Windows Server, MacOS, Linux e Cloud.

140+ lingue di riconoscimento

La nostra API Python e Java OCR riconosce una pletora di lingue e sceneggiature di scrittura popolari, tra cui lingue miste:

Lasciare il rilevamento della lingua alla biblioteca o definire la lingua da solo per le prestazioni e l’affidabilità di riconoscimento migliorate.

  • ** Latino esteso ** Alfabeto: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e 80+ in più;
  • ** Cirillico ** Alphabet: russo, ucraino, kazako, serbo, bielorusso, bulgaro;
  • Arabo, persiano, urdu;
  • La sceneggiatura cinese e Devanagari, tra cui Hindi, Marathi, Bhojpuri e altri.

Filtri di elaborazione delle immagini migliorati

La precisione del riconoscimento ottico dei personaggi si basa fortemente sulla qualità dell’immagine originale. Assepse.ocr per Python tramite Java offre una vasta gamma di filtri di elaborazione delle immagini sia automatizzati che manuali per ottimizzare un’immagine prima della presentazione al motore OCR:

  • Raddrizzare automaticamente le immagini leggermente inclinate.
  • Correggi manualmente la rotazione di immagini gravemente distorte.
  • Rimuovere automaticamente lo sporco, i punti, i graffi, l’abbagliamento, i gradienti indesiderati e altri tipi di rumore.
  • Regola automaticamente il contrasto dell’immagine.
  • Uspire automaticamente o ridimensionare manualmente l’immagine.
  • Converti le immagini in bianco e nero o in scala di grigi.
  • Invertire i colori dell’immagine, far apparire le aree di luce scure e scure appaiono.
  • Aumenta lo spessore dei caratteri in un’immagine.
  • Immagini rumorose sfocate durante la conservazione dei bordi delle lettere.
  • Raddrizzare la pagina e correggere la distorsione dell’obiettivo della fotocamera nelle foto della pagina.

API specificate per vari tipi di documenti

ASPUSE.ocr per Python tramite Java offre reti neurali appositamente addestrate per estrarre testo da determinati tipi di immagini con massima precisione:

  • Carte d’identità e passaporti scansionati o fotografati.
  • Targhe di licenza per veicoli.
  • Fatture.
  • Entrate.

Checker ortografico incorporato

Sebbene Aspose.ocr per Python tramite Java fornisca un’elevata precisione di riconoscimento, difetti di stampa, sporcizia o caratteri non standard possono causare il riconoscimento in modo errato di determinati personaggi o parole. Per migliorare ulteriormente i risultati del riconoscimento, è possibile attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base al linguaggio di riconoscimento selezionato.

Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole che non sono presenti nei dizionari di ortografia comuni, è possibile fornire le tue liste di parole.

Riconoscimento batch efficiente

La nostra API OCR Python ti consente di semplificare il riconoscimento delle immagini. Utilizzare metodi versatili di elaborazione batch per l’elaborazione efficiente di più immagini in una singola chiamata:

  • Riconosci i file PDF multi-pagine, TIFF.
  • Elaborare tutti i file all’interno di una cartella.
  • Gestire il riconoscimento per tutti i file in un archivio.
  • Riconosci le immagini da un elenco specificato.

Imparare tramite esempi di Python

Esplora una varietà di esempi di Python progettati per aiutarti a cogliere rapidamente le funzioni e le capacità della nostra soluzione OCR. Ottieni rapidamente informazioni sulla creazione di soluzioni personalizzate che soddisfino i requisiti aziendali specifici.

Funzionalità e capacità

Aspose.OCR for Python via Java Esplora le caratteristiche avanzate di Aspose.ocr per Python

Feature icon

Foto OCR

Estrai il testo da foto di smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.

Feature icon

Riconoscimento dell’URL

Riconosci un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento di massa

Leggi tutte le immagini da documenti, cartelle e archivi multi-pagina.

Feature icon

Qualsiasi carattere e stile

Identificare e riconoscere il testo in tutti i caratteri e gli stili popolari.

Feature icon

Riconoscere il riconoscimento

Regola ogni parametro OCR per i migliori risultati di riconoscimento.

Feature icon

Checker ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta i testi su due immagini, indipendentemente dal caso e dal layout.

Campioni di codice Python

Scopri i campioni di codice per integrare perfettamente Aspose.ocr per Python tramite Java nelle tue applicazioni.

Installazione senza sforzo

Come pacchetto Python o un file scaricabile con dipendenze minime, asppy.ocr per Python tramite Java garantisce una facile distribuzione. Integralo nel tuo progetto direttamente da Python e sei pronto a sfruttare le capacità OCR complete, salvare il riconoscimento risultati in vari formati.

post-installazione, inizia prontamente usando aspy.ocr per Python tramite Java, anche se con alcune limitazioni. Una licenza temporanea rimuove tutte le restrizioni della versione di prova per 30 giorni. Utilizzare questo periodo per avviare lo sviluppo di un’applicazione OCR pienamente funzionale, consentendo di prendere una decisione informata sull’acquisto Aspose.ocr per Python tramite Java in seguito.

Licenza di carico

lic = License()
lic.set_license(self.licPath)

Riconoscimento dell’immagine

La sfida principale nelle applicazioni OCR è la scarsità di scanner per gli utenti finali. La nostra API, perfettamente integrata con Python tramite Java, presenta robuste immagini di pre-elaborazione di immagini incorporate che maneggiano immagini ruotate, distorte e rumorose. In combinazione con il supporto per tutti i formati di immagini, consente un riconoscimento affidabile, anche dalle foto degli smartphone. La maggior parte della pre-elaborazione e della correzione dell’immagine sono automatizzate, che richiedono l’intervento solo in casi difficili.

Applica correzioni automatiche dell'immagine - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

La nostra API legge in modo abile qualsiasi immagine di scanner, telecamere o smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, file BMP. Il supporto completo per i documenti PDF multi-pagine, le immagini TIFF e DJVU garantisce la versatilità. Puoi anche fornire un’immagine dal Web tramite un URL. I risultati del riconoscimento

vengono restituiti nei formati di documenti e di scambio di dati popolari: testo normale, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Riconosci PDF e salva i risultati in vari formati di output - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Ottimizzazione dell’utilizzo delle risorse

OCR offre un algoritmo di riconoscimento speciale per l’estrazione di contenuti da immagini con testo scarso e sfondi rumorosi/colorati. Questo metodo migliora significativamente l’accuratezza dell’OCR nei seguenti casi aziendali:

  • Leggi il testo dalle foto di strada.
  • Segmentare e identificare segnali stradali e cartelli all'interno delle immagini di strada.
  • Individuare i prezzi e interpretare il testo estratto come prezzi.
  • Trova e aggrega le regioni di interesse per le etichette alimentari, come informazioni nutrizionali o elenchi di ingredienti.
  • Identificare e analizzare le targhe per auto.
  • Estrai testo da menu e cataloghi.

Area aperta OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Estrazione del testo dalle foto di strada

OCR per Python offre un algoritmo di riconoscimento speciale che estrae il testo dalle targhe del veicolo, comprese le foto scure e sfocate. Il testo risultante può quindi essere salvato automaticamente nel database o verificato automaticamente.

Riconosci il numero dell'auto - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)