Perché Aspose.OCR per Python tramite Java?

Aspose.OCR per Python tramite Java integra perfettamente potenti funzionalità di riconoscimento ottico dei caratteri (OCR) nei tuoi notebook e applicazioni Python multipiattaforma. Con la nostra API intuitiva e ad alta velocità, puoi estrarre facilmente testo da scansioni, screenshot, collegamenti Web o foto di smartphone, fornendo risultati pronti per il consolidamento, l’analisi o l’archiviazione. Riconosci immagini scansionate, foto di smartphone, screenshot e PDF scansionati, salvando i risultati nei formati di documenti più diffusi. I filtri di preelaborazione avanzati gestiscono immagini ruotate, inclinate e rumorose. Ottimizza le prestazioni scaricando le attività sulla GPU.

Illustration ocr

OCR rapido e accurato

Ottieni risultati OCR accurati e ad alta velocità con la nostra tecnologia avanzata Python tramite Java.

Supporto multilingue

Riconosci il testo in 28 lingue, inclusi gli script latino, cirillico e cinese, garantendo versatilità per le tue applicazioni Python tramite Java.

Supporto flessibile delle immagini

Elabora immagini da scanner, fotocamere e smartphone senza problemi con Python tramite Java.

Precisione nel riconoscimento dei caratteri cinesi

Riconosci oltre 6.000 caratteri cinesi con precisione nei tuoi progetti Python tramite Java.

Conserva stili di carattere e formattazione

Mantieni gli stili e la formattazione dei caratteri per una rappresentazione accurata del testo riconosciuto nelle tue applicazioni Python tramite Java.

Esempio di codice in tempo reale

Avvia il riconoscimento del testo dalle immagini in sole tre righe di codice. Sperimenta la semplicità!

Pronto a riconoscere Pronto a riconoscere Trascina un file qui o fai clic per sfogliare *

*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.

Risultato del riconoscimento
 

Converti immagine in testo

Altri esempi >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Compatibilità back-end Java

Progettata come modulo Python, la nostra libreria garantisce la compatibilità con i principali sistemi operativi che supportano Java , inclusi Microsoft Windows, Linux e macOS o il piattaforme cloud. Ciò consente di sviluppare applicazioni su una piattaforma ed eseguirle senza problemi su un’altra, eliminando la necessità di eventuali modifiche al codice.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for Python via Java può funzionare praticamente con qualsiasi file puoi ottenerlo da uno scanner o da una fotocamera. I risultati del riconoscimento vengono restituiti nei formati di file e di scambio dati più diffusi che possono essere salvati, importati in un database o analizzati in tempo reale.

immagini

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR batch

  • Multi-page PDF
  • ZIP
  • Folder

Risultati del riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installazione semplice per Python tramite Java

Aspose.OCR per Python tramite Java viene fornito come pacchetto Python o come file scaricabile con dipendenze minime. Installalo facilmente nel tuo progetto e sarai pronto a riconoscere testi in più lingue supportate e a salvare i risultati del riconoscimento in vari formati.

Richiedi una licenza di prova per avviare lo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.

Potente OCR per applicazioni Python

La nostra libreria si integra facilmente, consentendo alle applicazioni Python di funzionare perfettamente su qualsiasi piattaforma: desktop Windows, Windows Server, macOS, Linux e cloud.

28 lingue di riconoscimento

La nostra API OCR Python e Java riconosce una vasta gamma di linguaggi e script di scrittura popolari, inclusi linguaggi misti:

Lascia il rilevamento della lingua alla libreria o definisci tu stesso la lingua per prestazioni e affidabilità di riconoscimento migliorate.

  • Alfabeto latino esteso: croato, ceco, danese, olandese, inglese, estone, finlandese, francese, tedesco, italiano, lettone, lituano, norvegese, polacco, portoghese, rumeno, slovacco, sloveno, spagnolo, svedese;
  • Alfabeto cirillico: bielorusso, bulgaro, kazako, russo, serbo, ucraino;
  • Cinese: oltre 6.000 caratteri;
  • Hindi.

Filtri di elaborazione delle immagini migliorati

La precisione del riconoscimento ottico dei caratteri dipende in larga misura dalla qualità dell’immagine originale. Aspose.OCR per Python tramite Java offre una vasta gamma di filtri di elaborazione delle immagini sia automatizzati che manuali per ottimizzare un’immagine prima dell’invio al motore OCR:

  • Raddrizza automaticamente le immagini leggermente inclinate.
  • Correggere manualmente la rotazione delle immagini molto distorte.
  • Rimuovi automaticamente sporco, macchie, graffi, riflessi, sfumature indesiderate e altri tipi di rumore.
  • Regola automaticamente il contrasto dell’immagine.
  • Aumenta automaticamente l’upscaling o ridimensiona manualmente l’immagine.
  • Converti le immagini in bianco e nero o in scala di grigi.
  • Inverte i colori dell’immagine, facendo apparire scure le aree chiare e chiare quelle scure.
  • Aumenta lo spessore dei caratteri in un’immagine.
  • Sfoca le immagini rumorose preservando i bordi delle lettere.
  • Raddrizza l’inclinazione della pagina e correggi la distorsione dell’obiettivo della fotocamera nelle foto delle pagine.

API specializzate per vari tipi di documenti

Aspose.OCR per Python tramite Java offre reti neurali appositamente addestrate per estrarre testo da determinati tipi di immagini con la massima precisione:

  • Carte d’identità e passaporti scannerizzati o fotografati.
  • Targhe di veicoli.
  • Fatture.
  • Ricevute.

Controllo ortografico integrato

Sebbene Aspose.OCR per Python tramite Java fornisca un’elevata precisione di riconoscimento, difetti di stampa, caratteri sporchi o non standard possono causare il riconoscimento errato di alcuni caratteri o parole. Per migliorare ulteriormente i risultati del riconoscimento, puoi attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base alla lingua di riconoscimento selezionata.

Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole non presenti nei comuni dizionari ortografici, è possibile fornire i propri elenchi di parole.

Riconoscimento batch efficiente

La nostra API OCR Python ti consente di semplificare il riconoscimento delle immagini. Utilizza versatili metodi di elaborazione batch per l’elaborazione efficiente di più immagini in un’unica chiamata:

  • Riconoscere file PDF e TIFF multipagina.
  • Elabora tutti i file all’interno di una cartella.
  • Gestire il riconoscimento di tutti i file in un archivio.
  • Riconoscere le immagini da un elenco specificato.

Imparare tramite esempi Python

Esplora una varietà di esempi Python progettati per aiutarti a comprendere rapidamente le funzioni e le capacità della nostra soluzione OCR. Ottieni rapidamente informazioni dettagliate sulla creazione di soluzioni personalizzate che soddisfino i tuoi specifici requisiti aziendali.

Caratteristiche e capacità

Aspose.OCR for Python via Java Esplora le funzionalità avanzate di Aspose.OCR per Python

Feature icon

OCR foto

Estrai testo dalle foto dello smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.

Feature icon

Riconoscimento dell’URL

Riconoscere un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento in blocco

Leggi tutte le immagini da documenti, cartelle e archivi multipagina.

Feature icon

Qualsiasi carattere e stile

Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.

Feature icon

Riconoscimento preciso

Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.

Feature icon

Correttore ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta testi su due immagini, indipendentemente dal caso e dal layout.

Esempi di codice Python

Scopri esempi di codice per integrare perfettamente Aspose.OCR per Python tramite Java nelle tue applicazioni.

Installazione semplice

Come pacchetto Python o file scaricabile con dipendenze minime, Aspose.OCR per Python tramite Java garantisce una facile distribuzione. Integralo nel tuo progetto direttamente da Python e sarai pronto a sfruttare le funzionalità OCR complete, salvando i risultati del riconoscimento in vari formati.

Dopo l’installazione, inizia subito a utilizzare Aspose.OCR per Python tramite Java, anche se con alcune limitazioni. Una licenza temporanea rimuove tutte le restrizioni della versione di prova per 30 giorni. Utilizza questo periodo per avviare lo sviluppo di un’applicazione OCR completamente funzionale, consentendoti di prendere una decisione informata sull’acquisto di Aspose.OCR per Python tramite Java in un secondo momento.

Carica licenza

lic = License()
lic.set_license(self.licPath)

Riconoscimento delle immagini

La sfida principale nelle applicazioni OCR è la scarsità di scanner per gli utenti finali. La nostra API, perfettamente integrata con Python tramite Java, presenta robusti filtri di pre-elaborazione delle immagini integrati che gestiscono immagini ruotate, inclinate e rumorose. In combinazione con il supporto per tutti i formati di immagine, consente un riconoscimento affidabile, anche dalle foto dello smartphone. La maggior parte della pre-elaborazione e della correzione delle immagini sono automatizzate e richiedono il tuo intervento solo in casi difficili.

Applica correzioni automatiche delle immagini - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Convertitore universale Python

La nostra API legge abilmente qualsiasi immagine da scanner, fotocamere o smartphone: documenti PDF, file JPEG, PNG, TIFF, GIF, BMP. Il supporto completo per documenti PDF multipagina, TIFF e immagini DjVu garantisce versatilità. Puoi anche fornire un’immagine dal Web tramite un URL.

I risultati del riconoscimento vengono restituiti nei formati di documenti e scambio dati più diffusi: testo semplice, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Riconosci PDF e salva i risultati in vari formati di output: Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Ottimizzazione dell’utilizzo delle risorse

L’OCR offre uno speciale algoritmo di riconoscimento per estrarre contenuto da immagini con testo sparso e sfondi rumorosi/colorati. Questo metodo migliora significativamente la precisione dell’OCR nei seguenti casi aziendali:

  • Leggi il testo dalle foto di strada.
  • Segmenta e identifica i segnali stradali e i cartelli all'interno delle immagini stradali.
  • Individua i cartellini dei prezzi e interpreta il testo estratto come prezzi.
  • Trova e aggrega le regioni di interesse sulle etichette degli alimenti, come informazioni nutrizionali o elenchi di ingredienti.
  • Identificare e analizzare le targhe delle automobili.
  • Estrai testo da menu e cataloghi.

OCR per aree aperte - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Estrazione di testo da foto di strada

OCR per Python offre uno speciale algoritmo di riconoscimento che estrae il testo dalle targhe dei veicoli, comprese le foto scure e sfocate. Il testo risultante può quindi essere salvato automaticamente nel database o verificato automaticamente.

Riconoscere il numero dell'auto - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)