Padronanza della conversione da immagine a testo con Python tramite Java
Riconoscere il testo nelle immagini con Python
Più vetrine ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Perché Aspose.OCR per Python tramite Java?
Aspose.OCR per Python tramite Java integra perfettamente potenti funzionalità di riconoscimento ottico dei caratteri (OCR) nei tuoi notebook e applicazioni Python multipiattaforma. Con la nostra API intuitiva e ad alta velocità, puoi estrarre facilmente testo da scansioni, screenshot, collegamenti Web o foto di smartphone, fornendo risultati pronti per il consolidamento, l’analisi o l’archiviazione. Riconosci immagini scansionate, foto di smartphone, screenshot e PDF scansionati, salvando i risultati nei formati di documenti più diffusi. I filtri di preelaborazione avanzati gestiscono immagini ruotate, inclinate e rumorose. Ottimizza le prestazioni scaricando le attività sulla GPU.
OCR rapido e accurato
Ottieni risultati OCR accurati e ad alta velocità con la nostra tecnologia avanzata Python tramite Java.
Supporto multilingue
Riconosci testo in oltre 130 lingue, tra cui latino, cirillico, arabo, persiano, indiano e cinese, garantendo versatilità per le tue applicazioni Python tramite Java.
Supporto flessibile delle immagini
Elabora immagini da scanner, fotocamere e smartphone senza problemi con Python tramite Java.
Precisione nel riconoscimento dei caratteri cinesi
Riconosci oltre 6.000 caratteri cinesi con precisione nei tuoi progetti Python tramite Java.
Conserva stili di carattere e formattazione
Mantieni gli stili e la formattazione dei caratteri per una rappresentazione accurata del testo riconosciuto nelle tue applicazioni Python tramite Java.
Esempio di codice in tempo reale
Avvia il riconoscimento del testo dalle immagini in sole tre righe di codice. Sperimenta la semplicità!
*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.
Converti immagine in testo
Altri esempi ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Scegli la tua preferenza
Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro funzionalità per selezionare la soluzione più efficiente.
Versatilità
Python via .NET
Uniformità
Python via Java
Prestazione
Python via C++
Compatibilità back-end Java
Progettata come modulo Python, la nostra libreria garantisce la compatibilità con i principali sistemi operativi che supportano Java , inclusi Microsoft Windows, Linux e macOS o il piattaforme cloud. Ciò consente di sviluppare applicazioni su una piattaforma ed eseguirle senza problemi su un’altra, eliminando la necessità di eventuali modifiche al codice.
Formati di file supportati
Aspose.OCR for Python via Java può funzionare praticamente con qualsiasi file puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento vengono restituiti nei formati di file e di scambio dati più diffusi che possono essere salvati, importati in un database o analizzati in tempo reale.
immagini
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR batch
- Multi-page PDF
- ZIP
- Folder
Risultati del riconoscimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installazione semplice per Python tramite Java
Aspose.OCR per Python tramite Java viene fornito come pacchetto Python o come file scaricabile con dipendenze minime. Installalo facilmente nel tuo progetto e sarai pronto a riconoscere testi in più lingue supportate e a salvare i risultati del riconoscimento in vari formati.
Richiedi una licenza di prova per avviare lo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.
Potente OCR per applicazioni Python
La nostra libreria si integra facilmente, consentendo alle applicazioni Python di funzionare perfettamente su qualsiasi piattaforma: desktop Windows, Windows Server, macOS, Linux e cloud.
Oltre 130 lingue di riconoscimento
La nostra API OCR Python e Java riconosce una vasta gamma di linguaggi e script di scrittura popolari, inclusi linguaggi misti:
Lascia il rilevamento della lingua alla libreria o definisci tu stesso la lingua per prestazioni e affidabilità di riconoscimento migliorate.
- Alfabeto latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
- Alfabeto cirillico: russo, ucraino, kazako, serbo, bielorusso, bulgaro;
- arabo, persiano, urdu;
- Scrittura cinese e devanagari, inclusi hindi, marathi, bhojpuri e altri.
Filtri di elaborazione delle immagini migliorati
La precisione del riconoscimento ottico dei caratteri dipende in larga misura dalla qualità dell’immagine originale. Aspose.OCR per Python tramite Java offre una vasta gamma di filtri di elaborazione delle immagini sia automatizzati che manuali per ottimizzare un’immagine prima dell’invio al motore OCR:
- Raddrizza automaticamente le immagini leggermente inclinate.
- Correggere manualmente la rotazione delle immagini molto distorte.
- Rimuovi automaticamente sporco, macchie, graffi, riflessi, sfumature indesiderate e altri tipi di rumore.
- Regola automaticamente il contrasto dell’immagine.
- Aumenta automaticamente l’upscaling o ridimensiona manualmente l’immagine.
- Converti le immagini in bianco e nero o in scala di grigi.
- Inverte i colori dell’immagine, facendo apparire scure le aree chiare e chiare quelle scure.
- Aumenta lo spessore dei caratteri in un’immagine.
- Sfoca le immagini rumorose preservando i bordi delle lettere.
- Raddrizza l’inclinazione della pagina e correggi la distorsione dell’obiettivo della fotocamera nelle foto delle pagine.
API specializzate per vari tipi di documenti
Aspose.OCR per Python tramite Java offre reti neurali appositamente addestrate per estrarre testo da determinati tipi di immagini con la massima precisione:
- Carte d’identità e passaporti scannerizzati o fotografati.
- Targhe di veicoli.
- Fatture.
- Ricevute.
Controllo ortografico integrato
Sebbene Aspose.OCR per Python tramite Java fornisca un’elevata precisione di riconoscimento, difetti di stampa, caratteri sporchi o non standard possono causare il riconoscimento errato di alcuni caratteri o parole. Per migliorare ulteriormente i risultati del riconoscimento, puoi attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base alla lingua di riconoscimento selezionata.
Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole non presenti nei comuni dizionari ortografici, è possibile fornire i propri elenchi di parole.
Riconoscimento batch efficiente
La nostra API OCR Python ti consente di semplificare il riconoscimento delle immagini. Utilizza versatili metodi di elaborazione batch per l’elaborazione efficiente di più immagini in un’unica chiamata:
- Riconoscere file PDF e TIFF multipagina.
- Elabora tutti i file all’interno di una cartella.
- Gestire il riconoscimento di tutti i file in un archivio.
- Riconoscere le immagini da un elenco specificato.
Imparare tramite esempi Python
Esplora una varietà di esempi Python progettati per aiutarti a comprendere rapidamente le funzioni e le capacità della nostra soluzione OCR. Ottieni rapidamente informazioni dettagliate sulla creazione di soluzioni personalizzate che soddisfino i tuoi specifici requisiti aziendali.
Caratteristiche e capacità
Aspose.OCR for Python via Java Esplora le funzionalità avanzate di Aspose.OCR per Python
OCR di foto
Estrai testo dalle foto dello smartphone con precisione a livello di scansione.
PDF ricercabile
Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.
Riconoscimento dell’URL
Riconoscere un’immagine dall’URL senza scaricarla localmente.
Riconoscimento in blocco
Leggi tutte le immagini da documenti, cartelle e archivi multipagina.
Qualsiasi carattere e stile
Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.
Riconoscimento preciso
Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.
Correttore ortografico
Migliora i risultati correggendo automaticamente le parole errate.
Trova il testo nelle immagini
Cerca testo o espressione regolare all’interno di una serie di immagini.
Confronta i testi delle immagini
Confronta i testi su due immagini, indipendentemente dal caso e dal layout.
Esempi di codice Python
Scopri esempi di codice per integrare perfettamente Aspose.OCR per Python tramite Java nelle tue applicazioni.
Installazione semplice
Come pacchetto Python o file scaricabile con dipendenze minime, Aspose.OCR per Python tramite Java garantisce una facile distribuzione. Integralo nel tuo progetto direttamente da Python e sarai pronto a sfruttare le funzionalità OCR complete, salvando i risultati del riconoscimento in vari formati.
Dopo l’installazione, inizia subito a utilizzare Aspose.OCR per Python tramite Java, anche se con alcune limitazioni. Una licenza temporanea rimuove tutte le restrizioni della versione di prova per 30 giorni. Utilizza questo periodo per avviare lo sviluppo di un’applicazione OCR completamente funzionale, consentendoti di prendere una decisione informata sull’acquisto di Aspose.OCR per Python tramite Java in un secondo momento.
Carica licenza
lic = License()
lic.set_license(self.licPath)
Riconoscimento delle immagini
La sfida principale nelle applicazioni OCR è la scarsità di scanner per gli utenti finali. La nostra API, perfettamente integrata con Python tramite Java, presenta robusti filtri di pre-elaborazione delle immagini integrati che gestiscono immagini ruotate, inclinate e rumorose. In combinazione con il supporto per tutti i formati di immagine, consente un riconoscimento affidabile, anche dalle foto dello smartphone. La maggior parte della pre-elaborazione e della correzione delle immagini sono automatizzate e richiedono il tuo intervento solo in casi difficili.
Applica correzioni automatiche delle immagini - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Convertitore universale Python
La nostra API legge abilmente qualsiasi immagine da scanner, fotocamere o smartphone: documenti PDF, file JPEG, PNG, TIFF, GIF, BMP. Il supporto completo per documenti PDF multipagina, TIFF e immagini DjVu garantisce versatilità. Puoi anche fornire un’immagine dal Web tramite un URL.
I risultati del riconoscimento vengono restituiti nei formati di documenti e scambio dati più diffusi: testo semplice, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Riconosci PDF e salva i risultati in vari formati di output: Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Ottimizzazione dell’utilizzo delle risorse
L’OCR offre uno speciale algoritmo di riconoscimento per estrarre contenuto da immagini con testo sparso e sfondi rumorosi/colorati. Questo metodo migliora significativamente la precisione dell’OCR nei seguenti casi aziendali:
- Leggi il testo dalle foto di strada.
- Segmenta e identifica i segnali stradali e i cartelli all'interno delle immagini stradali.
- Individua i cartellini dei prezzi e interpreta il testo estratto come prezzi.
- Trova e aggrega le regioni di interesse sulle etichette degli alimenti, come informazioni nutrizionali o elenchi di ingredienti.
- Identificare e analizzare le targhe delle automobili.
- Estrai testo da menu e cataloghi.
OCR per aree aperte - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Estrazione di testo da foto di strada
OCR per Python offre uno speciale algoritmo di riconoscimento che estrae il testo dalle targhe dei veicoli, comprese le foto scure e sfocate. Il testo risultante può quindi essere salvato automaticamente nel database o verificato automaticamente.
Riconoscere il numero dell'auto - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)