Converti l’immagine in testo con Python OCR API tramite Java
Riconosci il testo nelle immagini con Python
Altre vetrine ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Perché aspirare.ocr per Python via Java?
Aspose.ocr per Python tramite Java integra perfettamente le capacità di riconoscimento dei caratteri ottici (OCR) nei tuoi notebook e applicazioni Python multipiattaforma. Con la nostra API intuitiva e ad alta velocità, è possibile estrarre senza sforzo il testo da scansioni, schermate, collegamenti Web o foto di smartphone, offrendo risultati pronti per il consolidamento, l’analisi o l’archiviazione. Riconoscere immagini scansionate, foto di smartphone, schermate e PDF scansionati, salvando i risultati in formati di documenti popolari. I filtri di pre-elaborazione avanzati maneggevano immagini ruotate, distorte e rumorose. Ottimizza le prestazioni scaricando le attività alla GPU.

OCR rapido e accurato
Ottieni risultati OCR ad alta velocità e accurati con il nostro Python avanzato tramite la tecnologia Java.
Supporto multilingue
Riconosci il testo in oltre 140 lingue, tra cui script latino, cirillico, arabo, persiano, indic e cinesi, garantendo la versatilità per le tue applicazioni Python tramite Java.
Supporto immagine flessibile
Elabora le immagini da scanner, telecamere e smartphone senza soluzione di continuità con Python tramite Java.
Precisione nel riconoscimento del personaggio cinese
Riconosci oltre 6.000 caratteri cinesi con precisione nei tuoi progetti Python tramite Java.
Preservare gli stili di carattere e la formattazione
Mantieni gli stili di carattere e la formattazione per una rappresentazione accurata del testo riconosciuto nelle tue applicazioni Python tramite Java.
Esempio di codice live
Avvia il riconoscimento del testo dalle immagini in sole tre righe di codice. Sperimenta la semplicità!
* Caricando i tuoi file o utilizzando il servizio, sei d'accordo con il nostro Termini di utilizzo E politica sulla riservatezza.
Converti l'immagine in testo
Altri esempi ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Scegli la tua preferenza
Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro capacità per selezionare la soluzione più efficiente.
Versatilità
Python via .NET
Uniformità
Python via Java
Prestazione
Python via C++
Compatibilità del backend di Java
Progettato come un modulo Python, la nostra libreria garantisce la compatibilità tra i principali sistemi operativi a supporto Java - tra cui Microsoft Windows, Linux e MacOS o le piattaforme cloud. Ciò consente di sviluppare applicazioni su una piattaforma e di eseguirle perfettamente su un’altra, eliminando la necessità di eventuali modifiche al codice.
Formati di file supportati
Aspose.OCR for Python via Java può funzionare con qualsiasi file Puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.
Immagini
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Batch OCR
- Multi-page PDF
- ZIP
- Folder
Risultati di riconoscimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installazione senza sforzo per Python tramite Java
Assepse.ocr per Python tramite Java viene consegnato come pacchetto Python o come file scaricabile con dipendenze minime. Facilmente installa nel tuo progetto e sei pronto a riconoscere i testi in più lingue supportate e salvare i risultati di riconoscimento in vari formati.
Richiedi una licenza di prova per dare il via allo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.
Potente OCR per applicazioni Python
La nostra libreria si integra facilmente, consentendo alle applicazioni Python di eseguire perfettamente su qualsiasi piattaforma: Desktop Windows, Windows Server, MacOS, Linux e Cloud.
140+ lingue di riconoscimento
La nostra API Python e Java OCR riconosce una pletora di lingue e sceneggiature di scrittura popolari, tra cui lingue miste:
Lasciare il rilevamento della lingua alla biblioteca o definire la lingua da solo per le prestazioni e l’affidabilità di riconoscimento migliorate.
- ** Latino esteso ** Alfabeto: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e 80+ in più;
- ** Cirillico ** Alphabet: russo, ucraino, kazako, serbo, bielorusso, bulgaro;
- Arabo, persiano, urdu;
- La sceneggiatura cinese e Devanagari, tra cui Hindi, Marathi, Bhojpuri e altri.
Filtri di elaborazione delle immagini migliorati
La precisione del riconoscimento ottico dei personaggi si basa fortemente sulla qualità dell’immagine originale. Assepse.ocr per Python tramite Java offre una vasta gamma di filtri di elaborazione delle immagini sia automatizzati che manuali per ottimizzare un’immagine prima della presentazione al motore OCR:
- Raddrizzare automaticamente le immagini leggermente inclinate.
- Correggi manualmente la rotazione di immagini gravemente distorte.
- Rimuovere automaticamente lo sporco, i punti, i graffi, l’abbagliamento, i gradienti indesiderati e altri tipi di rumore.
- Regola automaticamente il contrasto dell’immagine.
- Uspire automaticamente o ridimensionare manualmente l’immagine.
- Converti le immagini in bianco e nero o in scala di grigi.
- Invertire i colori dell’immagine, far apparire le aree di luce scure e scure appaiono.
- Aumenta lo spessore dei caratteri in un’immagine.
- Immagini rumorose sfocate durante la conservazione dei bordi delle lettere.
- Raddrizzare la pagina e correggere la distorsione dell’obiettivo della fotocamera nelle foto della pagina.
API specificate per vari tipi di documenti
ASPUSE.ocr per Python tramite Java offre reti neurali appositamente addestrate per estrarre testo da determinati tipi di immagini con massima precisione:
- Carte d’identità e passaporti scansionati o fotografati.
- Targhe di licenza per veicoli.
- Fatture.
- Entrate.
Checker ortografico incorporato
Sebbene Aspose.ocr per Python tramite Java fornisca un’elevata precisione di riconoscimento, difetti di stampa, sporcizia o caratteri non standard possono causare il riconoscimento in modo errato di determinati personaggi o parole. Per migliorare ulteriormente i risultati del riconoscimento, è possibile attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base al linguaggio di riconoscimento selezionato.
Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole che non sono presenti nei dizionari di ortografia comuni, è possibile fornire le tue liste di parole.
Riconoscimento batch efficiente
La nostra API OCR Python ti consente di semplificare il riconoscimento delle immagini. Utilizzare metodi versatili di elaborazione batch per l’elaborazione efficiente di più immagini in una singola chiamata:
- Riconosci i file PDF multi-pagine, TIFF.
- Elaborare tutti i file all’interno di una cartella.
- Gestire il riconoscimento per tutti i file in un archivio.
- Riconosci le immagini da un elenco specificato.
Imparare tramite esempi di Python
Esplora una varietà di esempi di Python progettati per aiutarti a cogliere rapidamente le funzioni e le capacità della nostra soluzione OCR. Ottieni rapidamente informazioni sulla creazione di soluzioni personalizzate che soddisfino i requisiti aziendali specifici.
Funzionalità e capacità
Aspose.OCR for Python via Java Esplora le caratteristiche avanzate di Aspose.ocr per Python
Foto OCR
Estrai il testo da foto di smartphone con precisione a livello di scansione.
PDF ricercabile
Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.
Riconoscimento dell’URL
Riconosci un’immagine dall’URL senza scaricarla localmente.
Riconoscimento di massa
Leggi tutte le immagini da documenti, cartelle e archivi multi-pagina.
Qualsiasi carattere e stile
Identificare e riconoscere il testo in tutti i caratteri e gli stili popolari.
Riconoscere il riconoscimento
Regola ogni parametro OCR per i migliori risultati di riconoscimento.
Checker ortografico
Migliora i risultati correggendo automaticamente le parole errate.
Trova il testo nelle immagini
Cerca testo o espressione regolare all’interno di una serie di immagini.
Confronta i testi delle immagini
Confronta i testi su due immagini, indipendentemente dal caso e dal layout.
Campioni di codice Python
Scopri i campioni di codice per integrare perfettamente Aspose.ocr per Python tramite Java nelle tue applicazioni.
Installazione senza sforzo
Come pacchetto Python o un file scaricabile con dipendenze minime, asppy.ocr per Python tramite Java garantisce una facile distribuzione. Integralo nel tuo progetto direttamente da Python e sei pronto a sfruttare le capacità OCR complete, salvare il riconoscimento risultati in vari formati.
post-installazione, inizia prontamente usando aspy.ocr per Python tramite Java, anche se con alcune limitazioni. Una licenza temporanea rimuove tutte le restrizioni della versione di prova per 30 giorni. Utilizzare questo periodo per avviare lo sviluppo di un’applicazione OCR pienamente funzionale, consentendo di prendere una decisione informata sull’acquisto Aspose.ocr per Python tramite Java in seguito.
Licenza di carico
lic = License()
lic.set_license(self.licPath)
Riconoscimento dell’immagine
La sfida principale nelle applicazioni OCR è la scarsità di scanner per gli utenti finali. La nostra API, perfettamente integrata con Python tramite Java, presenta robuste immagini di pre-elaborazione di immagini incorporate che maneggiano immagini ruotate, distorte e rumorose. In combinazione con il supporto per tutti i formati di immagini, consente un riconoscimento affidabile, anche dalle foto degli smartphone. La maggior parte della pre-elaborazione e della correzione dell’immagine sono automatizzate, che richiedono l’intervento solo in casi difficili.
Applica correzioni automatiche dell'immagine - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
La nostra API legge in modo abile qualsiasi immagine di scanner, telecamere o smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, file BMP. Il supporto completo per i documenti PDF multi-pagine, le immagini TIFF e DJVU garantisce la versatilità. Puoi anche fornire un’immagine dal Web tramite un URL.
I risultati del riconoscimento
vengono restituiti nei formati di documenti e di scambio di dati popolari: testo normale, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Riconosci PDF e salva i risultati in vari formati di output - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Ottimizzazione dell’utilizzo delle risorse
OCR offre un algoritmo di riconoscimento speciale per l’estrazione di contenuti da immagini con testo scarso e sfondi rumorosi/colorati. Questo metodo migliora significativamente l’accuratezza dell’OCR nei seguenti casi aziendali:
- Leggi il testo dalle foto di strada.
- Segmentare e identificare segnali stradali e cartelli all'interno delle immagini di strada.
- Individuare i prezzi e interpretare il testo estratto come prezzi.
- Trova e aggrega le regioni di interesse per le etichette alimentari, come informazioni nutrizionali o elenchi di ingredienti.
- Identificare e analizzare le targhe per auto.
- Estrai testo da menu e cataloghi.
Area aperta OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Estrazione del testo dalle foto di strada
OCR per Python offre un algoritmo di riconoscimento speciale che estrae il testo dalle targhe del veicolo, comprese le foto scure e sfocate. Il testo risultante può quindi essere salvato automaticamente nel database o verificato automaticamente.
Riconosci il numero dell'auto - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)