Libreria OCR Python
Converti immagini in testo con Python OCR
Più vetrine ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Perché Aspose.OCR per Python tramite .NET?
Intraprendi un viaggio con Aspose OCR per Python tramite .NET: un’API OCR versatile e facile da usare. Incorpora la funzionalità OCR nelle tue applicazioni Python con meno di 5 righe di codice, eliminando la necessità di reti matematiche o neurali complesse. Il nostro potente motore OCR offre velocità e precisione senza pari, supportando oltre 130 lingue, tra cui inglese, cirillico, arabo, persiano, hindi, cinese, giapponese, coreano, tamil e molte altre. Che si tratti di immagini scansionate, foto di smartphone, screenshot o PDF scansionati, ottieni risultati nei formati di scambio di documenti e dati più diffusi. Sfrutta i filtri di pre-elaborazione per gestire immagini ruotate, inclinate e rumorose.
OCR efficiente e preciso
Sperimenta velocità e precisione senza precedenti nei risultati OCR con la tecnologia Python avanzata.
Multilingue
Riconosci testo in oltre 140 lingue: inglese, francese, tedesco, spagnolo, russo, cinese, hindi, giapponese, coreano, tamil, arabo, persiano e altre.
Universale
Elabora facilmente immagini da diverse fonti (scanner, fotocamere e smartphone) utilizzando Python.
Lingue asiatiche
Ottieni il riconoscimento preciso delle scritture cinese, araba, devanagari e dravidica, nonché di testi in lingue miste.
Conserva il layout
Mantieni la formattazione originale per una rappresentazione accurata del testo e riconosci le tabelle.
Esempio di codice in tempo reale
Converti un’immagine in testo in sole TRE righe di codice Python. Prova tu stesso!
*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.
Converti immagine in testo
Scopri altri esempi ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Scegli la tua preferenza
Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro funzionalità per selezionare la soluzione più efficiente.
Versatilità
Python via .NET
Uniformità
Python via Java
Prestazione
Python via C++
Corre ovunque
Indipendentemente dal nome, Aspose.OCR per Python tramite .NET non richiede l’installazione di .NET sulla piattaforma di destinazione. Il pacchetto di installazione include già tutti i componenti necessari e può funzionare perfettamente su qualsiasi piattaforma, sia essa una macchina locale, un server Web o il cloud.
Formati di file supportati
Aspose.OCR for Python via .NET può funzionare con qualsiasi file puoi ottenerlo da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.
Immagini
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR batch
- Multi-page PDF
- DjVu
- ZIP
- Folder
Risultati del riconoscimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installazione
Aspose.OCR per Python tramite .NET viene fornito come pacchetto Python con dipendenze minime o come file scaricabile o [pacchetto PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Installalo facilmente nel tuo progetto e sarai pronto a riconoscere testi in oltre 140 lingue e a salvare i risultati del riconoscimento in vari formati.
Richiedi una licenza di prova per avviare lo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.
OCR sotto Python
La nostra libreria si integra facilmente, consentendo alle applicazioni Python di funzionare perfettamente su qualsiasi piattaforma: desktop Windows, Windows Server, macOS, Linux e cloud.
Oltre 140 lingue di riconoscimento
La nostra libreria Java OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto di una vasta gamma di scritture europee, mediorientali e asiatiche, è adatto a qualsiasi paese e azienda.
Aspose OCR per Java riconosce il testo in documenti multilingue, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:
- Latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
- Alfabeto cirillico: russo, ucraino, kazako, bulgaro, inclusi testi misti cirillico/inglese;
- Arabo, persiano, urdu, compresi testi misti con inglese;
- Lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altre. Sono supportati anche testi in lingue miste.
Filtri di elaborazione potenti
La precisione e l’affidabilità del riconoscimento ottico dei caratteri dipendono fortemente dalla qualità dell’immagine originale. Aspose OCR per Python tramite .NET offre un gran numero di filtri di elaborazione delle immagini completamente automatizzati e manuali che migliorano un’immagine prima che venga inviata al motore OCR:
- Ruota automaticamente le immagini capovolte e ruotate.
- Rileva immagini invertite ed estrai testo bianco su nero.
- Rimuovi automaticamente sporco, macchie, graffi, riflessi, sfumature indesiderate e altri rumori.
- Regola automaticamente il contrasto dell’immagine.
- Aumenta automaticamente l’upscaling o ridimensiona manualmente l’immagine.
- Converti le immagini in bianco e nero o in scala di grigi.
- Trova aree dell’immagine potenzialmente problematiche e restituisci le informazioni sul tipo di difetto e le sue coordinate.
- Aumenta lo spessore dei caratteri in un’immagine.
- Sfoca le immagini rumorose preservando i bordi delle lettere.
- Raddrizza la curvatura della pagina e correggi la distorsione dell’obiettivo della fotocamera per le foto delle pagine.
Ottimizzato per tipi di documenti specifici
Aspose OCR per Python tramite .NET offre reti neurali appositamente addestrate per estrarre testo da determinati tipi di immagini con la massima precisione:
Controllo ortografico integrato
Sebbene la nostra libreria OCR Python fornisca un’elevata precisione di riconoscimento, difetti di stampa, caratteri sporchi o non standard potrebbero causare il riconoscimento errato di alcuni caratteri o parole. Per migliorare ulteriormente i risultati del riconoscimento, puoi attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base alla lingua di riconoscimento selezionata.
Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole non presenti nei comuni dizionari ortografici, è possibile fornire elenchi di parole personalizzati.
Riconoscimento batch
La nostra API OCR Python ti libera dal riconoscere le immagini una per una. Utilizza vari metodi di elaborazione batch per riconoscere più immagini in un’unica chiamata:
- Riconoscimento di file PDF, TIFF e DjVu multipagina.
- Riconoscimento di tutti i file in una cartella.
- Riconoscimento di tutti i file in un archivio.
- Riconoscimento di tutti i file da un elenco.
Apprendimento per campione
OCR per Python fornisce una serie di esempi scritti in Python, consentendoti di familiarizzare rapidamente con le sue funzioni e capacità. Ottieni informazioni dettagliate per creare soluzioni su misura per soddisfare le tue esigenze aziendali Python.
Caratteristiche e capacità
Aspose.OCR for Python via .NET risolve i tuoi compiti in modo facile e veloce.
OCR di foto
Estrai testo dalle foto dello smartphone con precisione a livello di scansione.
PDF ricercabile
Converti qualsiasi scansione in un documento completamente ricercabile, indicizzabile e modificabile.
Riconoscimento dell’URL
Riconoscere un’immagine dall’URL senza scaricarla localmente.
Riconoscimento in blocco
Leggi tutte le immagini da documenti, cartelle e archivi multipagina.
Qualsiasi carattere e stile
Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.
Riconoscimento preciso
Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.
Controllo ortografico
Migliora i risultati correggendo automaticamente le parole errate.
Trova il testo nelle immagini
Cerca testo o espressione regolare all’interno di una serie di immagini.
Confronta i testi delle immagini
Confronta i testi su due immagini, indipendentemente dal caso e dal layout.
Esempi di codice Python
Approfondisci esempi di codice per integrare perfettamente l’OCR nelle tue applicazioni Python.
Installazione
Distribuito come Python Wheel o pacchetto scaricabile autonomo, Aspose.OCR per Python tramite .NET è facilmente distribuito. L’integrazione nel tuo progetto Python, direttamente dal tuo ambiente di sviluppo integrato (IDE) Python preferito, è un processo semplice. Basta installarlo e sarai pronto a sfruttare la gamma completa di funzionalità OCR, salvando i risultati del riconoscimento in vari formati.
Dopo l’installazione, puoi immediatamente iniziare a utilizzare Aspose.OCR per Python tramite .NET , anche se con alcune limitazioni. Una licenza temporanea elimina tutte le restrizioni della versione di prova per 30 giorni. Utilizza questo periodo per avviare lo sviluppo di un’applicazione OCR completamente funzionale, consentendoti di prendere una decisione informata sull’acquisto di Aspose.OCR per Python tramite .NET in una fase successiva.
Carica licenza
lic = License()
lic.set_license(self.licPath)
Riconoscere il testo sulle foto
Leggere il testo da qualsiasi contenuto in Aspose OCR per Python è facile come chiamare un metodo di riconoscimento universale.
Converti foto in testo - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Convertitore universale Python
La nostra API legge abilmente qualsiasi immagine da scanner, fotocamere o smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, immagini BMP e persino file DjVu. Il supporto completo per documenti PDF multipagina, TIFF e immagini DjVu garantisce versatilità. Puoi anche fornire un’immagine dal Web tramite un URL.
I risultati del riconoscimento vengono restituiti nei formati di documenti e scambio dati più diffusi: testo semplice, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Riconosci PDF e salva i risultati in vari formati di output: Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Ottimizzazione delle risorse in Python
Il riconoscimento ottico dei caratteri richiede risorse. La nostra API offre modi flessibili per bilanciare la classica triade tempo-prezzo-qualità:
- Scegli tra riconoscimento approfondito e riconoscimento rapido.
- Specificare il numero di thread allocati per il riconoscimento o consentire alla libreria di adattarsi automaticamente al numero di core del processore.
- Libera la CPU scaricando i calcoli sul backend .NET.
Riconoscimento veloce - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Riconoscere la singola riga
Se la tua immagine è già ritagliata su una singola riga di testo, può essere riconosciuta nella modalità più veloce possibile, senza correzioni automatiche, rilevamento della struttura del contenuto e altri passaggi che consumano risorse. Può velocizzare l’OCR fino a 7 volte più velocemente del normale processo di riconoscimento.
Riconoscere una singola riga di testo sull'immagine - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)