Biblioteca OCR Python
Converti le immagini in testo con Python OCR
Altre vetrine ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Perché aspirare.ocr per Python tramite .NET?
Intraprendi un viaggio con Aspose OCR per Python tramite .NET-un’API OCR versatile e intuitiva. Incorporare funzionalità OCR nelle tue applicazioni Python con meno di 5 righe di codice, eliminando la necessità di reti matematiche o neurali complesse. Il nostro potente motore OCR offre velocità e precisione senza pari, a supporto di oltre 140 lingue, tra cui inglese, cirillico, arabo, persiano, hindi, cinese, giapponese, coreano, tamil e molti altri. Che si tratti di immagini scansionate, foto di smartphone, schermate o PDF scansionati, ottenere risultati in formati di documenti e scambi di dati popolari. Sfruttare i filtri di pre-elaborazione per gestire immagini ruotate, distorte e rumorose.

OCR efficiente e preciso
Sperimenta velocità e precisione senza pari nei risultati OCR con la tecnologia Python avanzata.
Multilingue
Riconosci il testo in più di 140 lingue: inglese, francese, tedesco, spagnolo, russo, cinese, hindi, giapponese, coreano, tamil, arabo, persiano e altro ancora.
Universale
Elaborare senza sforzo immagini da diverse fonti - scanner, telecamere e smartphone - usando Python.
Lingue asiatiche
Raggiungi un preciso riconoscimento di script cinesi, arabi, devanagari e dravidici, nonché testi in lingua mista.
Preservare il layout
Mantenere la formattazione della fonte per una rappresentazione accurata del testo e riconoscere le tabelle.
Esempio di codice live
Converti un’immagine in testo in sole tre righe di codice Python. Prova tu stesso!
* Caricando i tuoi file o utilizzando il servizio, sei d'accordo con il nostro Termini di utilizzo E politica sulla riservatezza.
Converti l'immagine in testo
Scopri altri esempi ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Scegli la tua preferenza
Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro capacità per selezionare la soluzione più efficiente.
Versatilità
Python via .NET
Uniformità
Python via Java
Prestazione
Python via C++
Corre ovunque
Indipendentemente dal nome, Aspose.ocr per Python tramite .NET non richiede l’installazione di .NET sulla piattaforma di destinazione. Il pacchetto di installazione viene già dotato di tutti i componenti richiesti e può funzionare perfettamente su qualsiasi piattaforma, che si tratti di un macchina, del server Web o del cloud locale.
Formati di file supportati
Aspose.OCR for Python via .NET può funzionare con qualsiasi file Puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.
Immagini
- JPEG
- PNG
- TIFF
- BMP
- GIF
Batch OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Risultati di riconoscimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installazione
Aspy.ocr per python tramite .net viene consegnato come pacchetto Python con dipendenze minime o come file scaricabile o pacchetto Pypi . Facilmente Installa nel tuo progetto e sei pronto a riconoscere i testi in oltre 140 lingue e salvare i risultati di riconoscimento in vari formati.
Richiedi una licenza di prova per dare il via allo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.
OCR sotto Python
La nostra libreria si integra facilmente, consentendo alle applicazioni Python di eseguire perfettamente su qualsiasi piattaforma: Desktop Windows, Windows Server, MacOS, Linux e Cloud.
140+ lingue di riconoscimento
La nostra libreria Java OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto per una vasta gamma di script di scrittura europei, medio-est e asiatici, è ben adattata per qualsiasi paese e attività.
ASPUTI OCR per Java riconosce il testo in documenti multilingue, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:
- ** Latino esteso **: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e altri 80+;
- ** Cirillico ** Alphabet: russo, ucraino, kazako, bulgaro, compresi testi citi -cirillici/inglesi;
- Arabo, persiano, urdu, compresi testi mescolati con l’inglese;
- Le lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altri. Sono anche supportati testi in lingua mista.
Potenti filtri di elaborazione
L’accuratezza e l’affidabilità del riconoscimento ottico dei caratteri dipendono fortemente dalla qualità dell’immagine originale. ASPEGE OCR per Python tramite .NET offre un gran numero di filtri di elaborazione delle immagini completamente automatizzati e manuali che migliorano un’immagine prima che venga inviata al motore OCR:
- Ruotare automaticamente le immagini sottosopra e ruotate.
- Rilevare immagini invertite ed estrarre il testo bianco su nero.
- Rimuovere automaticamente lo sporco, i punti, i graffi, l’abbagliamento, i gradienti indesiderati e altri rumore.
- Regola automaticamente il contrasto dell’immagine.
- Uspire automaticamente o ridimensionare manualmente l’immagine.
- Converti le immagini in bianco e nero o in scala di grigi.
- Trova aree potenzialmente problematiche dell’immagine e restituisci le informazioni sul tipo di difetto e sulle sue coordinate.
- Aumenta lo spessore dei caratteri in un’immagine.
- Immagini rumorose sfocate mentre preserva i bordi delle lettere.
- Raddrizza la curvatura della pagina e correggi la distorsione dell’obiettivo della fotocamera per le foto di pagina.
Ottimizzato per tipi di documenti specifici
Asposi OCR per Python tramite .NET offre reti neurali appositamente addestrate per estrarre il testo da determinati tipi di immagini con massima precisione:
Checker ortografico incorporato
Sebbene la nostra libreria OCR Python fornisca un’elevata precisione di riconoscimento, difetti di stampa, sporcizia o caratteri non standard possono causare il riconoscimento in modo errato di determinati personaggi o parole. Per migliorare ulteriormente i risultati del riconoscimento, è possibile attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base al linguaggio di riconoscimento selezionato.
Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole che non sono presenti nei dizionari di ortografia comuni, è possibile fornire le tue liste di parole.
Riconoscimento batch
La nostra API OCR Python ti libera dal riconoscere le immagini una per una. Utilizzi vari metodi di elaborazione batch per riconoscere più immagini in una chiamata:
- Riconoscimento di file PDF, TIFF e DJVU multi-pagina.
- Riconoscimento di tutti i file in una cartella.
- Riconoscimento di tutti i file in un archivio.
- Riconoscimento di tutti i file da un elenco.
Apprendimento per campione
OCR per Python fornisce una serie di Esempi scritto in Python, permettendoti di conoscerti rapidamente con le sue funzioni e capacità. Ottieni approfondimenti per la creazione di soluzioni su misura per soddisfare le tue esigenze aziendali di Python.
Funzionalità e capacità
Aspose.OCR for Python via .NET Aspose.ocr per Python tramite .NET risolve le tue attività veloci e facili.
Foto OCR
Estrai il testo da foto di smartphone con precisione a livello di scansione.
PDF ricercabile
Converti qualsiasi scansione in un documento completamente ricercabile, indicizzabile e modificabile.
Riconoscimento dell’URL
Riconosci un’immagine dall’URL senza scaricarla localmente.
Riconoscimento di massa
Leggi tutte le immagini da documenti, cartelle e archivi multi-pagina.
Qualsiasi carattere e stile
Identificare e riconoscere il testo in tutti i caratteri e gli stili popolari.
Riconoscere il riconoscimento
Regola ogni parametro OCR per i migliori risultati di riconoscimento.
Checker ortografico
Migliora i risultati correggendo automaticamente le parole errate.
Trova il testo nelle immagini
Cerca testo o espressione regolare all’interno di una serie di immagini.
Confronta i testi delle immagini
Confronta i testi su due immagini, indipendentemente dal caso e dal layout.
Campioni di codice Python
Approfondisci i campioni di codice per integrare perfettamente OCR nelle tue applicazioni Python.
Installazione
Distribuito come una ruota Python o un pacchetto scaricabile autonomo, Aspose.ocr per Python tramite .NET è facilmente distribuito. L’integrazione nel tuo progetto Python, direttamente dal tuo ambiente di sviluppo integrato Python preferito (IDE), è un processo senza soluzione di continuità. Basta installarlo e sei pronto a sfruttare la gamma completa di capacità OCR, salvare i risultati di riconoscimento in vari formati.
post-installazione, puoi iniziare prontamente a usare aspy.ocr per python tramite .net, anche se con alcune limitazioni. Una licenza temporanea solleva tutte le restrizioni della versione di prova per 30 giorni. Utilizzare questo periodo per avviare lo sviluppo di un’applicazione OCR pienamente funzionale, consentendo di prendere una decisione informata sull’acquisto Aspy.ocr per Python tramite .NET in una fase successiva.
Licenza di carico
lic = License()
lic.set_license(self.licPath)
Riconosci il testo sulle foto
Leggere il testo da qualsiasi contenuto in Aspose OCR per Python è facile come chiamare un metodo di riconoscimento universale.
Converti la foto in testo - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
La nostra API legge in modo abile qualsiasi immagine di scanner, telecamere o smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, immagini BMP e persino file DJVU. Il supporto completo per i documenti PDF multi-pagine, le immagini TIFF e DJVU garantisce la versatilità. Puoi anche fornire un’immagine dal Web tramite un URL.
I risultati del riconoscimento
vengono restituiti nei formati di documenti e di scambio di dati popolari: testo normale, PDF, Microsoft Word, Microsoft Excel, JSON e XML.
Riconosci PDF e salva i risultati in vari formati di output - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Ottimizzazione delle risorse in Python
Il riconoscimento ottico del personaggio richiede risorse. La nostra API offre modi flessibili per bilanciare la classica triade di qualità del prezzo temporale:
- Scegli tra riconoscimento approfondito e riconoscimento rapido.
- Specificare il numero di thread assegnati per il riconoscimento o consentire alla libreria di ridimensionare automaticamente il numero di core del processore.
- Libera la CPU scaricando i calcoli sul backend .NET.
Riconoscimento rapido - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Riconosci singola riga
Se la tua immagine è già tagliata a una singola riga di testo, può essere riconosciuta nella modalità più rapida possibile, senza correzioni automatizzate, rilevamento della struttura del contenuto e altri passaggi che consumano le risorse. Può accelerare OCR fino a 7 volte più veloce del normale processo di riconoscimento.
Riconoscere una singola riga di testo sull'immagine - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)