Perché Aspose.OCR per Python tramite .NET?

Intraprendi un viaggio con Aspose OCR per Python tramite .NET: un’API OCR versatile e facile da usare. Incorpora la funzionalità OCR nelle tue applicazioni Python con meno di 5 righe di codice, eliminando la necessità di reti matematiche o neurali complesse. Il nostro potente motore OCR offre velocità e precisione senza pari, supportando oltre 130 lingue, tra cui inglese, cirillico, arabo, persiano, hindi, cinese, giapponese, coreano, tamil e molte altre. Che si tratti di immagini scansionate, foto di smartphone, screenshot o PDF scansionati, ottieni risultati nei formati di scambio di documenti e dati più diffusi. Sfrutta i filtri di pre-elaborazione per gestire immagini ruotate, inclinate e rumorose.

Illustration ocr

OCR efficiente e preciso

Sperimenta velocità e precisione senza precedenti nei risultati OCR con la tecnologia Python avanzata.

Multilingue

Riconosci testo in oltre 140 lingue: inglese, francese, tedesco, spagnolo, russo, cinese, hindi, giapponese, coreano, tamil, arabo, persiano e altre.

Universale

Elabora facilmente immagini da diverse fonti (scanner, fotocamere e smartphone) utilizzando Python.

Lingue asiatiche

Ottieni il riconoscimento preciso delle scritture cinese, araba, devanagari e dravidica, nonché di testi in lingue miste.

Conserva il layout

Mantieni la formattazione originale per una rappresentazione accurata del testo e riconosci le tabelle.

Esempio di codice in tempo reale

Converti un’immagine in testo in sole TRE righe di codice Python. Prova tu stesso!

Pronto a riconoscere Pronto a riconoscere Trascina un file qui o fai clic per sfogliare *

*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.

Risultato del riconoscimento
 

Converti immagine in testo

Scopri altri esempi >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Scegli la tua preferenza

Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro funzionalità per selezionare la soluzione più efficiente.

Versatilità

Python via .NET

Facile sviluppo, leggibilità e manutenibilità del codice
Vanta il maggior numero di funzionalità e riceve gli aggiornamenti più frequenti
La velocità complessiva potrebbe essere leggermente inferiore rispetto ad altre piattaforme

Uniformità

Python via Java

Utilizza la stessa libreria su qualsiasi piattaforma
Esegui senza problemi la tua applicazione su qualsiasi dispositivo
Richiede Java Runtime Environment (JRE) versione 8 o successiva

Prestazione

Python via C++

La massima velocità possibile indipendentemente dalla piattaforma
Un grande controllo sulla gestione delle risorse
Rivolto a sviluppatori esperti

Corre ovunque

Indipendentemente dal nome, Aspose.OCR per Python tramite .NET non richiede l’installazione di .NET sulla piattaforma di destinazione. Il pacchetto di installazione include già tutti i componenti necessari e può funzionare perfettamente su qualsiasi piattaforma, sia essa una macchina locale, un server Web o il cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for Python via .NET può funzionare con qualsiasi file puoi ottenerlo da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.

Immagini

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR batch

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Risultati del riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installazione

Aspose.OCR per Python tramite .NET viene fornito come pacchetto Python con dipendenze minime o come file scaricabile o [pacchetto PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Installalo facilmente nel tuo progetto e sarai pronto a riconoscere testi in oltre 140 lingue e a salvare i risultati del riconoscimento in vari formati.

Richiedi una licenza di prova per avviare lo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.

OCR sotto Python

La nostra libreria si integra facilmente, consentendo alle applicazioni Python di funzionare perfettamente su qualsiasi piattaforma: desktop Windows, Windows Server, macOS, Linux e cloud.

Oltre 140 lingue di riconoscimento

La nostra libreria Java OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto di una vasta gamma di scritture europee, mediorientali e asiatiche, è adatto a qualsiasi paese e azienda.

Aspose OCR per Java riconosce il testo in documenti multilingue, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:

  • Latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
  • Alfabeto cirillico: russo, ucraino, kazako, bulgaro, inclusi testi misti cirillico/inglese;
  • Arabo, persiano, urdu, compresi testi misti con inglese;
  • Lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altre. Sono supportati anche testi in lingue miste.

Filtri di elaborazione potenti

La precisione e l’affidabilità del riconoscimento ottico dei caratteri dipendono fortemente dalla qualità dell’immagine originale. Aspose OCR per Python tramite .NET offre un gran numero di filtri di elaborazione delle immagini completamente automatizzati e manuali che migliorano un’immagine prima che venga inviata al motore OCR:

  • Ruota automaticamente le immagini capovolte e ruotate.
  • Rileva immagini invertite ed estrai testo bianco su nero.
  • Rimuovi automaticamente sporco, macchie, graffi, riflessi, sfumature indesiderate e altri rumori.
  • Regola automaticamente il contrasto dell’immagine.
  • Aumenta automaticamente l’upscaling o ridimensiona manualmente l’immagine.
  • Converti le immagini in bianco e nero o in scala di grigi.
  • Trova aree dell’immagine potenzialmente problematiche e restituisci le informazioni sul tipo di difetto e le sue coordinate.
  • Aumenta lo spessore dei caratteri in un’immagine.
  • Sfoca le immagini rumorose preservando i bordi delle lettere.
  • Raddrizza la curvatura della pagina e correggi la distorsione dell’obiettivo della fotocamera per le foto delle pagine.

Ottimizzato per tipi di documenti specifici

Aspose OCR per Python tramite .NET offre reti neurali appositamente addestrate per estrarre testo da determinati tipi di immagini con la massima precisione:

Controllo ortografico integrato

Sebbene la nostra libreria OCR Python fornisca un’elevata precisione di riconoscimento, difetti di stampa, caratteri sporchi o non standard potrebbero causare il riconoscimento errato di alcuni caratteri o parole. Per migliorare ulteriormente i risultati del riconoscimento, puoi attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base alla lingua di riconoscimento selezionata.

Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole non presenti nei comuni dizionari ortografici, è possibile fornire elenchi di parole personalizzati.

Riconoscimento batch

La nostra API OCR Python ti libera dal riconoscere le immagini una per una. Utilizza vari metodi di elaborazione batch per riconoscere più immagini in un’unica chiamata:

  • Riconoscimento di file PDF, TIFF e DjVu multipagina.
  • Riconoscimento di tutti i file in una cartella.
  • Riconoscimento di tutti i file in un archivio.
  • Riconoscimento di tutti i file da un elenco.

Apprendimento per campione

OCR per Python fornisce una serie di esempi scritti in Python, consentendoti di familiarizzare rapidamente con le sue funzioni e capacità. Ottieni informazioni dettagliate per creare soluzioni su misura per soddisfare le tue esigenze aziendali Python.

Caratteristiche e capacità

Aspose.OCR for Python via .NET risolve i tuoi compiti in modo facile e veloce.

Feature icon

OCR di foto

Estrai testo dalle foto dello smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile, indicizzabile e modificabile.

Feature icon

Riconoscimento dell’URL

Riconoscere un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento in blocco

Leggi tutte le immagini da documenti, cartelle e archivi multipagina.

Feature icon

Qualsiasi carattere e stile

Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.

Feature icon

Riconoscimento preciso

Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.

Feature icon

Controllo ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta i testi su due immagini, indipendentemente dal caso e dal layout.

Esempi di codice Python

Approfondisci esempi di codice per integrare perfettamente l’OCR nelle tue applicazioni Python.

Installazione

Distribuito come Python Wheel o pacchetto scaricabile autonomo, Aspose.OCR per Python tramite .NET è facilmente distribuito. L’integrazione nel tuo progetto Python, direttamente dal tuo ambiente di sviluppo integrato (IDE) Python preferito, è un processo semplice. Basta installarlo e sarai pronto a sfruttare la gamma completa di funzionalità OCR, salvando i risultati del riconoscimento in vari formati.

Dopo l’installazione, puoi immediatamente iniziare a utilizzare Aspose.OCR per Python tramite .NET , anche se con alcune limitazioni. Una licenza temporanea elimina tutte le restrizioni della versione di prova per 30 giorni. Utilizza questo periodo per avviare lo sviluppo di un’applicazione OCR completamente funzionale, consentendoti di prendere una decisione informata sull’acquisto di Aspose.OCR per Python tramite .NET in una fase successiva.

Carica licenza

lic = License()
lic.set_license(self.licPath)

Riconoscere il testo sulle foto

Leggere il testo da qualsiasi contenuto in Aspose OCR per Python è facile come chiamare un metodo di riconoscimento universale.

Converti foto in testo - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Convertitore universale Python

La nostra API legge abilmente qualsiasi immagine da scanner, fotocamere o smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, immagini BMP e persino file DjVu. Il supporto completo per documenti PDF multipagina, TIFF e immagini DjVu garantisce versatilità. Puoi anche fornire un’immagine dal Web tramite un URL.

I risultati del riconoscimento vengono restituiti nei formati di documenti e scambio dati più diffusi: testo semplice, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Riconosci PDF e salva i risultati in vari formati di output: Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Ottimizzazione delle risorse in Python

Il riconoscimento ottico dei caratteri richiede risorse. La nostra API offre modi flessibili per bilanciare la classica triade tempo-prezzo-qualità:

  • Scegli tra riconoscimento approfondito e riconoscimento rapido.
  • Specificare il numero di thread allocati per il riconoscimento o consentire alla libreria di adattarsi automaticamente al numero di core del processore.
  • Libera la CPU scaricando i calcoli sul backend .NET.

Riconoscimento veloce - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Riconoscere la singola riga

Se la tua immagine è già ritagliata su una singola riga di testo, può essere riconosciuta nella modalità più veloce possibile, senza correzioni automatiche, rilevamento della struttura del contenuto e altri passaggi che consumano risorse. Può velocizzare l’OCR fino a 7 volte più velocemente del normale processo di riconoscimento.

Riconoscere una singola riga di testo sull'immagine - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)