Perché aspirare.ocr per Python tramite .NET?

Intraprendi un viaggio con Aspose OCR per Python tramite .NET-un’API OCR versatile e intuitiva. Incorporare funzionalità OCR nelle tue applicazioni Python con meno di 5 righe di codice, eliminando la necessità di reti matematiche o neurali complesse. Il nostro potente motore OCR offre velocità e precisione senza pari, a supporto di oltre 140 lingue, tra cui inglese, cirillico, arabo, persiano, hindi, cinese, giapponese, coreano, tamil e molti altri. Che si tratti di immagini scansionate, foto di smartphone, schermate o PDF scansionati, ottenere risultati in formati di documenti e scambi di dati popolari. Sfruttare i filtri di pre-elaborazione per gestire immagini ruotate, distorte e rumorose.

Illustration ocr

OCR efficiente e preciso

Sperimenta velocità e precisione senza pari nei risultati OCR con la tecnologia Python avanzata.

Multilingue

Riconosci il testo in più di 140 lingue: inglese, francese, tedesco, spagnolo, russo, cinese, hindi, giapponese, coreano, tamil, arabo, persiano e altro ancora.

Universale

Elaborare senza sforzo immagini da diverse fonti - scanner, telecamere e smartphone - usando Python.

Lingue asiatiche

Raggiungi un preciso riconoscimento di script cinesi, arabi, devanagari e dravidici, nonché testi in lingua mista.

Preservare il layout

Mantenere la formattazione della fonte per una rappresentazione accurata del testo e riconoscere le tabelle.

Esempio di codice live

Converti un’immagine in testo in sole tre righe di codice Python. Prova tu stesso!

Pronto a riconoscere Pronto a riconoscere Lascia cadere un file qui o fai clic per navigare *

* Caricando i tuoi file o utilizzando il servizio, sei d'accordo con il nostro Termini di utilizzo E politica sulla riservatezza.

Risultato di riconoscimento
 

Converti l'immagine in testo

Scopri altri esempi >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Scegli la tua preferenza

Scegli la libreria giusta per le tue esigenze. Esplora le API disponibili e le loro capacità per selezionare la soluzione più efficiente.

Versatilità

Python via .NET

Facile sviluppo, leggibilità e manutenibilità del codice
Vanta il maggior numero di funzionalità e riceve gli aggiornamenti più frequenti
La velocità complessiva può essere un po ‘più lenta di altre piattaforme

Uniformità

Python via Java

Usa la stessa libreria su qualsiasi piattaforma
Esegui perfettamente l’applicazione su qualsiasi dispositivo
Richiede l’ambiente di runtime Java (JRE) versione 8 o successiva

Prestazione

Python via C++

La velocità più rapida possibile indipendentemente dalla piattaforma
Un grande controllo sulla gestione delle risorse
Mirato agli sviluppatori esperti

Corre ovunque

Indipendentemente dal nome, Aspose.ocr per Python tramite .NET non richiede l’installazione di .NET sulla piattaforma di destinazione. Il pacchetto di installazione viene già dotato di tutti i componenti richiesti e può funzionare perfettamente su qualsiasi piattaforma, che si tratti di un macchina, del server Web o del cloud locale.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for Python via .NET può funzionare con qualsiasi file Puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.

Immagini

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Risultati di riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installazione

Aspy.ocr per python tramite .net viene consegnato come pacchetto Python con dipendenze minime o come file scaricabile o pacchetto Pypi . Facilmente Installa nel tuo progetto e sei pronto a riconoscere i testi in oltre 140 lingue e salvare i risultati di riconoscimento in vari formati.

Richiedi una licenza di prova per dare il via allo sviluppo di un’applicazione OCR completamente funzionale senza limitazioni.

OCR sotto Python

La nostra libreria si integra facilmente, consentendo alle applicazioni Python di eseguire perfettamente su qualsiasi piattaforma: Desktop Windows, Windows Server, MacOS, Linux e Cloud.

140+ lingue di riconoscimento

La nostra libreria Java OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto per una vasta gamma di script di scrittura europei, medio-est e asiatici, è ben adattata per qualsiasi paese e attività.

ASPUTI OCR per Java riconosce il testo in documenti multilingue, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:

  • ** Latino esteso **: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e altri 80+;
  • ** Cirillico ** Alphabet: russo, ucraino, kazako, bulgaro, compresi testi citi -cirillici/inglesi;
  • Arabo, persiano, urdu, compresi testi mescolati con l’inglese;
  • Le lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altri. Sono anche supportati testi in lingua mista.

Potenti filtri di elaborazione

L’accuratezza e l’affidabilità del riconoscimento ottico dei caratteri dipendono fortemente dalla qualità dell’immagine originale. ASPEGE OCR per Python tramite .NET offre un gran numero di filtri di elaborazione delle immagini completamente automatizzati e manuali che migliorano un’immagine prima che venga inviata al motore OCR:

  • Ruotare automaticamente le immagini sottosopra e ruotate.
  • Rilevare immagini invertite ed estrarre il testo bianco su nero.
  • Rimuovere automaticamente lo sporco, i punti, i graffi, l’abbagliamento, i gradienti indesiderati e altri rumore.
  • Regola automaticamente il contrasto dell’immagine.
  • Uspire automaticamente o ridimensionare manualmente l’immagine.
  • Converti le immagini in bianco e nero o in scala di grigi.
  • Trova aree potenzialmente problematiche dell’immagine e restituisci le informazioni sul tipo di difetto e sulle sue coordinate.
  • Aumenta lo spessore dei caratteri in un’immagine.
  • Immagini rumorose sfocate mentre preserva i bordi delle lettere.
  • Raddrizza la curvatura della pagina e correggi la distorsione dell’obiettivo della fotocamera per le foto di pagina.

Ottimizzato per tipi di documenti specifici

Asposi OCR per Python tramite .NET offre reti neurali appositamente addestrate per estrarre il testo da determinati tipi di immagini con massima precisione:

Checker ortografico incorporato

Sebbene la nostra libreria OCR Python fornisca un’elevata precisione di riconoscimento, difetti di stampa, sporcizia o caratteri non standard possono causare il riconoscimento in modo errato di determinati personaggi o parole. Per migliorare ulteriormente i risultati del riconoscimento, è possibile attivare il controllo ortografico, che trova e corregge automaticamente gli errori di ortografia in base al linguaggio di riconoscimento selezionato.

Se il testo riconosciuto contiene terminologia specializzata, abbreviazioni e altre parole che non sono presenti nei dizionari di ortografia comuni, è possibile fornire le tue liste di parole.

Riconoscimento batch

La nostra API OCR Python ti libera dal riconoscere le immagini una per una. Utilizzi vari metodi di elaborazione batch per riconoscere più immagini in una chiamata:

  • Riconoscimento di file PDF, TIFF e DJVU multi-pagina.
  • Riconoscimento di tutti i file in una cartella.
  • Riconoscimento di tutti i file in un archivio.
  • Riconoscimento di tutti i file da un elenco.

Apprendimento per campione

OCR per Python fornisce una serie di Esempi scritto in Python, permettendoti di conoscerti rapidamente con le sue funzioni e capacità. Ottieni approfondimenti per la creazione di soluzioni su misura per soddisfare le tue esigenze aziendali di Python.

Funzionalità e capacità

Aspose.OCR for Python via .NET Aspose.ocr per Python tramite .NET risolve le tue attività veloci e facili.

Feature icon

Foto OCR

Estrai il testo da foto di smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile, indicizzabile e modificabile.

Feature icon

Riconoscimento dell’URL

Riconosci un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento di massa

Leggi tutte le immagini da documenti, cartelle e archivi multi-pagina.

Feature icon

Qualsiasi carattere e stile

Identificare e riconoscere il testo in tutti i caratteri e gli stili popolari.

Feature icon

Riconoscere il riconoscimento

Regola ogni parametro OCR per i migliori risultati di riconoscimento.

Feature icon

Checker ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta i testi su due immagini, indipendentemente dal caso e dal layout.

Campioni di codice Python

Approfondisci i campioni di codice per integrare perfettamente OCR nelle tue applicazioni Python.

Installazione

Distribuito come una ruota Python o un pacchetto scaricabile autonomo, Aspose.ocr per Python tramite .NET è facilmente distribuito. L’integrazione nel tuo progetto Python, direttamente dal tuo ambiente di sviluppo integrato Python preferito (IDE), è un processo senza soluzione di continuità. Basta installarlo e sei pronto a sfruttare la gamma completa di capacità OCR, salvare i risultati di riconoscimento in vari formati.

post-installazione, puoi iniziare prontamente a usare aspy.ocr per python tramite .net, anche se con alcune limitazioni. Una licenza temporanea solleva tutte le restrizioni della versione di prova per 30 giorni. Utilizzare questo periodo per avviare lo sviluppo di un’applicazione OCR pienamente funzionale, consentendo di prendere una decisione informata sull’acquisto Aspy.ocr per Python tramite .NET in una fase successiva.

Licenza di carico

lic = License()
lic.set_license(self.licPath)

Riconosci il testo sulle foto

Leggere il testo da qualsiasi contenuto in Aspose OCR per Python è facile come chiamare un metodo di riconoscimento universale.

Converti la foto in testo - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

La nostra API legge in modo abile qualsiasi immagine di scanner, telecamere o smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, immagini BMP e persino file DJVU. Il supporto completo per i documenti PDF multi-pagine, le immagini TIFF e DJVU garantisce la versatilità. Puoi anche fornire un’immagine dal Web tramite un URL. I risultati del riconoscimento

vengono restituiti nei formati di documenti e di scambio di dati popolari: testo normale, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Riconosci PDF e salva i risultati in vari formati di output - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Ottimizzazione delle risorse in Python

Il riconoscimento ottico del personaggio richiede risorse. La nostra API offre modi flessibili per bilanciare la classica triade di qualità del prezzo temporale:

  • Scegli tra riconoscimento approfondito e riconoscimento rapido.
  • Specificare il numero di thread assegnati per il riconoscimento o consentire alla libreria di ridimensionare automaticamente il numero di core del processore.
  • Libera la CPU scaricando i calcoli sul backend .NET.

Riconoscimento rapido - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Riconosci singola riga

Se la tua immagine è già tagliata a una singola riga di testo, può essere riconosciuta nella modalità più rapida possibile, senza correzioni automatizzate, rilevamento della struttura del contenuto e altri passaggi che consumano le risorse. Può accelerare OCR fino a 7 volte più veloce del normale processo di riconoscimento.

Riconoscere una singola riga di testo sull'immagine - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)