Varför välja Aspose.OCR för Python via .NET?

Ge dig ut på en resa med Aspose.OCR för Python via .NET – ett mångsidigt och användarvänligt OCR-API. Bädda in OCR-funktionalitet i dina Python-applikationer med färre än 5 rader kod, vilket eliminerar behovet av komplexa matematiska eller neurala nätverk. Vår kraftfulla OCR-motor ger oöverträffad hastighet och noggrannhet och stöder 28 språk, inklusive latinska, kyrilliska och kinesiska skript. Oavsett om det är skannade bilder, smartphonefoton, skärmdumpar eller skannade PDF-filer, få resultat i populära dokument- och datautbytesformat. Använd förbehandlingsfilter för att hantera roterade, sneda och brusiga bilder. Optimera igenkänningsprestanda och systembelastning genom att ladda ner resurskrävande uppgifter till .NET-backend.

Illustration ocr

Effektiv och exakt OCR-behärskning

Upplev oöverträffad hastighet och precision i OCR-resultat med avancerad Python- och .NET-teknik.

Flerspråkig förträfflighet

Känn igen text på 28 språk som spänner över latinska, kyrilliska och kinesiska skrifter med lätthet och precision.

Anpassningsbar bildbehandling

Bearbeta enkelt bilder från olika källor – skannrar, kameror och smartphones – med Python och .NET.

Kunskap om kinesiska karaktärer

Uppnå exakt igenkänning av över 6 000 kinesiska tecken, vilket säkerställer noggrannhet med Python och .NET.

Bevarande av teckensnittsstilar och format

Behåll teckensnittsstilar och formatering för korrekt textrepresentation, vilket förbättrar mångsidigheten med Python och .NET.

Live-kodexempel

Upplev enkelheten: Konvertera en bild till text på bara tre rader Python-kod!

Redo att känna igen Redo att känna igen Släpp en fil här eller klicka för att bläddra *

* Genom att ladda upp dina filer eller använda tjänsten godkänner du vår Villkor och Integritetspolicy.

Erkännande resultat
 

Konvertera bild till text

Upptäck fler exempel >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

.NET Empowerment för Python i varje hörn

Aspose.OCR för Python via .NET fungerar sömlöst på alla plattformar som stöder .NET Framework 4.0 och senare – oavsett om det är en lokal maskin, webben servern eller molnet.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Filformat som stöds

Aspose.OCR for Python via .NET kan fungera med praktiskt taget alla fil du kan få från en skanner eller kamera. Igenkänningsresultat returneras i de mest populära fil- och datautbytesformaten som kan sparas, importeras till en databas eller analyseras i realtid.

Bilder

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Erkännande resultat

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installation för Python med .NET-backend

Aspose.OCR för Python via .NET levereras som ett Python-paket med minimala beroenden eller som en nedladdningsbar fil . installera det enkelt i ditt projekt, och du är redo att känna igen texter på flera språk som stöds och spara igenkänningsresultat i olika format.

Begär en testlicens för att kickstarta utvecklingen av en fullt fungerande OCR-applikation utan begränsningar.

Kraftfull OCR för Python-applikationer

Vårt bibliotek integreras enkelt, vilket gör att Python-applikationer kan köras sömlöst på alla plattformar – stationära Windows, Windows Server, macOS, Linux och molnet.

28 igenkänningsspråk

Vårt Python och .NET OCR API känner igen en uppsjö av språk och populära skriftskript, inklusive blandade språk:

Lämna språkdetektering till biblioteket eller definiera språket själv för förbättrad igenkänningsprestanda och tillförlitlighet.

  • Utökat latin alfabet: kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska;
  • kyrilliska alfabetet: vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska;
  • Kinesiska: Över 6 000 tecken;
  • Hindi.

Kraftfulla bearbetningsfilter

Noggrannheten och tillförlitligheten för optisk teckenigenkänning är starkt beroende av kvaliteten på originalbilden. Aspose.OCR för Python via .NET erbjuder ett stort antal helautomatiska och manuella bildbehandlingsfilter som förbättrar en bild innan den skickas till OCR-motorn:

  • Räta automatiskt ut bilder justerade i en liten vinkel mot horisontalplanet.
  • Rotera kraftigt sneda bilder manuellt.
  • Ta automatiskt bort smuts, fläckar, repor, bländning, oönskade gradienter och annat brus.
  • Justera bildkontrasten automatiskt.
  • Uppskala automatiskt eller ändra storlek på bilden manuellt.
  • Konvertera bilder till svartvitt eller gråskala.
  • Invertera bildfärgerna så att ljusa områden ser mörka ut och mörka områden ser ljusa ut.
  • Öka tjockleken på tecken i en bild.
  • Oskarpa brusiga bilder samtidigt som bokstävernas kanter bevaras.
  • Räta ut sidans krökning och fixa kameralinsförvrängning för sidfoton.

Optimerad för specifika dokumenttyper

Aspose.OCR för Python via .NET erbjuder specialtränade neurala nätverk för att extrahera text från vissa typer av bilder med maximal noggrannhet:

Inbyggd stavningskontroll

Även om Aspose.OCR för Python via .NET ger hög igenkänningsnoggrannhet, kan utskriftsdefekter, smuts eller icke-standardiserade teckensnitt göra att vissa tecken eller ord identifieras felaktigt. För att ytterligare förbättra igenkänningsresultaten kan du aktivera stavningskontrollen, som hittar och automatiskt korrigerar stavfel baserat på det valda igenkänningsspråket.

Om den erkända texten innehåller specialiserad terminologi, förkortningar och andra ord som inte finns i vanliga stavningsordböcker, kan du tillhandahålla dina egna ordlistor.

Batchigenkänning förenklat

Vårt Python OCR API befriar dig från att känna igen bilder en efter en. Använd olika batch-bearbetningsmetoder för att känna igen flera bilder i ett samtal:

  • Igenkänning av flersidiga PDF-, TIFF- och DjVu-filer.
  • Igenkänning av alla filer i en mapp.
  • Igenkänning av alla filer i ett arkiv.
  • Igenkänning av alla filer från en lista.

Lär dig genom Python-exempel

Aspose.OCR för Python via .NET tillhandahåller en rad exempel skrivna i Python, så att du snabbt kan bekanta dig med dess funktioner och förmågor. Få insikter för att skapa skräddarsydda lösningar för att möta dina Python-företagsbehov.

Funktioner och funktioner

Aspose.OCR for Python via .NET Utforska de avancerade funktionerna i Aspose.OCR för C++.

Feature icon

Foto OCR

Extrahera text från smartphonefoton med noggrannhet på skanningsnivå.

Feature icon

Sökbar PDF

Konvertera vilken skanning som helst till ett helt sökbart och indexerbart dokument.

Feature icon

URL-igenkänning

Känn igen en bild från URL utan att ladda ner den lokalt.

Feature icon

Bulkigenkänning

Läs alla bilder från flersidiga dokument, mappar och arkiv.

Feature icon

Alla typsnitt och stilar

Identifiera och känna igen text i alla populära typsnitt och stilar.

Feature icon

Finjustera igenkänning

Justera varje OCR-parameter för bästa igenkänningsresultat.

Feature icon

Stavningskontroll

Förbättra resultaten genom att automatiskt korrigera felstavade ord.

Feature icon

Hitta text i bilder

Sök efter text eller reguljärt uttryck i en uppsättning bilder.

Feature icon

Jämför bildtexter

Jämför texter på två bilder, oavsett fall och layout.

Python-kodprov

Fördjupa dig i kodexempel för att sömlöst integrera Aspose.OCR för Python via .NET i dina Python-applikationer.

Installation Mastery i Python

Distribuerat som ett Python Wheel eller fristående nedladdningsbart paket, Aspose.OCR för Python via .NET distribueras enkelt. Integrering i ditt Python-projekt, direkt från din föredragna Python Integrated Development Environment (IDE), är en sömlös process. Installera det helt enkelt och du är beredd att dra nytta av hela utbudet av OCR-funktioner, vilket sparar igenkänningsresultat i olika format.

Efter installationen kan du omedelbart börja använda Aspose.OCR för Python via .NET , om än med vissa begränsningar. En tillfällig licens tar bort alla begränsningar för testversioner i 30 dagar. Använd denna period för att initiera utvecklingen av en fullt fungerande OCR-applikation, så att du kan fatta ett välgrundat beslut om att köpa Aspose.OCR för Python via .NET i ett senare skede.

Ladda licens

lic = License()
lic.set_license(self.licPath)

Känna igen text på foton

Att läsa text från vilket innehåll som helst i Aspose.OCR för Python via .NET är lika enkelt som att anropa en universell identifiering()-metod.

Konvertera foto till text - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

Vårt API läser på ett skickligt sätt alla bilder från skannrar, kameror eller smartphones: PDF-dokument, JPEG, PNG, TIFF, GIF, BMP-bilder och till och med DjVu-filer. Fullt stöd för flersidiga PDF-dokument, TIFF och DjVu-bilder säkerställer mångsidighet. Du kan också tillhandahålla en bild från webben via en URL.

Igenkänningsresultat returneras i populära dokument- och datautbytesformat: vanlig text, PDF, Microsoft Word, Microsoft Excel, JSON och XML.

Känn igen PDF och spara resultat i olika utdataformat - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Resursoptimering i Python

Optisk teckenigenkänning kräver resurser. Vårt API erbjuder flexibla sätt att balansera den klassiska triaden av tid-pris-kvalitet:

  • Välj mellan grundlig igenkänning och snabb igenkänning.
  • Ange antalet trådar som tilldelats för igenkänning, eller låt biblioteket automatiskt skala till antalet processorkärnor.
  • Frigör CPU:n genom att överföra beräkningar till .NET-backend.

Snabb igenkänning - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Känn igen en rad

Om din bild redan är trimmad till en enda textrad kan den kännas igen i snabbast möjliga läge, utan automatiska korrigeringar, detektering av innehållsstruktur och andra resurskrävande steg. Det kan påskynda OCR upp till 7 gånger snabbare än normal igenkänning.

Känn igen en rad text på bilden - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)