Python OCR Kitaplığı
Python OCR ile görselleri metne dönüştürün
Daha fazla vitrin ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Neden Python için .NET aracılığıyla Aspose.OCR?
Çok yönlü ve kullanıcı dostu bir OCR API’si olan .NET aracılığıyla Aspose OCR for Python ile bir yolculuğa çıkın. OCR işlevselliğini Python uygulamalarınıza 5 satırdan az kodla ekleyerek karmaşık matematik veya sinir ağlarına olan ihtiyacı ortadan kaldırın. Güçlü OCR motorumuz, İngilizce, Kiril, Arapça, Farsça, Hintçe, Çince, Japonca, Korece, Tamilce ve çok daha fazlasını içeren 130’dan fazla dili destekleyerek benzersiz hız ve doğruluk sunar. Taranmış görüntüler, akıllı telefon fotoğrafları, ekran görüntüleri veya taranmış PDF’ler olsun, popüler belge ve veri alışverişi formatlarında sonuçlar elde edin. Döndürülmüş, çarpık ve gürültülü görüntüleri işlemek için ön işleme filtrelerinden yararlanın.
Verimli ve hassas OCR
Gelişmiş Python teknolojisiyle OCR sonuçlarında benzersiz hız ve hassasiyeti deneyimleyin.
Çok dilli
140'tan fazla dilde metni tanıyın: İngilizce, Fransızca, Almanca, İspanyolca, Rusça, Çince, Hintçe, Japonca, Korece, Tamilce, Arapça, Farsça ve daha fazlası.
Evrensel
Python'u kullanarak tarayıcılar, kameralar ve akıllı telefonlar gibi çeşitli kaynaklardan gelen görüntüleri zahmetsizce işleyin.
Asya dilleri
Çince, Arapça, Devanagari ve Dravidian alfabelerinin yanı sıra karma dilli metinlerin de tam olarak tanınmasını sağlayın.
Düzeni koru
Doğru metin gösterimi için kaynak biçimlendirmesini koruyun ve tabloları tanıyın.
Canlı kod örneği
Yalnızca ÜÇ satırlık Python koduyla bir görüntüyü metne dönüştürün. Kendiniz deneyin!
* Dosyalarınızı yükleyerek veya hizmeti kullanarak, sözleşmemizi kabul etmiş olursunuz. Kullanım koşulları Ve Gizlilik Politikası.
Resmi metne dönüştür
Daha fazla örneği keşfedin ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Tercihinizi seçin
İhtiyaçlarınıza göre doğru kütüphaneyi seçin. En verimli çözümü seçmek için mevcut API’leri ve bunların yeteneklerini keşfedin.
Çok yönlülük
Python via .NET
Tekdüzelik
Python via Java
Performans
Python via C++
Her yerde çalışır
Adından bağımsız olarak Aspose.OCR for Python via .NET, hedef platformda .NET’in kurulu olmasını gerektirmez. Kurulum paketi zaten gerekli tüm bileşenlerle birlikte gelir ve yerel makine, web sunucusu veya bulut gibi herhangi bir platformda sorunsuz bir şekilde çalışabilir.
Desteklenen dosya formatları
Aspose.OCR for Python via .NET herhangi bir [dosya]ile çalışabilir( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) bir tarayıcıdan veya kameradan alabilirsiniz. Tanıma sonuçları gerçek zamanlı olarak kaydedilebilir, bir veritabanına aktarılabilir veya analiz edilebilir.
Görseller
- JPEG
- PNG
- TIFF
- BMP
- GIF
Toplu OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Tanıma sonuçları
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Kurulum
Aspose.OCR for Python via .NET, minimum düzeyde bağımlılık içeren bir Python paketi veya indirilebilir dosya veya [PyPI paketi](https: //pypi.org/project/aspose-ocr-python-net/). Projenize kolayca yükleyin ve 140’tan fazla dildeki metinleri tanımaya ve tanıma sonuçlarını çeşitli formatlarda kaydetmeye hazırsınız.
Sınırlama olmaksızın tamamen işlevsel bir OCR uygulamasının geliştirilmesine başlamak için deneme lisansı isteyin .
Python altında OCR
Kitaplığımız kolayca entegre olur ve Python uygulamalarının masaüstü Windows, Windows Server, macOS, Linux ve bulut gibi herhangi bir platformda sorunsuz bir şekilde çalışmasını sağlar.
140+ Tanıma Dili
Java OCR kitaplığımız, küresel ölçekte belge işleme, veri çıkarma ve içerik dijitalleştirme için evrensel bir çözümdür. Avrupa, Orta Doğu ve Asya’daki çok çeşitli yazı senaryolarını desteklemesiyle her ülkeye ve işletmeye iyi bir şekilde uyarlanmıştır.
Aspose OCR for Java, Çince/İngilizce, Arapça/Fransızca veya Kiril/İngilizce gibi çok dilli belgelerdeki metinleri tanır. Aşağıdaki diller desteklenmektedir:
- Genişletilmiş Latince: İngilizce, İspanyolca, Fransızca, Endonezce, Portekizce, Almanca, Vietnamca, Türkçe, İtalyanca, Lehçe ve 80’den fazla dil;
- Kiril alfabesi: Rusça, Ukraynaca, Kazakça, Bulgarca, karışık Kiril/İngilizce metinler dahil;
- Arapça, Farsça, Urduca, İngilizce ile karıştırılmış metinler dahil;
- Hintçe, Tamilce, Marathi ve diğerleri de dahil olmak üzere Çince, Korece, Japonca, Devanagari ve Dravidian dilleri. Karışık dilli metinler de desteklenmektedir.
Güçlü işleme filtreleri
Optik karakter tanımanın doğruluğu ve güvenilirliği büyük ölçüde orijinal görüntünün kalitesine bağlıdır. Aspose OCR for Python via .NET, bir görüntüyü OCR motoruna gönderilmeden önce geliştiren çok sayıda tam otomatik ve manuel görüntü işleme filtresi sunar:
- Otomatik olarak baş aşağı ve döndürülmüş görüntüleri döndürün.
- Ters çevrilmiş görüntüleri algılayın ve siyah üzerine beyaz metni çıkarın.
- Kiri, lekeleri, çizikleri, parlamayı, istenmeyen eğimleri ve diğer gürültüleri otomatik olarak giderin.
- Görüntü kontrastını otomatik olarak ayarlayın.
- Görüntüyü otomatik olarak büyütün veya manuel olarak yeniden boyutlandırın.
- Görüntüleri siyah beyaza veya gri tonlamaya dönüştürün.
- Görüntünün potansiyel olarak sorunlu alanlarını bulun ve kusurun türü ve koordinatlarına ilişkin bilgileri geri gönderin.
- Görüntüdeki karakterlerin kalınlığını artırın.
- Harflerin kenarlarını korurken gürültülü görüntüleri bulanıklaştırın.
- Sayfa fotoğrafları için sayfa eğriliğini düzeltin ve kamera merceği bozulmasını düzeltin.
Belirli belge türleri için optimize edilmiştir
Aspose OCR for Python via .NET, belirli görüntü türlerinden maksimum doğrulukla metin çıkarmak için özel olarak eğitilmiş sinir ağları sunar:
Yerleşik yazım denetleyicisi
Python OCR kitaplığımız yüksek tanıma doğruluğu sağlasa da yazdırma kusurları, kir veya standart dışı yazı tipleri belirli karakterlerin veya kelimelerin yanlış tanınmasına neden olabilir. Tanıma sonuçlarını daha da iyileştirmek için, seçilen tanıma diline göre yazım hatalarını bulup otomatik olarak düzelten yazım denetleyiciyi açabilirsiniz.
Tanınan metin özel terminoloji, kısaltmalar ve genel yazım sözlüklerinde bulunmayan başka sözcükler içeriyorsa, kendi sözcük listelerinizi sağlayabilirsiniz.
Toplu tanıma
Python OCR API’miz sizi görüntüleri tek tek tanımaktan kurtarır. Tek bir çağrıda birden fazla görüntüyü tanımak için çeşitli toplu işleme yöntemlerini kullanın:
- Çok sayfalı PDF, TIFF ve DjVu dosyalarının tanınması.
- Bir klasördeki tüm dosyaların tanınması.
- Bir arşivdeki tüm dosyaların tanınması.
- Bir listedeki tüm dosyaların tanınması.
Örnekle öğrenme
Python için OCR, Python’da yazılmış bir dizi örnek sunarak, onun işlevleri ve yetenekleri hakkında hızlı bir şekilde bilgi sahibi olmanızı sağlar. Python iş ihtiyaçlarınızı karşılayacak özel çözümler oluşturmaya yönelik içgörüler elde edin.
Özellikler ve yetenekler
Aspose.OCR for Python via .NET görevlerinizi hızlı ve kolay bir şekilde çözer.
Fotoğraf OCR’si
Akıllı telefon fotoğraflarından tarama düzeyinde doğrulukla metin çıkarın.
Aranabilir PDF
Herhangi bir taramayı tamamen aranabilir, dizine eklenebilir ve düzenlenebilir bir belgeye dönüştürün.
URL tanıma
Yerel olarak indirmeden URL’deki bir resmi tanıyın.
Toplu tanıma
Çok sayfalı belgeler, klasörler ve arşivlerdeki tüm görselleri okuyun.
Herhangi bir yazı tipi ve stil
Tüm popüler yazı tipleri ve stillerdeki metni tanımlayın ve tanıyın.
Tanıma konusunda ince ayar yapın
En iyi tanıma sonuçları için her OCR parametresini ayarlayın.
Yazım denetleyici
Yanlış yazılan sözcükleri otomatik olarak düzelterek sonuçları iyileştirin.
Resimlerdeki metni bulun
Bir dizi resim içinde metin veya normal ifade arayın.
Resim metinlerini karşılaştırın
Büyük/küçük harfe ve düzene bakılmaksızın iki görüntüdeki metinleri karşılaştırın.
Python kod örnekleri
OCR’yi Python uygulamalarınıza sorunsuz bir şekilde entegre etmek için kod örneklerini inceleyin.
Kurulum
Python Tekerleği veya bağımsız indirilebilir paket olarak dağıtılan Aspose.OCR for Python, .NET aracılığıyla kolayca dağıtılır. Doğrudan tercih ettiğiniz Python Tümleşik Geliştirme Ortamından (IDE) Python projenize entegrasyon sorunsuz bir süreçtir. Basitçe yükleyin ve tanıma sonuçlarını çeşitli formatlarda kaydederek tüm OCR özelliklerinden yararlanmaya hazır olun.
Kurulum sonrasında, .NET aracılığıyla Aspose.OCR for Python’u hemen kullanmaya başlayabilirsiniz. , belirli sınırlamalarla da olsa. Geçici lisans, 30 gün boyunca tüm deneme sürümü kısıtlamalarını kaldırır. Bu dönemi, daha sonraki bir aşamada .NET aracılığıyla Aspose.OCR for Python’u satın alma konusunda bilinçli bir karar vermenizi sağlayacak, tamamen işlevsel bir OCR uygulamasının geliştirilmesini başlatmak için kullanın.
Lisansı yükle
lic = License()
lic.set_license(self.licPath)
Fotoğraflardaki metni tanıma
Aspose OCR for Python’da herhangi bir içerikten metin okumak, evrensel bir tanıma yöntemini çağırmak kadar kolaydır.
Fotoğrafı metne dönüştürün - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Evrensel Dönüştürücü
API’miz tarayıcılardan, kameralardan veya akıllı telefonlardan gelen her türlü görüntüyü ustalıkla okur: PDF belgeleri, JPEG, PNG, TIFF, GIF, BMP görüntüleri ve hatta DjVu dosyaları. Çok sayfalı PDF belgeleri, TIFF ve DjVu görüntüleri için tam destek, çok yönlülük sağlar. Ayrıca bir URL aracılığıyla web’den bir resim de sağlayabilirsiniz.
Tanıma sonuçları popüler belge ve veri alışverişi formatlarında döndürülür: düz metin, PDF, Microsoft Word, Microsoft Excel, JSON ve XML.
PDF'yi tanıma ve Sonuçları çeşitli çıktı formatlarına kaydetme - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Python’da Kaynak Optimizasyonu
Optik karakter tanıma kaynak gerektirir. API’miz klasik zaman-fiyat-kalite üçlüsünü dengelemek için esnek yollar sunar:
- Kapsamlı tanıma ve hızlı tanıma arasında seçim yapın.
- Tanıma için ayrılan iş parçacığı sayısını belirtin veya kitaplığın işlemci çekirdeği sayısına göre otomatik olarak ölçeklenmesine izin verin.
- Hesaplamaları .NET arka ucuna aktararak CPU'da yer açın.
Hızlı Tanıma - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Tek satırı tanı
Görüntünüz zaten tek satırlık bir metin halinde kırpılmışsa, otomatik düzeltmeler, içerik yapısı algılama ve kaynak tüketen diğer adımlar olmadan mümkün olan en hızlı modda tanınabilir. OCR’yi normal tanıma sürecine göre 7 kata kadar hızlandırabilir.
Resimdeki tek satırlık metni tanıma - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)