Python OCR Kütüphanesi
Görüntüleri Python OCR ile metne dönüştürün
Daha Fazla Vitrin ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Neden .Net üzerinden python için aspose.ocr?
Çok yönlü ve kullanıcı dostu bir OCR API-Python için Aspose OCR ile bir yolculuğa çıkın. OCR işlevselliğini python uygulamalarınıza 5’den az kod ile yerleştirerek karmaşık matematik veya sinir ağlarına olan ihtiyacı ortadan kaldırın. Güçlü OCR motorumuz, İngilizce, Kiril, Arapça, Farsça, Hintçe, Çin, Japon, Koreli, Tamil ve daha fazlası dahil olmak üzere 140’dan fazla dili destekleyen benzersiz bir hız ve doğruluk sağlar. Taranmış görüntüler, akıllı telefon fotoğrafları, ekran görüntüleri veya taranan PDF’ler olsun, popüler belge ve veri alışverişi formatlarında sonuçlar elde edin. Dönmüş, eğik ve gürültülü görüntüleri işlemek için ön işleme filtrelerini kullanın.

Verimli ve hassas OCR
Gelişmiş Python teknolojisi ile OCR sonuçlarında benzersiz hız ve hassasiyet yaşayın.
Çok dilli
140+ dilde metni tanıyın: İngilizce, Fransızca, Almanca, İspanyolca, Rusça, Çince, Hintçe, Japonca, Korece, Tamil, Arapça, Farsça ve daha fazlası.
Evrensel
Python kullanarak farklı kaynaklardan - tarayıcılar, kameralar ve akıllı telefonlar - zahmetsizce işleyin.
Asya dilleri
Çin, Arapça, Devanagari ve Dravidian senaryolarının yanı sıra karışık dil metinlerinin kesin olarak tanınmasını sağlayın.
Düzeni Koruma
Doğru metin gösterimi için kaynak biçimlendirmesini koruyun ve tabloları tanıyın.
Canlı Kod Örneği
Bir görüntüyü sadece üç satır Python kodunda metne dönüştürün. Kendiniz için deneyin!
* Dosyalarınızı yükleyerek veya kabul ettiğiniz hizmeti kullanarak Kullanım Koşulları Ve Gizlilik Politikası.
Görüntüyü metne dönüştürün
Daha fazla örnek keşfedin ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Tercihinizi Seçin
İhtiyaçlarınız için doğru kütüphaneyi seçin. En verimli çözümü seçmek için mevcut API’leri ve yeteneklerini keşfedin.
Çok yönlülük
Python via .NET
Tekdüzelik
Python via Java
Performans
Python via C++
Her yerde koşar
Adından bağımsız olarak, Python için aspose.ocr .NET .NET’in hedef platformda yüklenmesini gerektirmez. Kurulum paketi zaten gerekli tüm bileşenlerle birlikte gelir ve yerel bir makine, web sunucusu veya bulut olsun, herhangi bir platformda sorunsuz bir şekilde çalışabilir.
Desteklenen dosya biçimleri
Aspose.OCR for Python via .NET herhangi bir [dosya]ile çalışabilir( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) Bir tarayıcıdan veya kameradan alabilirsiniz. Tanıma sonuçları kaydedilebilir, bir veritabanına aktarılabilir veya gerçek zamanlı olarak analiz edilebilir.
Görüntüler
- JPEG
- PNG
- TIFF
- BMP
- GIF
Toplu ocr
- Multi-page PDF
- DjVu
- ZIP
- Folder
Tanıma sonuçları
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Kurulum
Python için aspose.ocr .NET, minimal bağımlılıklara sahip bir Python paketi veya indirilebilir dosya veya pypi paketi olarak teslim edilir. Kolayca yükleme Projenize girin ve 140+ dilde metinleri tanımaya ve tanıma sonuçlarını çeşitli formatlarda kaydetmeye hazırsınız.
Deneme lisansı isteyin , sınırlama olmadan tamamen işlevsel bir OCR uygulamasının geliştirilmesini başlatmak için.
Python altında OCR
Kütüphanemiz kolayca entegre olur ve Python uygulamalarının herhangi bir platformda sorunsuz bir şekilde çalışmasını sağlar - masaüstü Windows, Windows Server, MacOS, Linux ve Bulut.
140+ tanıma dili
Java OCR kütüphanemiz, küresel ölçekte belge işleme, veri çıkarma ve içerik sayısallaştırması için evrensel bir çözümdür. Çok çeşitli Avrupa, orta doğu ve Asya yazma senaryoları desteğiyle, herhangi bir ülke ve iş için iyi uyarlanmıştır.
Java için ASPOSE OCR, Çin/İngilizce, Arapça/Fransızca veya Kiril/İngilizce gibi çok dilli belgelerdeki metni tanır. Aşağıdaki diller desteklenir:
- ** Genişletilmiş Latin **: İngilizce, İspanyolca, Fransızca, Endonezya, Portekizce, Almanca, Vietnamlılar, Türk, İtalyan, Lehçe ve 80+ daha;
- ** Kiril ** Alfabe: Rusya, Ukrayna, Kazak, Bulgar, karışık Kiril/İngilizce metinler dahil;
- İngilizce ile karıştırılmış metinler dahil Arapça, Farsça, Urduca;
- Hintçe, Tamil, Marathi ve diğerleri de dahil olmak üzere Çin, Koreli, Japon, Devanagari ve Dravidian dilleri. Karma dil metinleri de desteklenir.
Güçlü İşleme Filtreleri
Optik karakter tanımanın doğruluğu ve güvenilirliği, büyük ölçüde orijinal görüntünün kalitesine bağlıdır. Python Via .NET için ASPOSE OCR, OCR motoruna gönderilmeden önce bir görüntüyü geliştiren çok sayıda tam otomatik ve manuel görüntü işleme filtresi sunar:
- Otomatik olarak baş aşağı ve döndürülmüş görüntüleri döndürün.
- Ters görüntüleri algılayın ve siyah üzerine beyaz metin çıkarın.
- Kir, lekeleri, çizikleri, parlamayı, istenmeyen gradyanları ve diğer gürültüyü otomatik olarak çıkarın.
- Görüntü kontrastını otomatik olarak ayarlayın.
- Otomatik olarak lüks veya görüntüyü manuel olarak yeniden boyutlandırın.
- Görüntüleri siyah beyaz veya gri tonlamaya dönüştürün.
- Görüntünün potansiyel olarak sorunlu alanlarını bulun ve kusurun türü ve koordinatları hakkında bilgileri iade edin.
- Bir görüntüdeki karakterlerin kalınlığını artırın.
- Harflerin kenarlarını korurken gürültülü görüntüleri bulanıklaştırır.
- Sayfa eğriliğini düzeltin ve sayfa fotoğrafları için kamera lens bozulmasını düzeltin.
Belirli belge türleri için optimize edilmiş
Python Via .NET için ASPOSE OCR, maksimum doğrulukla belirli görüntü türlerinden metin çıkarmak için özel olarak eğitilmiş sinir ağları sunar:
Yerleşik yazım denetleyicisi
Python OCR kütüphanemiz yüksek tanıma doğruluğu sağlasa da, baskı kusurları, kir veya standart olmayan yazı tipleri belirli karakterlerin veya kelimelerin yanlış tanınmasına neden olabilir. Tanıma sonuçlarını daha da iyileştirmek için, yazım hatalarını seçilen tanıma diline göre bulan ve otomatik olarak düzelten yazım denetleyicisini açabilirsiniz.
Tanınan metin, özel terminoloji, kısaltmalar ve yaygın yazım sözlüklerinde bulunmayan diğer kelimeler içeriyorsa, kendi kelime listelerinizi sağlayabilirsiniz.
Toplu tanıma
Python OCR API’miz, görüntüleri tek tek tanımaktan kurtulur. Bir çağrıda birden fazla görüntüyü tanımak için çeşitli toplu işleme yöntemleri kullanın:
- Çok sayfalı PDF, TIFF ve DJVU dosyalarının tanınması.
- Bir klasördeki tüm dosyaların tanınması.
- Bir arşivdeki tüm dosyaların tanınması.
- Bir listeden tüm dosyaların tanınması.
Örnekle öğrenme
Python için OCR, Python’da yazılmış bir dizi örnek sunar ve kendinizi işlevleri ve yetenekleri ile hızlı bir şekilde edinmenize izin verir. Python iş ihtiyaçlarınızı karşılamak için özel çözümler oluşturmak için bilgiler kazanın.
Özellikler ve yetenekler
Aspose.OCR for Python via .NET Python için aspose.ocr .Net, görevlerinizi hızlı ve kolay çözer.
Fotoğraf OCR
Akıllı telefon fotoğraflarından tarama seviyesi doğruluğu ile metin çıkarın.
Aranabilir PDF
Herhangi bir taramayı tamamen aranabilir, dizinlenebilir ve düzenlenebilir bir belgeye dönüştürün.
URL tanıma
Yerel olarak indirmeden bir görüntüyü URL’den tanıyın.
Toplu tanıma
Çok sayfalık belgelerden, klasörlerden ve arşivlerden tüm resimleri okuyun.
Herhangi bir yazı tipi ve stil
Tüm popüler yazı tiplerinde ve stillerindeki metni tanımlayın ve tanıyın.
İnce ayar tanıma
En iyi tanıma sonuçları için her OCR parametresini ayarlayın.
Yazım denetleyicisi
Yanlış yazılmış kelimeleri otomatik olarak düzelterek sonuçları iyileştirin.
Resimlerde metin bulun
Bir dizi görüntü içinde metin veya normal ifade arayın.
Görüntü metinlerini karşılaştırın
Dava ve düzen ne olursa olsun iki resimdeki metinleri karşılaştırın.
Python kodu örnekleri
Python uygulamalarınıza OCR’yi sorunsuz bir şekilde entegre etmek için kod örneklerine girin.
Kurulum
Python tekerleği veya kendi kendine yeten indirilebilir paket olarak dağıtılan Python için aspose.ocr .NET kolayca dağıtılır. Python projenize entegrasyon, doğrudan tercih ettiğiniz Python Entegre Geliştirme Ortamından (IDE) kesintisiz bir süreçtir. Basitçe yükleyin ve tanıma sonuçlarını çeşitli formatlarda kaydederek OCR yeteneklerinin tamamını kullanmaya hazırsınız. Geçici lisans, tüm deneme sürüm kısıtlamalarını 30 gün boyunca kaldırır. Tamamen işlevsel bir OCR uygulamasının geliştirilmesini başlatmak için bu dönemi kullanın ve daha sonraki bir aşamada Python için aspose.ocr satın alma konusunda bilinçli bir karar vermenizi sağlar.
Lisans lisansı
lic = License()
lic.set_license(self.licPath)
Fotoğraflardaki metni tanıyın
Python için ASPOSE OCR’deki herhangi bir içerikten metin okumak, evrensel bir tanıma yöntemi olarak adlandırmak kadar kolaydır.
Fotoğrafı metne dönüştürün - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
API’miz tarayıcılar, kameralar veya akıllı telefonlardan herhangi bir resmi okur: PDF belgeleri, JPEG, PNG, TIFF, GIF, BMP görüntüleri ve hatta DJVU dosyaları. Çok sayfalı PDF belgeleri, TIFF ve DJVU görüntüleri için tam destek çok yönlülüğü sağlar. Bir URL üzerinden web’den bir resim de sağlayabilirsiniz.
tanıma sonuçları popüler belge ve veri alışverişi biçimlerinde döndürülür: düz metin, PDF, Microsoft Word, Microsoft Excel, JSON ve XML.
PDF'yi tanıyın ve sonuçları çeşitli çıktı formatlarına kaydedin - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Python’da kaynak optimizasyonu
Optik karakter tanıma kaynakları gerektirir. API’miz, klasik zaman fiyatı kalitesinde üçlüyü dengelemek için esnek yollar sunmaktadır:
- Kapsamlı tanıma ve hızlı tanıma arasında seçim yapın.
- Tanıma için ayrılan iş parçacığı sayısını belirtin veya kütüphanenin işlemci çekirdek sayısına otomatik olarak ölçeklendirilmesine izin verin.
- .NET arka ucuna hesaplamaları boşaltarak CPU'yu serbest bırakın.
Hızlı Tanıma - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Tek satırı tanıyın
Görüntünüz zaten tek bir metin satırına kesilmişse, otomatik düzeltmeler, içerik yapısı algılama ve diğer kaynak tüketen adımlar olmadan mümkün olan en hızlı modda tanınabilir. OCR’yi normal tanıma işleminden 7 kat daha hızlı hızlandırabilir.
Resimde tek bir metin satırını tanıyın - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)