Java aracılığıyla Python OCR API ile görüntüyü metne dönüştürün
Python ile Resimlerdeki Metni Tanıma
Daha fazla vitrin ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Neden Java aracılığıyla Python için Aspose.OCR?
Aspose.OCR for Python for Java, güçlü optik karakter tanıma (OCR) özelliklerini platformlar arası Python dizüstü bilgisayarlarınıza ve uygulamalarınıza sorunsuz bir şekilde entegre eder. Sezgisel ve yüksek hızlı API’miz sayesinde taramalardan, ekran görüntülerinden, web bağlantılarından veya akıllı telefon fotoğraflarından zahmetsizce metin çıkarabilir ve birleştirme, analiz veya depolamaya hazır sonuçlar sunabilirsiniz. Taranmış görüntüleri, akıllı telefon fotoğraflarını, ekran görüntülerini ve taranmış PDF’leri tanıyarak sonuçları popüler belge formatlarında kaydedin. Gelişmiş ön işleme filtreleri döndürülmüş, çarpık ve gürültülü görüntüleri işler. Görevleri GPU’ya aktararak performansı optimize edin.
Hızlı ve Doğru OCR
Java teknolojisi aracılığıyla gelişmiş Python'umuzla yüksek hızlı ve doğru OCR sonuçlarına ulaşın.
Çok Dilli Destek
Latince, Kiril, Arapça, Farsça, Hintçe ve Çince alfabeler dahil 130'dan fazla dilde metni tanıyarak Java aracılığıyla Python uygulamalarınız için çok yönlülük sağlar.
Esnek Görüntü Desteği
Java aracılığıyla Python ile tarayıcılardan, kameralardan ve akıllı telefonlardan gelen görüntüleri sorunsuz bir şekilde işleyin.
Çince Karakter Tanımada Hassasiyet
Python projelerinizde Java aracılığıyla 6.000'den fazla Çince karakteri hassasiyetle tanıyın.
Yazı Tipi Stillerini ve Biçimlendirmeyi Koru
Tanınan metnin Java aracılığıyla Python uygulamalarınızda doğru şekilde temsil edilmesi için yazı tipi stillerini ve formatını koruyun.
Canlı kod örneği
Yalnızca üç satırlık kodla resimlerden metin tanımayı başlatın. Sadeliği deneyimleyin!
* Dosyalarınızı yükleyerek veya hizmeti kullanarak, sözleşmemizi kabul etmiş olursunuz. Kullanım koşulları Ve Gizlilik Politikası.
Resmi metne dönüştür
Daha fazla örnek ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Tercihinizi seçin
İhtiyaçlarınıza göre doğru kütüphaneyi seçin. En verimli çözümü seçmek için mevcut API’leri ve bunların yeteneklerini keşfedin.
Çok yönlülük
Python via .NET
Tekdüzelik
Python via Java
Performans
Python via C++
Java Arka Uç Uyumluluğu
Python modülü olarak tasarlanan kitaplığımız, Microsoft Windows, Linux ve macOS dahil olmak üzere Java destekleyen başlıca işletim sistemleriyle uyumluluk sağlar. bulut platformları. Bu, uygulamaları bir platformda geliştirmenize ve bunları başka bir platformda sorunsuz bir şekilde çalıştırmanıza olanak tanıyarak herhangi bir kod değişikliği ihtiyacını ortadan kaldırır.
Desteklenen dosya formatları
Aspose.OCR for Python via Java herhangi bir [dosya]ile çalışabilir( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) bir tarayıcıdan veya kameradan alabilirsiniz. Tanıma sonuçları gerçek zamanlı olarak kaydedilebilir, bir veritabanına aktarılabilir veya analiz edilebilir.
Görseller
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Toplu OCR
- Multi-page PDF
- ZIP
- Folder
Tanıma sonuçları
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Java Üzerinden Python İçin Zahmetsiz Kurulum
Aspose.OCR for Python for Java, Java aracılığıyla bir Python paketi veya minimum düzeyde bağımlılıkla indirilebilir dosya olarak sunulur. Projenize kolayca yükleyin ve desteklenen birden fazla dildeki metinleri tanımaya ve tanıma sonuçlarını çeşitli formatlarda kaydetmeye hazırsınız.
Sınırlama olmaksızın tamamen işlevsel bir OCR uygulamasının geliştirilmesine başlamak için deneme lisansı isteyin .
Python Uygulamaları için Güçlü OCR
Kitaplığımız kolayca entegre olur ve Python uygulamalarının masaüstü Windows, Windows Server, macOS, Linux ve bulut gibi herhangi bir platformda sorunsuz bir şekilde çalışmasını sağlar.
130+ Tanıma Dili
Python ve Java OCR API’miz, karışık diller de dahil olmak üzere çok sayıda dili ve popüler yazma komut dosyalarını tanır:
Gelişmiş tanıma performansı ve güvenilirliği için dil algılamayı kitaplığa bırakın veya dili kendiniz tanımlayın.
- Genişletilmiş Latin alfabesi: İngilizce, İspanyolca, Fransızca, Endonezce, Portekizce, Almanca, Vietnamca, Türkçe, İtalyanca, Lehçe ve 80’den fazla alfabe;
- Kiril alfabesi: Rusça, Ukraynaca, Kazakça, Sırpça, Belarusça, Bulgarca;
- Arapça, Farsça, Urduca;
- Hintçe, Marathi, Bhojpuri ve diğerleri de dahil olmak üzere Çin ve Devanagari alfabesi.
Gelişmiş Görüntü İşleme Filtreleri
Optik karakter tanımanın kesinliği büyük ölçüde orijinal görüntünün kalitesine bağlıdır. Aspose.OCR for Python for Java, bir görüntüyü OCR motoruna göndermeden önce optimize etmek için hem otomatik hem de manuel görüntü işleme filtrelerinin geniş bir yelpazesini sunar:
- Hafif eğik görüntüleri otomatik olarak düzeltin.
- Ciddi derecede eğrilmiş görüntülerin dönüşünü manuel olarak düzeltin.
- Kiri, lekeleri, çizikleri, parlamayı, istenmeyen eğimleri ve diğer gürültü türlerini otomatik olarak kaldırın.
- Görüntü kontrastını otomatik olarak ayarlayın.
- Görüntüyü otomatik olarak büyütün veya manuel olarak yeniden boyutlandırın.
- Görüntüleri siyah beyaza veya gri tonlamaya dönüştürün.
- Görüntü renklerini ters çevirerek açık alanların koyu, koyu alanların açık görünmesini sağlayın.
- Görüntüdeki karakterlerin kalınlığını artırın.
- Harf kenarlarını korurken gürültülü görüntüleri bulanıklaştırın.
- Sayfa fotoğraflarındaki sayfa eğriliğini düzeltin ve kamera merceği bozulmasını düzeltin.
Çeşitli belge türleri için özel API’ler
Aspose.OCR for Python for Java, belirli görüntü türlerinden maksimum doğrulukla metin çıkarmak için özel olarak eğitilmiş sinir ağları sunar:
- Taranmış veya fotoğraflanmış kimlik kartları ve pasaportlar.
- Araç plakaları.
- Faturalar.
- Makbuzlar.
Yerleşik yazım denetleyicisi
Aspose.OCR for Python for Java Java yoluyla yüksek tanıma doğruluğu sağlasa da, yazdırma kusurları, kir veya standart dışı yazı tipleri belirli karakterlerin veya kelimelerin yanlış tanınmasına neden olabilir. Tanıma sonuçlarını daha da iyileştirmek için, seçilen tanıma diline göre yazım hatalarını bulup otomatik olarak düzelten yazım denetleyiciyi açabilirsiniz.
Tanınan metin özel terminoloji, kısaltmalar ve genel yazım sözlüklerinde bulunmayan başka sözcükler içeriyorsa, kendi sözcük listelerinizi sağlayabilirsiniz.
Verimli Toplu Tanıma
Python OCR API’miz görüntü tanımayı kolaylaştırmanızı sağlar. Tek bir çağrıda birden fazla görüntünün verimli bir şekilde işlenmesi için çok yönlü toplu işleme yöntemlerinden yararlanın:
- Çok sayfalı PDF, TIFF dosyalarını tanır.
- Bir klasördeki tüm dosyaları işleyin.
- Bir arşivdeki tüm dosyalar için tanımayı yönetin.
- Belirtilen listedeki görüntüleri tanır.
Python Örnekleriyle Öğrenme
OCR çözümümüzün işlevlerini ve yeteneklerini hızlı bir şekilde kavramanıza yardımcı olmak için tasarlanmış çeşitli Python örneklerini keşfedin. Özel iş gereksinimlerinizi karşılayan özelleştirilmiş çözümler oluşturma konusunda hızla fikir edinin.
Özellikler ve Yetenekler
Aspose.OCR for Python via Java Aspose.OCR for Python’un gelişmiş özelliklerini keşfedin
Fotoğraf OCR’si
Akıllı telefon fotoğraflarından tarama düzeyinde doğrulukla metin çıkarın.
Aranabilir PDF
Herhangi bir taramayı tamamen aranabilir ve indekslenebilir bir belgeye dönüştürün.
URL tanıma
Yerel olarak indirmeden URL’deki bir resmi tanıyın.
Toplu tanıma
Çok sayfalı belgeler, klasörler ve arşivlerdeki tüm görselleri okuyun.
Herhangi bir yazı tipi ve stil
Tüm popüler yazı tipleri ve stillerdeki metni tanımlayın ve tanıyın.
Tanıma konusunda ince ayar yapın
En iyi tanıma sonuçları için her OCR parametresini ayarlayın.
Yazım denetleyici
Yanlış yazılan sözcükleri otomatik olarak düzelterek sonuçları iyileştirin.
Resimlerdeki metni bulun
Bir dizi resim içinde metin veya normal ifade arayın.
Resim metinlerini karşılaştırın
Büyük/küçük harfe ve düzene bakılmaksızın iki görüntüdeki metinleri karşılaştırın.
Python Kod Örnekleri
Aspose.OCR for Python’u Java aracılığıyla uygulamalarınıza sorunsuz bir şekilde entegre etmek için kod örneklerini keşfedin.
Zahmetsiz Kurulum
Aspose.OCR for Python, bir Python paketi veya minimum düzeyde bağımlılığa sahip indirilebilir bir dosya olarak Java aracılığıyla kolay dağıtım sağlar. Bunu doğrudan Python’dan projenize entegre edin ve tanıma sonuçlarını çeşitli formatlarda kaydederek eksiksiz OCR özelliklerinden yararlanmaya hazır olun.
Kurulum sonrası, Java aracılığıyla Aspose.OCR for Python’u hemen kullanmaya başlayın, belirli sınırlamalarla da olsa. Geçici lisans, 30 gün boyunca tüm deneme sürümü kısıtlamalarını kaldırır. Bu dönemi, daha sonra Java aracılığıyla Aspose.OCR for Python satın alma konusunda bilinçli bir karar vermenizi sağlayacak, tamamen işlevsel bir OCR uygulamasının geliştirilmesine başlamak için kullanın.
Lisansı yükle
lic = License()
lic.set_license(self.licPath)
Görüntü Tanıma
OCR uygulamalarındaki temel zorluk, son kullanıcılar için tarayıcıların azlığıdır. Java aracılığıyla Python ile sorunsuz bir şekilde entegre olan API’miz, döndürülmüş, çarpık ve gürültülü görüntüleri işleyen sağlam yerleşik görüntü ön işleme filtreleri içerir. Tüm görüntü formatlarını desteklemesiyle birlikte akıllı telefon fotoğraflarından bile güvenilir bir şekilde tanınmaya olanak tanır. Ön işleme ve görüntü düzeltme işlemlerinin çoğu otomatiktir ve yalnızca zorlu durumlarda müdahalenizi gerektirir.
Otomatik görüntü düzeltmelerini uygulama - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Evrensel Dönüştürücü
API’miz tarayıcılardan, kameralardan veya akıllı telefonlardan gelen her türlü görüntüyü ustaca okur: PDF belgeleri, JPEG, PNG, TIFF, GIF, BMP dosyaları. Çok sayfalı PDF belgeleri, TIFF ve DjVu görüntüleri için tam destek, çok yönlülük sağlar. Ayrıca bir URL aracılığıyla web’den bir resim de sağlayabilirsiniz.
Tanıma sonuçları popüler belge ve veri alışverişi formatlarında döndürülür: düz metin, PDF, Microsoft Word, Microsoft Excel, JSON ve XML.
PDF'yi tanıma ve Sonuçları çeşitli çıktı formatlarına kaydetme - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Kaynak Kullanımını Optimize Etme
OCR, seyrek metinli ve gürültülü/renkli arka planlı görüntülerden içerik çıkarmak için özel bir tanıma algoritması sunar. Bu yöntem, aşağıdaki iş durumlarında OCR doğruluğunu önemli ölçüde artırır:
- Sokak fotoğraflarından metni okuyun.
- Sokak görüntülerindeki yol işaretlerini ve tabelalarını bölümlere ayırın ve tanımlayın.
- Fiyat etiketlerini bulun ve çıkarılan metni fiyat olarak yorumlayın.
- Gıda etiketlerinde beslenme bilgileri veya içerik listeleri gibi ilgi çekici bölgeleri bulun ve toplayın.
- Araba plakalarını tanımlayın ve analiz edin.
- Menülerden ve kataloglardan metin çıkarın.
Açık alan OCR'si - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Sokak fotoğraflarından metin çıkarma
Python için OCR, karanlık ve bulanık fotoğraflar da dahil olmak üzere araç plakalarından metin çıkaran özel bir tanıma algoritması sunar. Ortaya çıkan metin daha sonra otomatik olarak veritabanına kaydedilebilir veya otomatik olarak doğrulanabilir.
Araba numarasını tanıma - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)