Neden Java aracılığıyla Python için Aspose.OCR?

Aspose.OCR for Python for Java, güçlü optik karakter tanıma (OCR) özelliklerini platformlar arası Python dizüstü bilgisayarlarınıza ve uygulamalarınıza sorunsuz bir şekilde entegre eder. Sezgisel ve yüksek hızlı API’miz sayesinde taramalardan, ekran görüntülerinden, web bağlantılarından veya akıllı telefon fotoğraflarından zahmetsizce metin çıkarabilir ve birleştirme, analiz veya depolamaya hazır sonuçlar sunabilirsiniz. Taranmış görüntüleri, akıllı telefon fotoğraflarını, ekran görüntülerini ve taranmış PDF’leri tanıyarak sonuçları popüler belge formatlarında kaydedin. Gelişmiş ön işleme filtreleri döndürülmüş, çarpık ve gürültülü görüntüleri işler. Görevleri GPU’ya aktararak performansı optimize edin.

Illustration ocr

Hızlı ve Doğru OCR

Java teknolojisi aracılığıyla gelişmiş Python'umuzla yüksek hızlı ve doğru OCR sonuçlarına ulaşın.

Çok Dilli Destek

Latince, Kiril, Arapça, Farsça, Hintçe ve Çince alfabeler dahil 130'dan fazla dilde metni tanıyarak Java aracılığıyla Python uygulamalarınız için çok yönlülük sağlar.

Esnek Görüntü Desteği

Java aracılığıyla Python ile tarayıcılardan, kameralardan ve akıllı telefonlardan gelen görüntüleri sorunsuz bir şekilde işleyin.

Çince Karakter Tanımada Hassasiyet

Python projelerinizde Java aracılığıyla 6.000'den fazla Çince karakteri hassasiyetle tanıyın.

Yazı Tipi Stillerini ve Biçimlendirmeyi Koru

Tanınan metnin Java aracılığıyla Python uygulamalarınızda doğru şekilde temsil edilmesi için yazı tipi stillerini ve formatını koruyun.

Canlı kod örneği

Yalnızca üç satırlık kodla resimlerden metin tanımayı başlatın. Sadeliği deneyimleyin!

Tanımaya hazır Tanımaya hazır Buraya bir dosya bırakın veya göz atmak için tıklayın *

* Dosyalarınızı yükleyerek veya hizmeti kullanarak, sözleşmemizi kabul etmiş olursunuz. Kullanım koşulları Ve Gizlilik Politikası.

Tanıma sonucu
 

Resmi metne dönüştür

Daha fazla örnek >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Tercihinizi seçin

İhtiyaçlarınıza göre doğru kütüphaneyi seçin. En verimli çözümü seçmek için mevcut API’leri ve bunların yeteneklerini keşfedin.

Çok yönlülük

Python via .NET

Kodun kolay geliştirilmesi, okunabilirliği ve bakımı
En fazla özelliğe sahiptir ve en sık güncellemeleri alır
Genel hız diğer platformlara göre biraz daha yavaş olabilir

Tekdüzelik

Python via Java

Aynı kütüphaneyi istediğiniz platformda kullanın
Uygulamanızı herhangi bir cihazda sorunsuz bir şekilde çalıştırın
Java Runtime Environment (JRE) sürüm 8 veya üzerini gerektirir

Performans

Python via C++

Platformdan bağımsız olarak mümkün olan en yüksek hız
Kaynak yönetimi üzerinde büyük kontrol
Deneyimli geliştiricilere yönelik

Java Arka Uç Uyumluluğu

Python modülü olarak tasarlanan kitaplığımız, Microsoft Windows, Linux ve macOS dahil olmak üzere Java destekleyen başlıca işletim sistemleriyle uyumluluk sağlar. bulut platformları. Bu, uygulamaları bir platformda geliştirmenize ve bunları başka bir platformda sorunsuz bir şekilde çalıştırmanıza olanak tanıyarak herhangi bir kod değişikliği ihtiyacını ortadan kaldırır.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Desteklenen dosya formatları

Aspose.OCR for Python via Java herhangi bir [dosya]ile çalışabilir( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) bir tarayıcıdan veya kameradan alabilirsiniz. Tanıma sonuçları gerçek zamanlı olarak kaydedilebilir, bir veritabanına aktarılabilir veya analiz edilebilir.

Görseller

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Toplu OCR

  • Multi-page PDF
  • ZIP
  • Folder

Tanıma sonuçları

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Java Üzerinden Python İçin Zahmetsiz Kurulum

Aspose.OCR for Python for Java, Java aracılığıyla bir Python paketi veya minimum düzeyde bağımlılıkla indirilebilir dosya olarak sunulur. Projenize kolayca yükleyin ve desteklenen birden fazla dildeki metinleri tanımaya ve tanıma sonuçlarını çeşitli formatlarda kaydetmeye hazırsınız.

Sınırlama olmaksızın tamamen işlevsel bir OCR uygulamasının geliştirilmesine başlamak için deneme lisansı isteyin .

Python Uygulamaları için Güçlü OCR

Kitaplığımız kolayca entegre olur ve Python uygulamalarının masaüstü Windows, Windows Server, macOS, Linux ve bulut gibi herhangi bir platformda sorunsuz bir şekilde çalışmasını sağlar.

130+ Tanıma Dili

Python ve Java OCR API’miz, karışık diller de dahil olmak üzere çok sayıda dili ve popüler yazma komut dosyalarını tanır:

Gelişmiş tanıma performansı ve güvenilirliği için dil algılamayı kitaplığa bırakın veya dili kendiniz tanımlayın.

  • Genişletilmiş Latin alfabesi: İngilizce, İspanyolca, Fransızca, Endonezce, Portekizce, Almanca, Vietnamca, Türkçe, İtalyanca, Lehçe ve 80’den fazla alfabe;
  • Kiril alfabesi: Rusça, Ukraynaca, Kazakça, Sırpça, Belarusça, Bulgarca;
  • Arapça, Farsça, Urduca;
  • Hintçe, Marathi, Bhojpuri ve diğerleri de dahil olmak üzere Çin ve Devanagari alfabesi.

Gelişmiş Görüntü İşleme Filtreleri

Optik karakter tanımanın kesinliği büyük ölçüde orijinal görüntünün kalitesine bağlıdır. Aspose.OCR for Python for Java, bir görüntüyü OCR motoruna göndermeden önce optimize etmek için hem otomatik hem de manuel görüntü işleme filtrelerinin geniş bir yelpazesini sunar:

  • Hafif eğik görüntüleri otomatik olarak düzeltin.
  • Ciddi derecede eğrilmiş görüntülerin dönüşünü manuel olarak düzeltin.
  • Kiri, lekeleri, çizikleri, parlamayı, istenmeyen eğimleri ve diğer gürültü türlerini otomatik olarak kaldırın.
  • Görüntü kontrastını otomatik olarak ayarlayın.
  • Görüntüyü otomatik olarak büyütün veya manuel olarak yeniden boyutlandırın.
  • Görüntüleri siyah beyaza veya gri tonlamaya dönüştürün.
  • Görüntü renklerini ters çevirerek açık alanların koyu, koyu alanların açık görünmesini sağlayın.
  • Görüntüdeki karakterlerin kalınlığını artırın.
  • Harf kenarlarını korurken gürültülü görüntüleri bulanıklaştırın.
  • Sayfa fotoğraflarındaki sayfa eğriliğini düzeltin ve kamera merceği bozulmasını düzeltin.

Çeşitli belge türleri için özel API’ler

Aspose.OCR for Python for Java, belirli görüntü türlerinden maksimum doğrulukla metin çıkarmak için özel olarak eğitilmiş sinir ağları sunar:

  • Taranmış veya fotoğraflanmış kimlik kartları ve pasaportlar.
  • Araç plakaları.
  • Faturalar.
  • Makbuzlar.

Yerleşik yazım denetleyicisi

Aspose.OCR for Python for Java Java yoluyla yüksek tanıma doğruluğu sağlasa da, yazdırma kusurları, kir veya standart dışı yazı tipleri belirli karakterlerin veya kelimelerin yanlış tanınmasına neden olabilir. Tanıma sonuçlarını daha da iyileştirmek için, seçilen tanıma diline göre yazım hatalarını bulup otomatik olarak düzelten yazım denetleyiciyi açabilirsiniz.

Tanınan metin özel terminoloji, kısaltmalar ve genel yazım sözlüklerinde bulunmayan başka sözcükler içeriyorsa, kendi sözcük listelerinizi sağlayabilirsiniz.

Verimli Toplu Tanıma

Python OCR API’miz görüntü tanımayı kolaylaştırmanızı sağlar. Tek bir çağrıda birden fazla görüntünün verimli bir şekilde işlenmesi için çok yönlü toplu işleme yöntemlerinden yararlanın:

  • Çok sayfalı PDF, TIFF dosyalarını tanır.
  • Bir klasördeki tüm dosyaları işleyin.
  • Bir arşivdeki tüm dosyalar için tanımayı yönetin.
  • Belirtilen listedeki görüntüleri tanır.

Python Örnekleriyle Öğrenme

OCR çözümümüzün işlevlerini ve yeteneklerini hızlı bir şekilde kavramanıza yardımcı olmak için tasarlanmış çeşitli Python örneklerini keşfedin. Özel iş gereksinimlerinizi karşılayan özelleştirilmiş çözümler oluşturma konusunda hızla fikir edinin.

Özellikler ve Yetenekler

Aspose.OCR for Python via Java Aspose.OCR for Python’un gelişmiş özelliklerini keşfedin

Feature icon

Fotoğraf OCR’si

Akıllı telefon fotoğraflarından tarama düzeyinde doğrulukla metin çıkarın.

Feature icon

Aranabilir PDF

Herhangi bir taramayı tamamen aranabilir ve indekslenebilir bir belgeye dönüştürün.

Feature icon

URL tanıma

Yerel olarak indirmeden URL’deki bir resmi tanıyın.

Feature icon

Toplu tanıma

Çok sayfalı belgeler, klasörler ve arşivlerdeki tüm görselleri okuyun.

Feature icon

Herhangi bir yazı tipi ve stil

Tüm popüler yazı tipleri ve stillerdeki metni tanımlayın ve tanıyın.

Feature icon

Tanıma konusunda ince ayar yapın

En iyi tanıma sonuçları için her OCR parametresini ayarlayın.

Feature icon

Yazım denetleyici

Yanlış yazılan sözcükleri otomatik olarak düzelterek sonuçları iyileştirin.

Feature icon

Resimlerdeki metni bulun

Bir dizi resim içinde metin veya normal ifade arayın.

Feature icon

Resim metinlerini karşılaştırın

Büyük/küçük harfe ve düzene bakılmaksızın iki görüntüdeki metinleri karşılaştırın.

Python Kod Örnekleri

Aspose.OCR for Python’u Java aracılığıyla uygulamalarınıza sorunsuz bir şekilde entegre etmek için kod örneklerini keşfedin.

Zahmetsiz Kurulum

Aspose.OCR for Python, bir Python paketi veya minimum düzeyde bağımlılığa sahip indirilebilir bir dosya olarak Java aracılığıyla kolay dağıtım sağlar. Bunu doğrudan Python’dan projenize entegre edin ve tanıma sonuçlarını çeşitli formatlarda kaydederek eksiksiz OCR özelliklerinden yararlanmaya hazır olun.

Kurulum sonrası, Java aracılığıyla Aspose.OCR for Python’u hemen kullanmaya başlayın, belirli sınırlamalarla da olsa. Geçici lisans, 30 gün boyunca tüm deneme sürümü kısıtlamalarını kaldırır. Bu dönemi, daha sonra Java aracılığıyla Aspose.OCR for Python satın alma konusunda bilinçli bir karar vermenizi sağlayacak, tamamen işlevsel bir OCR uygulamasının geliştirilmesine başlamak için kullanın.

Lisansı yükle

lic = License()
lic.set_license(self.licPath)

Görüntü Tanıma

OCR uygulamalarındaki temel zorluk, son kullanıcılar için tarayıcıların azlığıdır. Java aracılığıyla Python ile sorunsuz bir şekilde entegre olan API’miz, döndürülmüş, çarpık ve gürültülü görüntüleri işleyen sağlam yerleşik görüntü ön işleme filtreleri içerir. Tüm görüntü formatlarını desteklemesiyle birlikte akıllı telefon fotoğraflarından bile güvenilir bir şekilde tanınmaya olanak tanır. Ön işleme ve görüntü düzeltme işlemlerinin çoğu otomatiktir ve yalnızca zorlu durumlarda müdahalenizi gerektirir.

Otomatik görüntü düzeltmelerini uygulama - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Evrensel Dönüştürücü

API’miz tarayıcılardan, kameralardan veya akıllı telefonlardan gelen her türlü görüntüyü ustaca okur: PDF belgeleri, JPEG, PNG, TIFF, GIF, BMP dosyaları. Çok sayfalı PDF belgeleri, TIFF ve DjVu görüntüleri için tam destek, çok yönlülük sağlar. Ayrıca bir URL aracılığıyla web’den bir resim de sağlayabilirsiniz.

Tanıma sonuçları popüler belge ve veri alışverişi formatlarında döndürülür: düz metin, PDF, Microsoft Word, Microsoft Excel, JSON ve XML.

PDF'yi tanıma ve Sonuçları çeşitli çıktı formatlarına kaydetme - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Kaynak Kullanımını Optimize Etme

OCR, seyrek metinli ve gürültülü/renkli arka planlı görüntülerden içerik çıkarmak için özel bir tanıma algoritması sunar. Bu yöntem, aşağıdaki iş durumlarında OCR doğruluğunu önemli ölçüde artırır:

  • Sokak fotoğraflarından metni okuyun.
  • Sokak görüntülerindeki yol işaretlerini ve tabelalarını bölümlere ayırın ve tanımlayın.
  • Fiyat etiketlerini bulun ve çıkarılan metni fiyat olarak yorumlayın.
  • Gıda etiketlerinde beslenme bilgileri veya içerik listeleri gibi ilgi çekici bölgeleri bulun ve toplayın.
  • Araba plakalarını tanımlayın ve analiz edin.
  • Menülerden ve kataloglardan metin çıkarın.

Açık alan OCR'si - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Sokak fotoğraflarından metin çıkarma

Python için OCR, karanlık ve bulanık fotoğraflar da dahil olmak üzere araç plakalarından metin çıkaran özel bir tanıma algoritması sunar. Ortaya çıkan metin daha sonra otomatik olarak veritabanına kaydedilebilir veya otomatik olarak doğrulanabilir.

Araba numarasını tanıma - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)