ทำไมต้อง Aspose.OCR สำหรับ Python ผ่าน Java

Aspose.OCR สำหรับ Python ผ่าน Java ผสานรวมความสามารถในการรู้จำอักขระด้วยแสง (OCR) อันทรงพลังเข้ากับโน้ตบุ๊กและแอปพลิเคชัน Python ข้ามแพลตฟอร์มของคุณได้อย่างราบรื่น ด้วย API ที่ใช้งานง่ายและความเร็วสูงของเรา คุณสามารถแยกข้อความจากการสแกน ภาพหน้าจอ เว็บลิงก์ หรือภาพถ่ายจากสมาร์ทโฟนได้อย่างง่ายดาย โดยให้ผลลัพธ์ที่พร้อมสำหรับการรวม การวิเคราะห์ หรือการจัดเก็บ จดจำรูปภาพที่สแกน ภาพถ่ายสมาร์ทโฟน ภาพหน้าจอ และ PDF ที่สแกน บันทึกผลลัพธ์ในรูปแบบเอกสารยอดนิยม ฟิลเตอร์ก่อนการประมวลผลขั้นสูงช่วยจัดการกับภาพที่หมุน บิดเบี้ยว และมีสัญญาณรบกวน เพิ่มประสิทธิภาพการทำงานโดยการโอนงานไปยัง GPU

Illustration ocr

OCR ที่รวดเร็วและแม่นยำ

บรรลุผลลัพธ์ OCR ที่รวดเร็วและแม่นยำด้วย Python ขั้นสูงของเราผ่านเทคโนโลยี Java

การสนับสนุนหลายภาษา

จดจำข้อความใน 28 ภาษา รวมถึงสคริปต์ละติน ซีริลลิก และจีน เพื่อให้มั่นใจถึงความคล่องตัวสำหรับแอปพลิเคชัน Python ของคุณผ่านทาง Java

การสนับสนุนภาพที่ยืดหยุ่น

ประมวลผลภาพจากเครื่องสแกน กล้อง และสมาร์ทโฟนได้อย่างราบรื่นด้วย Python ผ่าน Java

ความแม่นยำในการรู้จำตัวอักษรจีน

จดจำตัวอักษรจีนมากกว่า 6,000 ตัวอย่างแม่นยำในโปรเจ็กต์ Python ของคุณผ่าน Java

รักษาลักษณะแบบอักษรและการจัดรูปแบบ

รักษารูปแบบตัวอักษรและการจัดรูปแบบเพื่อการแสดงข้อความที่รู้จักในแอปพลิเคชัน Python ของคุณผ่านทาง Java อย่างถูกต้อง

ตัวอย่างโค้ดสด

เริ่มต้นการจดจำข้อความจากรูปภาพด้วยโค้ดเพียงสามบรรทัด สัมผัสความเรียบง่าย!

พร้อมรับรู้ พร้อมรับรู้ วางไฟล์ที่นี่หรือคลิกเพื่อเรียกดู *

* โดยการอัพโหลดไฟล์ของคุณหรือใช้บริการแสดงว่าคุณเห็นด้วยกับเรา ข้อกำหนดการใช้งาน และ นโยบายความเป็นส่วนตัว.

ผลการรับรู้
 

แปลงรูปภาพเป็นข้อความ

ตัวอย่างเพิ่มเติม >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

ความเข้ากันได้ของแบ็กเอนด์ Java

ออกแบบมาเป็นโมดูล Python ไลบรารีของเรารับประกันความเข้ากันได้กับระบบปฏิบัติการหลักที่รองรับ Java - รวมถึง Microsoft Windows, Linux และ macOS หรือ แพลตฟอร์มคลาวด์ สิ่งนี้ช่วยให้คุณสามารถพัฒนาแอปพลิเคชันบนแพลตฟอร์มหนึ่งและรันบนแพลตฟอร์มอื่นได้อย่างราบรื่น โดยไม่จำเป็นต้องแก้ไขโค้ดใดๆ

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

รูปแบบไฟล์ที่รองรับ

Aspose.OCR for Python via Java สามารถทำงานกับ [ไฟล์]แทบทุกชนิด( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) คุณสามารถรับได้จากเครื่องสแกนหรือกล้อง ผลลัพธ์การจดจำจะถูกส่งกลับในรูปแบบไฟล์และการแลกเปลี่ยนข้อมูลที่ได้รับความนิยมสูงสุด ซึ่งสามารถบันทึก นำเข้าไปยังฐานข้อมูล หรือวิเคราะห์แบบเรียลไทม์

รูปภาพ

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR เป็นกลุ่ม

  • Multi-page PDF
  • ZIP
  • Folder

ผลการรับรู้

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

การติดตั้ง Python ผ่าน Java ได้อย่างง่ายดาย

Aspose.OCR สำหรับ Python ผ่าน Java จัดส่งเป็นแพ็คเกจ Python หรือเป็น ไฟล์ที่ดาวน์โหลดได้ โดยมีการอ้างอิงน้อยที่สุด ติดตั้ง ลงในโปรเจ็กต์ของคุณได้อย่างง่ายดาย และคุณพร้อมที่จะจดจำข้อความในภาษาที่รองรับหลายภาษา และบันทึกผลลัพธ์การจดจำในรูปแบบต่างๆ

ขอใบอนุญาตรุ่นทดลองใช้ เพื่อเริ่มต้นการพัฒนาแอปพลิเคชัน OCR ที่ทำงานได้อย่างสมบูรณ์โดยไม่มีข้อจำกัด

OCR อันทรงพลังสำหรับแอปพลิเคชัน Python

ไลบรารีของเราผสานรวมได้อย่างง่ายดาย ช่วยให้แอปพลิเคชัน Python ทำงานได้อย่างราบรื่นบนแพลตฟอร์มใดๆ – เดสก์ท็อป Windows, Windows Server, macOS, Linux และคลาวด์

28 ภาษาการรับรู้

Python และ Java OCR API ของเรารู้จักภาษาและสคริปต์การเขียนยอดนิยมมากมาย รวมถึงภาษาผสม:

ปล่อยให้การตรวจจับภาษาเป็นหน้าที่ของห้องสมุดหรือกำหนดภาษาด้วยตัวคุณเองเพื่อเพิ่มประสิทธิภาพในการจดจำและความน่าเชื่อถือ

  • อักษรละตินแบบขยาย: โครเอเชีย, เช็ก, เดนมาร์ก, ดัตช์, อังกฤษ, เอสโตเนีย, ฟินแลนด์, ฝรั่งเศส, เยอรมัน, อิตาลี, ลัตเวีย, ลิทัวเนีย, นอร์เวย์, โปแลนด์, โปรตุเกส, โรมาเนีย, สโลวาเกีย, สโลวีเนีย, สเปน, สวีเดน;
  • อักษรซีริลลิก: เบโลรุสเซีย บัลแกเรีย คาซัค รัสเซีย เซอร์เบีย ยูเครน;
  • ภาษาจีน: มากกว่า 6,000 ตัวอักษร
  • ภาษาฮินดี.

ตัวกรองการประมวลผลภาพที่ปรับปรุงแล้ว

ความแม่นยำของการรู้จำอักขระด้วยแสงขึ้นอยู่กับคุณภาพของภาพต้นฉบับเป็นอย่างมาก Aspose.OCR สำหรับ Python ผ่าน Java นำเสนอตัวกรองการประมวลผลภาพทั้งแบบอัตโนมัติและแบบแมนนวลที่หลากหลาย เพื่อปรับภาพให้เหมาะสมก่อนที่จะส่งไปยังกลไก OCR:

  • ปรับภาพที่เอียงเล็กน้อยให้ตรงโดยอัตโนมัติ
  • แก้ไขการหมุนของภาพที่บิดเบี้ยวอย่างรุนแรงด้วยตนเอง
  • ขจัดสิ่งสกปรก จุด รอยขีดข่วน แสงจ้า การไล่ระดับสีที่ไม่ต้องการ และเสียงรบกวนประเภทอื่นๆ โดยอัตโนมัติ
  • ปรับความคมชัดของภาพโดยอัตโนมัติ
  • ปรับขนาดภาพโดยอัตโนมัติหรือปรับขนาดภาพด้วยตนเอง
  • แปลงภาพเป็นขาวดำหรือระดับสีเทา
  • สลับสีของภาพ ทำให้บริเวณที่สว่างปรากฏมืด และพื้นที่มืดปรากฏสว่าง
  • เพิ่มความหนาของตัวอักษรในภาพ
  • เบลอภาพที่มีสัญญาณรบกวนโดยคงขอบตัวอักษรไว้
  • ปรับการเอียงของหน้าให้ตรงและแก้ไขความผิดเพี้ยนของเลนส์กล้องในรูปภาพของหน้า

API เฉพาะสำหรับเอกสารประเภทต่างๆ

Aspose.OCR สำหรับ Python ผ่าน Java เสนอโครงข่ายประสาทเทียมที่ได้รับการฝึกมาเป็นพิเศษเพื่อแยกข้อความจากรูปภาพบางประเภทด้วยความแม่นยำสูงสุด:

  • บัตรประจำตัวประชาชนและหนังสือเดินทางที่สแกนหรือถ่ายรูป
  • ป้ายทะเบียนรถยนต์.
  • ใบแจ้งหนี้
  • รายรับ.

เครื่องตรวจสอบการสะกดคำในตัว

แม้ว่า Aspose.OCR สำหรับ Python ผ่าน Java จะให้ความแม่นยำในการรู้จำสูง แต่ข้อบกพร่องในการพิมพ์ สิ่งสกปรก หรือแบบอักษรที่ไม่ได้มาตรฐานอาจทำให้อักขระหรือคำบางตัวถูกจดจำอย่างไม่ถูกต้อง หากต้องการปรับปรุงผลลัพธ์การจดจำเพิ่มเติม คุณสามารถเปิดเครื่องตรวจสอบการสะกด ซึ่งจะค้นหาและแก้ไขข้อผิดพลาดในการสะกดโดยอัตโนมัติตามภาษาการจดจำที่เลือก

หากข้อความที่รู้จักมีคำศัพท์เฉพาะทาง ตัวย่อ และคำอื่นๆ ที่ไม่มีอยู่ในพจนานุกรมตัวสะกดทั่วไป คุณสามารถจัดเตรียมรายการคำของคุณเองได้

การรับรู้แบทช์ที่มีประสิทธิภาพ

Python OCR API ของเราช่วยให้คุณเพิ่มประสิทธิภาพการจดจำรูปภาพได้ ใช้วิธีการประมวลผลแบบกลุ่มที่หลากหลายเพื่อการประมวลผลภาพหลายภาพอย่างมีประสิทธิภาพในการเรียกครั้งเดียว:

  • รู้จักไฟล์ PDF, TIFF หลายหน้า
  • ประมวลผลไฟล์ทั้งหมดภายในโฟลเดอร์
  • จัดการการจดจำไฟล์ทั้งหมดในไฟล์เก็บถาวร
  • จดจำภาพจากรายการที่ระบุ

การเรียนรู้ผ่านตัวอย่าง Python

สำรวจ ตัวอย่าง Python ต่างๆ ที่ออกแบบมาเพื่อช่วยให้คุณเข้าใจฟังก์ชันและความสามารถของโซลูชัน OCR ของเราได้อย่างรวดเร็ว รับข้อมูลเชิงลึกอย่างรวดเร็วในการสร้างโซลูชันที่ปรับแต่งให้ตรงตามความต้องการทางธุรกิจเฉพาะของคุณ

คุณสมบัติและความสามารถ

Aspose.OCR for Python via Java สำรวจคุณสมบัติขั้นสูงของ Aspose.OCR สำหรับ Python

Feature icon

OCR ภาพถ่าย

แยกข้อความจากภาพถ่ายสมาร์ทโฟนด้วยความแม่นยำระดับการสแกน

Feature icon

PDF ที่ค้นหาได้

แปลงการสแกนใดๆ ให้เป็นเอกสารที่สามารถค้นหาและจัดทำดัชนีได้อย่างสมบูรณ์

Feature icon

การรับรู้ URL

จดจำรูปภาพจาก URL โดยไม่ต้องดาวน์โหลดในเครื่อง

Feature icon

การรับรู้จำนวนมาก

อ่านรูปภาพทั้งหมดจากเอกสาร โฟลเดอร์ และเอกสารสำคัญหลายหน้า

Feature icon

แบบอักษรและสไตล์ใดก็ได้

ระบุและจดจำข้อความในแบบอักษรและสไตล์ยอดนิยมทั้งหมด

Feature icon

การรับรู้แบบละเอียด

ปรับทุกพารามิเตอร์ OCR เพื่อผลลัพธ์การจดจำที่ดีที่สุด

Feature icon

เครื่องตรวจตัวสะกด

ปรับปรุงผลลัพธ์โดยการแก้ไขคำที่สะกดผิดโดยอัตโนมัติ

Feature icon

ค้นหาข้อความในรูปภาพ

ค้นหาข้อความหรือนิพจน์ทั่วไปภายในชุดรูปภาพ

Feature icon

เปรียบเทียบข้อความรูปภาพ

เปรียบเทียบข้อความบนรูปภาพสองภาพ โดยไม่คำนึงถึงตัวพิมพ์และเค้าโครง

ตัวอย่างโค้ด Python

ค้นหาตัวอย่างโค้ดเพื่อผสานรวม Aspose.OCR สำหรับ Python ผ่าน Java เข้ากับแอปพลิเคชันของคุณได้อย่างราบรื่น

การติดตั้งที่ไม่ยุ่งยาก

เนื่องจากเป็นแพ็คเกจ Python หรือไฟล์ที่ดาวน์โหลดได้โดยมีการพึ่งพาน้อยที่สุด Aspose.OCR สำหรับ Python ผ่าน Java ช่วยให้กระจายได้ง่าย รวมเข้ากับโปรเจ็กต์ของคุณโดยตรงจาก Python และคุณพร้อมที่จะใช้ประโยชน์จากความสามารถ OCR ที่สมบูรณ์ โดยบันทึกผลการจดจำในรูปแบบต่างๆ

หลังการติดตั้ง ให้เริ่มใช้ Aspose.OCR สำหรับ Python ผ่าน Java ทันที แม้ว่าจะมีข้อจำกัดบางประการก็ตาม ใบอนุญาตชั่วคราวจะลบข้อจำกัดเวอร์ชันทดลองใช้งานทั้งหมดเป็นเวลา 30 วัน ใช้ช่วงเวลานี้เพื่อเริ่มต้นการพัฒนาแอปพลิเคชัน OCR ที่มีฟังก์ชันการทำงานเต็มรูปแบบ ซึ่งจะทำให้คุณสามารถตัดสินใจอย่างมีข้อมูลในการซื้อ Aspose.OCR สำหรับ Python ผ่าน Java ในภายหลัง

โหลดใบอนุญาต

lic = License()
lic.set_license(self.licPath)

การรับรู้ภาพ

ความท้าทายหลักในการใช้งาน OCR คือการขาดแคลนเครื่องสแกนสำหรับผู้ใช้ปลายทาง API ของเราซึ่งผสานรวมกับ Python ผ่านทาง Java ได้อย่างราบรื่น มีตัวกรองการประมวลผลล่วงหน้ารูปภาพในตัวที่มีประสิทธิภาพในการจัดการภาพที่หมุน บิดเบี้ยว และมีสัญญาณรบกวน เมื่อรวมเข้ากับการรองรับรูปแบบภาพทั้งหมด ทำให้สามารถจดจำได้อย่างน่าเชื่อถือ แม้แต่จากภาพถ่ายจากสมาร์ทโฟนก็ตาม การประมวลผลล่วงหน้าและการแก้ไขภาพส่วนใหญ่เป็นแบบอัตโนมัติ โดยคุณต้องดำเนินการเฉพาะในกรณีที่ท้าทายเท่านั้น

ใช้การแก้ไขภาพอัตโนมัติ - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python ตัวแปลงสากล

API ของเราจะอ่านรูปภาพจากเครื่องสแกน กล้อง หรือสมาร์ทโฟนอย่างเชี่ยวชาญ: เอกสาร PDF, ไฟล์ JPEG, PNG, TIFF, GIF, BMP การสนับสนุนอย่างเต็มที่สำหรับเอกสาร PDF หลายหน้า, TIFF และรูปภาพ DjVu ช่วยให้มั่นใจได้ถึงความคล่องตัว คุณยังสามารถจัดเตรียมรูปภาพจากเว็บผ่านทาง URL ได้อีกด้วย

ผลลัพธ์การรับรู้จะถูกส่งกลับในรูปแบบเอกสารและข้อมูลการแลกเปลี่ยนยอดนิยม: ข้อความธรรมดา, PDF, Microsoft Word, Microsoft Excel, JSON และ XML

จดจำ PDF และบันทึกผลลัพธ์เป็นรูปแบบเอาต์พุตต่างๆ - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

การเพิ่มประสิทธิภาพการใช้ทรัพยากร

OCR นำเสนออัลกอริธึมการจดจำพิเศษสำหรับการแยกเนื้อหาออกจากรูปภาพที่มีข้อความกระจัดกระจายและพื้นหลังที่มีสัญญาณรบกวน/มีสี วิธีการนี้ช่วยเพิ่มความแม่นยำของ OCR ได้อย่างมากในกรณีทางธุรกิจต่อไปนี้:

  • อ่านข้อความจากภาพถ่ายถนน
  • แบ่งกลุ่มและระบุป้ายจราจรและป้ายบอกทางภายในภาพถนน
  • ค้นหาป้ายราคาและตีความข้อความที่แยกออกมาเป็นราคา
  • ค้นหาและรวบรวมภูมิภาคที่สนใจบนฉลากอาหาร เช่น ข้อมูลโภชนาการหรือรายการส่วนผสม
  • ระบุและวิเคราะห์ป้ายทะเบียนรถยนต์
  • แยกข้อความจากเมนูและแค็ตตาล็อก

OCR พื้นที่เปิด - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

แยกข้อความจากภาพถ่ายถนน

OCR สำหรับ Python นำเสนออัลกอริธึมการจดจำพิเศษที่แยกข้อความจากป้ายทะเบียนรถยนต์ รวมถึงภาพถ่ายที่มืดและพร่ามัว ข้อความผลลัพธ์จะถูกบันทึกลงในฐานข้อมูลโดยอัตโนมัติหรือตรวจสอบโดยอัตโนมัติ

จดจำหมายเลขรถ - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)