Aspose.OCR  for C++

แปลงรูปภาพและ PDF เป็นข้อความใน C++

เพิ่มการรู้จำอักขระด้วยแสง (OCR) ให้กับแอปพลิเคชัน C++ ของคุณด้วยโค้ดสองสามบรรทัด

  Download Free Trial
  
 

Aspose.OCR สำหรับ C++ ขยายแอปพลิเคชันของคุณด้วยความสามารถในการจดจำอักขระด้วยแสงในโค้ด 5 บรรทัด ประสบการณ์ของเราในโครงข่ายประสาทเทียมและแมชชีนเลิร์นนิงได้รับการแปลเป็นไลบรารี OCR ด้วยประสิทธิภาพและความแม่นยำที่เหนือกว่า ซึ่งรองรับ 26 ภาษาตามสคริปต์ ภาษาละติน และ ซิริลลิก ตลอดจน ภาษาจีน OCR API สามารถจดจำภาพที่สแกน ภาพถ่ายจากสมาร์ทโฟน ภาพหน้าจอ พื้นที่ของรูปภาพ และ PDF ที่สแกน และส่งคืนผลลัพธ์ในรูปแบบเอกสารและการแลกเปลี่ยนข้อมูลยอดนิยม เป็นแบบออฟไลน์โดยสมบูรณ์และไม่จำเป็นต้องเชื่อมต่ออินเทอร์เน็ตเพื่อทำงาน API ต้องการความพยายามเพียงเล็กน้อยในการเริ่มต้นและช่วงการเรียนรู้ที่ตื้นจนถึงระดับผู้เชี่ยวชาญ การประมวลผลล่วงหน้า การแก้ไขความเบ้ การลบเสียงรบกวน การตรวจจับภาษา มัลติเธรด และงานที่ซับซ้อนอื่นๆ ทั้งหมดจะดำเนินการโดยอัตโนมัติ แต่สามารถปรับให้เข้ากับเคสที่มีปัญหาได้

คุณสมบัติ C++ OCR API ขั้นสูง

แยกข้อความจากรูปภาพและสร้าง PDF ที่ค้นหาได้

รองรับรูปภาพใด ๆ ที่คุณจะได้รับจากเครื่องสแกนหรือกล้อง

อ่านสคริปต์ละตินและซิริลลิกแบบขยาย

รู้จักตัวอักษรจีนมากกว่า 6,000 ตัว

ตรวจจับและจดจำแบบอักษรและการจัดรูปแบบยอดนิยมทั้งหมด

ประมวลผลภาพล่วงหน้าก่อนการจดจำ

ประมวลผลทั้งภาพหรือพื้นที่ที่เลือกเท่านั้น

รองรับการหมุนภาพเบ้และมีสัญญาณรบกวน

การจดจำชุดของภาพทั้งหมดในโฟลเดอร์หรือไฟล์เก็บถาวร

รับรู้รูปภาพที่ให้ไว้เป็นลิงก์ของเว็บ

ค้นหาและแก้ไขคำที่สะกดผิดโดยอัตโนมัติ

รับผลการรับรู้เป็น JSON

ง่ายต่อการใช้

คุณยังคิดว่า C ++ OCR นั้นยากไหม ด้วยไลบรารีของเรา คุณต้องการโค้ดเพียง 5 บรรทัดในการจดจำรูปภาพและแสดงผล ลองใช้รหัสนี้และดูด้วยตัวคุณเอง:

รูปภาพเป็นข้อความใน 5 บรรทัด - C++

// ระบุเส้นทางภาพ
std::string image_path = "../Data/Source/sample.png";

// เตรียมบัฟเฟอร์สำหรับผลลัพธ์
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// ทำมายากล
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// แสดงผลการรับรู้
std::wcout << buffer << L"\n";

26 ภาษาที่ได้รับการยอมรับ

OCR API สามารถจดจำภาษาจำนวนมากและสคริปต์การเขียนยอดนิยมทั้งหมด รวมถึงข้อความที่มีภาษาผสม

  • ตัวอักษรละตินแบบขยาย : โครเอเชีย เช็ก เดนมาร์ก ดัตช์ อังกฤษ เอสโตเนีย ฟินแลนด์ ฝรั่งเศส เยอรมัน อิตาลี ลัตเวีย ลิทัวเนีย นอร์เวย์ โปแลนด์ โปรตุเกส โรมาเนีย สโลวัก สโลวีเนีย สเปน สวีเดน
  • อักษรซีริลลิก : เบลารุส บัลแกเรีย คาซัค รัสเซีย เซอร์เบีย ยูเครน
  • ภาษาจีน : มากกว่า 6,000 ตัวอักษร

คุณสามารถปล่อยให้การตรวจหาภาษาไปที่ห้องสมุดหรือกำหนดภาษาด้วยตนเองเพื่อเพิ่มประสิทธิภาพการรู้จำและความน่าเชื่อถือ

การประมวลผลแบทช์

OCR API ช่วยให้คุณไม่ต้องจำทุกภาพทีละภาพโดยเสนอวิธีการประมวลผลแบบกลุ่มต่างๆ ที่ช่วยให้คุณจดจำภาพหลายภาพในการเรียกครั้งเดียว:

  • การรับรู้ไฟล์ PDF และ TIFF แบบหลายหน้า
  • การรับรู้ของไฟล์ทั้งหมดในโฟลเดอร์
  • การรับรู้ของไฟล์ทั้งหมดในไฟล์เก็บถาวร

รู้จักไฟล์ ZIP - C++

// ระบุเส้นทางการเก็บถาวร
std::string archive_path = "book.zip";

// เตรียมบัฟเฟอร์สำหรับผลลัพธ์
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// เริ่มต้นวัตถุ RecognitionSettings ด้วยค่าเริ่มต้น
RecognitionSettings settings;

// จำได้
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

รักษาการจัดรูปแบบ

ไลบรารี OCR อ่านแบบอักษรยอดนิยมทั้งหมด เช่น Arial, Times New Roman, Courier New, Tahoma, Calibri และอื่นๆ ในรูปแบบปกติ ตัวหนาและตัวเอียง และคงการจัดรูปแบบไว้ในผลลัพธ์ OCR อย่างระมัดระวัง คุณยังสามารถแบ่งผลการจดจำออกเป็นบรรทัดและตรวจหาพื้นที่ข้อความในหน้าได้

จดจำภาพถ่าย

การใช้งาน OCR อย่างแพร่หลายมักจะหยุดลงเนื่องจากเครื่องสแกนไม่ธรรมดาสำหรับผู้ใช้ส่วนใหญ่ ไลบรารี OCR ของเรามีฟิลเตอร์ประมวลผลภาพล่วงหน้าที่มีประสิทธิภาพซึ่งสามารถรองรับภาพที่มืด หมุน ภาพบิดเบี้ยว และมีสัญญาณรบกวน ร่วมกับการรองรับรูปแบบภาพทั้งหมด ทำให้สามารถจดจำภาพถ่ายในสมาร์ทโฟนได้อย่างน่าเชื่อถือ การประมวลผลล่วงหน้าและการแก้ไขภาพส่วนใหญ่จะดำเนินการโดยอัตโนมัติ ดังนั้นคุณจะต้องเข้าไปแทรกแซงเฉพาะกรณีที่ยากลำบากเท่านั้น

ตั้งค่ามุมแบบกำหนดเองสำหรับการแก้ไขการเอียง - C++

// ภาพต้นฉบับ
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// เตรียมบัฟเฟอร์สำหรับผลลัพธ์
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// ปรับมุมเอียง
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// รับรู้ภาพ
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

ตรวจสอบการสะกด

แม้ว่า OCR จะให้ผลลัพธ์ที่เชื่อถือได้ แต่ข้อบกพร่องด้านฝุ่นและการพิมพ์อาจทำให้ระบบจดจำสัญลักษณ์บางอย่างไม่ถูกต้อง OCR API มีตัวตรวจการสะกดในตัวที่จะแทนที่คำที่สะกดผิดโดยอัตโนมัติและช่วยให้คุณไม่ต้องแก้ไขผลการจดจำด้วยตนเอง

  
  

Aspose ยังมี OCR API ดั้งเดิมสำหรับภาษาโปรแกรมยอดนิยมอื่นๆ: