แปลงรูปภาพและ PDF เป็นข้อความใน C++
เพิ่มการรู้จำอักขระด้วยแสง (OCR) ให้กับแอปพลิเคชัน C++ ของคุณด้วยโค้ดสองสามบรรทัด
Download Free TrialAspose.OCR สำหรับ C++ ขยายแอปพลิเคชันของคุณด้วยความสามารถในการจดจำอักขระด้วยแสงในโค้ด 5 บรรทัด ประสบการณ์ของเราในโครงข่ายประสาทเทียมและแมชชีนเลิร์นนิงได้รับการแปลเป็นไลบรารี OCR ด้วยประสิทธิภาพและความแม่นยำที่เหนือกว่า ซึ่งรองรับ 26 ภาษาตามสคริปต์ ภาษาละติน และ ซิริลลิก ตลอดจน ภาษาจีน OCR API สามารถจดจำภาพที่สแกน ภาพถ่ายจากสมาร์ทโฟน ภาพหน้าจอ พื้นที่ของรูปภาพ และ PDF ที่สแกน และส่งคืนผลลัพธ์ในรูปแบบเอกสารและการแลกเปลี่ยนข้อมูลยอดนิยม เป็นแบบออฟไลน์โดยสมบูรณ์และไม่จำเป็นต้องเชื่อมต่ออินเทอร์เน็ตเพื่อทำงาน API ต้องการความพยายามเพียงเล็กน้อยในการเริ่มต้นและช่วงการเรียนรู้ที่ตื้นจนถึงระดับผู้เชี่ยวชาญ การประมวลผลล่วงหน้า การแก้ไขความเบ้ การลบเสียงรบกวน การตรวจจับภาษา มัลติเธรด และงานที่ซับซ้อนอื่นๆ ทั้งหมดจะดำเนินการโดยอัตโนมัติ แต่สามารถปรับให้เข้ากับเคสที่มีปัญหาได้
คุณสมบัติ C++ OCR API ขั้นสูง
แยกข้อความจากรูปภาพและสร้าง PDF ที่ค้นหาได้
รองรับรูปภาพใด ๆ ที่คุณจะได้รับจากเครื่องสแกนหรือกล้อง
อ่านสคริปต์ละตินและซิริลลิกแบบขยาย
รู้จักตัวอักษรจีนมากกว่า 6,000 ตัว
ตรวจจับและจดจำแบบอักษรและการจัดรูปแบบยอดนิยมทั้งหมด
ประมวลผลภาพล่วงหน้าก่อนการจดจำ
ประมวลผลทั้งภาพหรือพื้นที่ที่เลือกเท่านั้น
รองรับการหมุนภาพเบ้และมีสัญญาณรบกวน
การจดจำชุดของภาพทั้งหมดในโฟลเดอร์หรือไฟล์เก็บถาวร
รับรู้รูปภาพที่ให้ไว้เป็นลิงก์ของเว็บ
ค้นหาและแก้ไขคำที่สะกดผิดโดยอัตโนมัติ
รับผลการรับรู้เป็น JSON
ง่ายต่อการใช้
คุณยังคิดว่า C ++ OCR นั้นยากไหม ด้วยไลบรารีของเรา คุณต้องการโค้ดเพียง 5 บรรทัดในการจดจำรูปภาพและแสดงผล ลองใช้รหัสนี้และดูด้วยตัวคุณเอง:
รูปภาพเป็นข้อความใน 5 บรรทัด - C++
// ระบุเส้นทางภาพ
std::string image_path = "../Data/Source/sample.png";
// เตรียมบัฟเฟอร์สำหรับผลลัพธ์
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// ทำมายากล
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);
// แสดงผลการรับรู้
std::wcout << buffer << L"\n";
26 ภาษาที่ได้รับการยอมรับ
OCR API สามารถจดจำภาษาจำนวนมากและสคริปต์การเขียนยอดนิยมทั้งหมด รวมถึงข้อความที่มีภาษาผสม
- ตัวอักษรละตินแบบขยาย : โครเอเชีย เช็ก เดนมาร์ก ดัตช์ อังกฤษ เอสโตเนีย ฟินแลนด์ ฝรั่งเศส เยอรมัน อิตาลี ลัตเวีย ลิทัวเนีย นอร์เวย์ โปแลนด์ โปรตุเกส โรมาเนีย สโลวัก สโลวีเนีย สเปน สวีเดน
- อักษรซีริลลิก : เบลารุส บัลแกเรีย คาซัค รัสเซีย เซอร์เบีย ยูเครน
- ภาษาจีน : มากกว่า 6,000 ตัวอักษร
คุณสามารถปล่อยให้การตรวจหาภาษาไปที่ห้องสมุดหรือกำหนดภาษาด้วยตนเองเพื่อเพิ่มประสิทธิภาพการรู้จำและความน่าเชื่อถือ
การประมวลผลแบทช์
OCR API ช่วยให้คุณไม่ต้องจำทุกภาพทีละภาพโดยเสนอวิธีการประมวลผลแบบกลุ่มต่างๆ ที่ช่วยให้คุณจดจำภาพหลายภาพในการเรียกครั้งเดียว:
- การรับรู้ไฟล์ PDF และ TIFF แบบหลายหน้า
- การรับรู้ของไฟล์ทั้งหมดในโฟลเดอร์
- การรับรู้ของไฟล์ทั้งหมดในไฟล์เก็บถาวร
รู้จักไฟล์ ZIP - C++
// ระบุเส้นทางการเก็บถาวร
std::string archive_path = "book.zip";
// เตรียมบัฟเฟอร์สำหรับผลลัพธ์
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// เริ่มต้นวัตถุ RecognitionSettings ด้วยค่าเริ่มต้น
RecognitionSettings settings;
// จำได้
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);
รักษาการจัดรูปแบบ
ไลบรารี OCR อ่านแบบอักษรยอดนิยมทั้งหมด เช่น Arial, Times New Roman, Courier New, Tahoma, Calibri และอื่นๆ ในรูปแบบปกติ ตัวหนาและตัวเอียง และคงการจัดรูปแบบไว้ในผลลัพธ์ OCR อย่างระมัดระวัง คุณยังสามารถแบ่งผลการจดจำออกเป็นบรรทัดและตรวจหาพื้นที่ข้อความในหน้าได้
จดจำภาพถ่าย
การใช้งาน OCR อย่างแพร่หลายมักจะหยุดลงเนื่องจากเครื่องสแกนไม่ธรรมดาสำหรับผู้ใช้ส่วนใหญ่ ไลบรารี OCR ของเรามีฟิลเตอร์ประมวลผลภาพล่วงหน้าที่มีประสิทธิภาพซึ่งสามารถรองรับภาพที่มืด หมุน ภาพบิดเบี้ยว และมีสัญญาณรบกวน ร่วมกับการรองรับรูปแบบภาพทั้งหมด ทำให้สามารถจดจำภาพถ่ายในสมาร์ทโฟนได้อย่างน่าเชื่อถือ การประมวลผลล่วงหน้าและการแก้ไขภาพส่วนใหญ่จะดำเนินการโดยอัตโนมัติ ดังนั้นคุณจะต้องเข้าไปแทรกแซงเฉพาะกรณีที่ยากลำบากเท่านั้น
ตั้งค่ามุมแบบกำหนดเองสำหรับการแก้ไขการเอียง - C++
// ภาพต้นฉบับ
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };
// เตรียมบัฟเฟอร์สำหรับผลลัพธ์
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// ปรับมุมเอียง
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;
// รับรู้ภาพ
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
ตรวจสอบการสะกด
แม้ว่า OCR จะให้ผลลัพธ์ที่เชื่อถือได้ แต่ข้อบกพร่องด้านฝุ่นและการพิมพ์อาจทำให้ระบบจดจำสัญลักษณ์บางอย่างไม่ถูกต้อง OCR API มีตัวตรวจการสะกดในตัวที่จะแทนที่คำที่สะกดผิดโดยอัตโนมัติและช่วยให้คุณไม่ต้องแก้ไขผลการจดจำด้วยตนเอง
Support and Learning Resources
- แหล่งเรียนรู้
- เอกสาร
- รหัสแหล่งที่มา
- การอ้างอิง API
- วิดีโอสอน
- การสนับสนุนผลิตภัณฑ์
- การสนับสนุนฟรี
- การสนับสนุนแบบชำระเงิน
- บล็อก
- บันทึกประจำรุ่น
- ทำไมต้อง Aspose.OCR สำหรับ C ++
- รายชื่อลูกค้า
- เรื่องราวความสำเร็จ