ทำไมต้อง Aspose.OCR สำหรับ .NET

Aspose.OCR สำหรับ .NET เป็น API ที่แข็งแกร่ง เป็นมิตรต่อนักพัฒนา และคุ้มต้นทุนสำหรับการรู้จำอักขระแบบออปติก ด้วยโค้ด C# แบบเนทีฟที่น้อยกว่า 10 บรรทัด คุณสามารถสร้างความสามารถ OCR ลงในโซลูชันเดสก์ท็อป .NET, เว็บแอปพลิเคชันที่ใช้ MVC, บริการคลาวด์ และฟังก์ชัน Azure แบบไร้เซิร์ฟเวอร์ แยกข้อความที่เครื่องอ่านได้จากการสแกน รูปภาพ และภาพหน้าจอ แปลงหน้าที่สแกนเป็น PDF ที่สามารถค้นหาและจัดทำดัชนีได้ ค้นหาและเปรียบเทียบข้อความบนรูปภาพที่มุ่งเน้นที่งานทางธุรกิจ แทนที่จะเป็นคณิตศาสตร์ที่ซับซ้อน โครงข่ายประสาทเทียม และความซับซ้อนทางเทคนิคอื่นๆ คลิกรายการด้านล่างเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับคุณสมบัติและคุณประโยชน์ของเรา

Illustration ocr

แอปพลิเคชันระดับโลก

จดจำข้อความในภาษาละติน ซีริลลิก และเอเชีย รวมถึงตัวอักษรจีนและฮินดีมากกว่า 6,000 ตัว

อ่านทุกอย่าง

ดึงข้อความจากไฟล์ใดๆ ที่ได้รับผ่านเครื่องสแกนหรือกล้อง และประมวลผลภาพได้โดยตรงจากเว็บลิงก์

ผลลัพธ์ที่เชื่อถือได้

บรรลุความแม่นยำในการจดจำสูงสำหรับภาพทั้งหมด รวมถึงภาพที่อยู่นอกโฟกัส หมุน บิดเบี้ยว และมีสัญญาณรบกวน

การรับรู้แบทช์

จดจำรูปภาพทั้งหมดจากโฟลเดอร์และไฟล์เก็บถาวรจำนวนมาก อ่านเอกสาร PDF หลายหน้าและรูปภาพ TIFF

การตรวจจับเค้าโครง

ระบุและจัดหมวดหมู่บล็อกเนื้อหาในรูปภาพเพื่อให้แน่ใจว่าลำดับข้อความที่แยกออกมาถูกต้อง โดยไม่คำนึงถึงเค้าโครง

ตัวอย่างโค้ดสด

การรู้จำอักขระด้วยแสงกลายเป็นเรื่องง่ายและตรงไปตรงมาด้วย Aspose.OCR แม้แต่สำหรับนักพัฒนาที่เพิ่งเริ่มใช้เทคโนโลยีนี้ก็ตาม โค้ดเพียงไม่กี่บรรทัดก็เพียงพอที่จะแยกข้อความจากรูปภาพและแสดงบนหน้าจอ มันง่ายมากจริงๆ - ลองดูสิ

พร้อมรับรู้ พร้อมรับรู้ วางไฟล์ที่นี่หรือคลิกเพื่อเรียกดู *

* โดยการอัพโหลดไฟล์ของคุณหรือใช้บริการแสดงว่าคุณเห็นด้วยกับเรา ข้อกำหนดการใช้งาน และ นโยบายความเป็นส่วนตัว.

ผลการรับรู้
 

แปลงรูปภาพเป็นข้อความ

ตัวอย่างเพิ่มเติม >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

ความเป็นอิสระของแพลตฟอร์ม

Aspose.OCR สำหรับ .NET สามารถทำงานได้บน แพลตฟอร์มใดๆ ที่รองรับ .NET, .NET Core หรือ .NET Framework - ไม่ว่าจะอยู่ในเครื่อง เครื่อง บนเว็บเซิร์ฟเวอร์ หรือในระบบคลาวด์

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

รูปแบบไฟล์ที่รองรับ

Aspose.OCR for .NET สามารถทำงานกับ [ไฟล์]แทบทุกชนิด( https://docs.aspose.com/ocr/net/supported-file-formats/ ) คุณสามารถรับได้จากเครื่องสแกนหรือกล้อง ผลลัพธ์การจดจำจะถูกส่งกลับในรูปแบบไฟล์และการแลกเปลี่ยนข้อมูลที่ได้รับความนิยมสูงสุด ซึ่งสามารถบันทึก นำเข้าไปยังฐานข้อมูล หรือวิเคราะห์แบบเรียลไทม์

รูปภาพ

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR เป็นกลุ่ม

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

ผลการรับรู้

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

เหมาะสำหรับเนื้อหาใด ๆ

ความแม่นยำและความน่าเชื่อถือของการรู้จำข้อความขึ้นอยู่กับคุณภาพของภาพต้นฉบับเป็นอย่างมาก Aspose.OCR สำหรับ .NET นำเสนอตัวกรองการประมวลผลรูปภาพทั้งแบบอัตโนมัติและแบบแมนนวลที่หลากหลาย ซึ่งปรับปรุงรูปภาพก่อนที่จะถูกส่งไปยังกลไก OCR

การประมวลผลภาพอันทรงพลังและอัลกอริธึมการตรวจจับโครงสร้างเนื้อหาที่ปรับแต่งได้ ช่วยให้สามารถดึงข้อความจากรูปภาพแทบทุกชนิด ตั้งแต่การสแกนคุณภาพสูงไปจนถึงภาพถ่ายสตรีท สามารถใช้ตัวกรองการประมวลผลหลายตัวกับภาพเดียวกันเพื่อให้ได้คุณภาพการจดจำที่ดีที่สุด

การเพิ่มประสิทธิภาพทรัพยากร

Aspose.OCR สำหรับ .NET ช่วยให้สามารถปรับสมดุลความเร็ว คุณภาพ และการใช้ทรัพยากรในการจดจำได้อย่างยืดหยุ่นสูง สำหรับแต่ละกรณีการใช้งานเฉพาะ:

  • เลือกระหว่างการจดจำอย่างละเอียดและการจดจำอย่างรวดเร็ว
  • ระบุจำนวนเธรดที่จัดสรรเพื่อการจดจำ หรืออนุญาตให้ไลบรารีปรับขนาดตามจำนวนแกนประมวลผลโดยอัตโนมัติ
  • เพิ่มพื้นที่ว่างให้กับ CPU โดยการลดภาระการคำนวณไปยัง GPU

28 ภาษาการจดจำ

Aspose.OCR สำหรับ .NET เป็นโซลูชันสากลสำหรับการประมวลผลเอกสาร การดึงข้อมูล และการแปลงเนื้อหาเป็นดิจิทัลในระดับโลก ด้วยการรองรับสคริปต์การเขียนของยุโรปและเอเชียที่หลากหลาย จึงได้รับการดัดแปลงอย่างดีสำหรับทุกขนาด รองรับทั้งธุรกิจขนาดเล็กและขนาดกลางตลอดจนบริษัทข้ามชาติ

คุณสามารถมอบหมายการตรวจจับภาษาให้กับไลบรารีหรือระบุภาษาด้วยตนเอง เพื่อเพิ่มประสิทธิภาพในการจดจำและความน่าเชื่อถือ รองรับภาษาต่อไปนี้:

  • อักษรละตินแบบขยาย: โครเอเชีย, เช็ก, เดนมาร์ก, ดัตช์, อังกฤษ, เอสโตเนีย, ฟินแลนด์, ฝรั่งเศส, เยอรมัน, อิตาลี, ลัตเวีย, ลิทัวเนีย, นอร์เวย์, โปแลนด์, โปรตุเกส, โรมาเนีย, สโลวาเกีย, สโลวีเนีย, สเปน, สวีเดน;
  • อักษรซีริลลิก: เบโลรุสเซีย บัลแกเรีย คาซัค รัสเซีย เซอร์เบีย ยูเครน;
  • ตัวอักษร จีน มากกว่า 6,000 ตัว
  • ภาษาฮินดี.

คุณสมบัติและความสามารถ

Aspose.OCR สำหรับ .NET จะแยกข้อความจากภาพถ่ายหรือรูปภาพที่สแกนโดยอัตโนมัติ ทำให้ไม่จำเป็นต้องพิมพ์เอกสารซ้ำด้วยตนเอง

Feature icon

OCR ภาพถ่าย

แยกข้อความจากภาพถ่ายสมาร์ทโฟนด้วยความแม่นยำระดับการสแกน

Feature icon

PDF ที่ค้นหาได้

แปลงการสแกนใดๆ ให้เป็นเอกสารที่สามารถค้นหาและจัดทำดัชนีได้อย่างสมบูรณ์

Feature icon

การรับรู้ URL

จดจำรูปภาพจาก URL โดยไม่ต้องดาวน์โหลดในเครื่อง

Feature icon

การรับรู้จำนวนมาก

อ่านรูปภาพทั้งหมดจากเอกสาร โฟลเดอร์ และเอกสารสำคัญหลายหน้า

Feature icon

แบบอักษรและสไตล์ใดก็ได้

ระบุและจดจำข้อความในแบบอักษรและสไตล์ยอดนิยมทั้งหมด

Feature icon

การรับรู้แบบละเอียด

ปรับทุกพารามิเตอร์ OCR เพื่อผลลัพธ์การจดจำที่ดีที่สุด

Feature icon

เครื่องตรวจตัวสะกด

ปรับปรุงผลลัพธ์โดยการแก้ไขคำที่สะกดผิดโดยอัตโนมัติ

Feature icon

ค้นหาข้อความในรูปภาพ

ค้นหาข้อความหรือนิพจน์ทั่วไปภายในชุดรูปภาพ

Feature icon

เปรียบเทียบข้อความรูปภาพ

เปรียบเทียบข้อความบนรูปภาพสองภาพ โดยไม่คำนึงถึงตัวพิมพ์และเค้าโครง

ง่ายต่อการใช้

คุณจำเป็นต้องมีโค้ดเพียงไม่กี่บรรทัดในการแปลงรูปภาพเป็นข้อความ สร้าง PDF ที่ค้นหาได้ บันทึกผลการจดจำลงในเอกสาร และอื่นๆ อีกมากมาย สำรวจตัวอย่างโค้ดเพื่อทำความเข้าใจวิธีผสานรวม Aspose.OCR สำหรับ .NET เข้ากับโซลูชันของคุณ

การติดตั้ง

Aspose.OCR สำหรับ .NET ได้รับการเผยแพร่เป็น แพ็คเกจ NuGet หรือเป็น [ไฟล์ที่ดาวน์โหลดได้]( https://releases.aspose.com/ ocr/net/) โดยมีการพึ่งพาน้อยที่สุด คุณสามารถเพิ่มแพ็คเกจในโครงการของคุณได้โดยตรงจาก Microsoft Visual Studio เพียงติดตั้งลงในโปรเจ็กต์ของคุณ จากนั้นคุณก็พร้อมที่จะแยกข้อความจากรูปภาพและบันทึกผลการจดจำในรูปแบบที่รองรับ หากระบบของคุณมี GPU ที่รองรับ CUDA คุณสามารถใช้ กลไก OCR ที่เร่งด้วย GPU เพื่อเพิ่มประสิทธิภาพการจดจำได้อย่างมาก

คุณสามารถเริ่มใช้ Aspose.OCR สำหรับ .NET ได้ทันทีหลังการติดตั้ง โดยมี ข้อจำกัด บางประการ ใบอนุญาตชั่วคราวจะลบข้อจำกัดทั้งหมดของเวอร์ชันทดลองใช้เป็นเวลา 30 วัน ใช้เพื่อเริ่มสร้างแอปพลิเคชัน OCR ที่ทำงานได้อย่างสมบูรณ์ และตัดสินใจขั้นสุดท้ายในการซื้อ Aspose.OCR สำหรับ .NET ในภายหลัง

แยกข้อความออกจากภาพถ่าย

เมื่อผู้คนมักนึกถึง OCR (Optical Character Recognition) การเชื่อมโยงแรกมักจะโดยที่สแกนเนอร์เป็นอุปกรณ์จับภาพหลัก การเชื่อมโยงนี้มีเหตุผลทางประวัติศาสตร์และยังคงแพร่หลายในหลายบริบท โดยให้สภาพแวดล้อมที่สอดคล้องและมีการควบคุมสำหรับการจับข้อความที่พิมพ์จากเอกสารทางกายภาพด้วยคุณภาพที่ไม่มีใครเทียบได้ อย่างไรก็ตาม สแกนเนอร์เป็นอุปกรณ์พิเศษที่ไม่ได้มีอยู่ในมือเสมอไป และต้องใช้เวิร์กสเตชันแบบอยู่กับที่จึงจะทำงานได้ โชคดีที่โลกสมัยใหม่เป็นทางเลือกที่สะดวกสบายสำหรับสแกนเนอร์แบบเดิม นั่นก็คือกล้องสมาร์ทโฟน ความก้าวหน้าของเทคโนโลยีกล้องสมาร์ทโฟนช่วยให้มั่นใจได้ว่าแม้แต่สมาร์ทโฟนระดับเริ่มต้นก็มีคุณภาพเพียงพอที่จะบันทึกเอกสารที่พร้อมใช้ OCR และหน่วยความจำภายในทำให้เอกสาร หนังสือพิมพ์ หนังสือ ป้ายถนน และข้อความอื่นๆ จำนวนมากเป็นดิจิทัลได้ง่ายกว่าที่เคย สิ่งที่คุณต้องมีคือเทคโนโลยีที่เหมาะสมในการแปลงภาพถ่ายเหล่านั้นให้เป็นข้อความที่เครื่องอ่านได้

Aspose.OCR สำหรับ .NET ได้รับการออกแบบมาเป็นพิเศษเพื่อให้จดจำภาพทุกประเภทได้ทันทีที่แกะกล่อง และสามารถปรับแต่งเพิ่มเติมเพื่อจัดการแม้แต่ภาพถ่ายคุณภาพต่ำได้ เมื่อใช้ร่วมกับสมาร์ทโฟนสมัยใหม่ คุณสามารถสร้างแอปพลิเคชัน OCR อันทรงพลังสำหรับงานสแกนและจดจำข้อความเกือบทุกวัน การประมวลผลภาพและการวิเคราะห์โครงสร้างเอกสารที่ทันสมัยที่สุดดำเนินการโดยใช้โค้ดเพียงไม่กี่บรรทัด ช่วยให้คุณสามารถมุ่งเน้นไปที่ธุรกิจมากกว่าอัลกอริทึมทางคณิตศาสตร์ที่ซับซ้อน โครงข่ายประสาทเทียม และความซับซ้อนทางเทคนิคอื่นๆ

OCR ภาพถ่าย - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

สร้าง PDF ที่สามารถค้นหาได้จากการสแกน

PDF เป็นหนึ่งในรูปแบบที่ได้รับความนิยมมากที่สุดสำหรับการสแกนเอกสารกระดาษ โดยเฉพาะอย่างยิ่งเนื่องจากความสามารถในการรวมหลายหน้าเป็นไฟล์เดียว รูปแบบนี้ใช้กันอย่างแพร่หลายในการแลกเปลี่ยนสัญญา ใบแจ้งหนี้ เอกสารทางกฎหมาย หนังสือเดินทางและบัตรประจำตัวประชาชน และเอกสารอื่นๆ อีกมากมายระหว่างบุคคล ธุรกิจ ธนาคาร และหน่วยงานของรัฐ อย่างไรก็ตาม PDF ที่สแกนจะเป็นชุดของรูปภาพเป็นหลัก ไม่มีข้อความที่เครื่องอ่านได้ ดังนั้นผู้ใช้จึงไม่สามารถค้นหา คัดลอก หรือจัดการเนื้อหาของเอกสารได้

Aspose.OCR สำหรับ .NET นำเสนอวิธีการที่รวดเร็ว ง่ายดาย และเชื่อถือได้สูงในการแปลง PDF ที่สแกนให้เป็นเอกสารที่สามารถค้นหาและจัดทำดัชนีได้อย่างสมบูรณ์ โดยจะจดจำเนื้อหาของหน้าได้อย่างแม่นยำ โดยแปลงเป็นเลเยอร์ข้อความที่เครื่องอ่านได้เหนือรูปภาพต้นฉบับที่สามารถเลือก คัดลอก อ่านด้วยซอฟต์แวร์แปลงข้อความเป็นคำพูด และแม้แต่ประมวลผลโดยอัตโนมัติโดยนักแปล ผู้สรุป และการวิเคราะห์ที่ขับเคลื่อนด้วย AI อื่นๆ เครื่องมือ

เพิ่มการซ้อนทับข้อความลงใน PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

ค้นหาข้อความในภาพ

คลังข้อมูลดิจิทัล โดยเฉพาะในองค์กรขนาดใหญ่ มักประกอบด้วยคอลเลกชันสแกนและภาพถ่ายจำนวนมาก ซึ่งส่วนใหญ่อาจมีเอกสารหลายหน้า การจัดการที่มีประสิทธิภาพและการจัดระเบียบของเอกสารสำคัญดังกล่าวอย่างมีประสิทธิผลเป็นสิ่งจำเป็นสำหรับการดึงข้อมูลและการนำทางที่ง่ายดาย อย่างไรก็ตาม รูปภาพไม่มีข้อความที่เครื่องอ่านได้ ทำให้ไม่สามารถค้นหาและวิเคราะห์เนื้อหาเอกสารได้

Aspose.OCR สำหรับ .NET ช่วยให้คุณสามารถค้นหาข้อความในรูปภาพได้อย่างง่ายดาย โดยไม่คำนึงถึงแบบอักษร ขนาดข้อความ สไตล์ และพารามิเตอร์อื่นๆ ไลบรารียังสนับสนุนการค้นหาที่ไม่คำนึงถึงขนาดตัวพิมพ์และนิพจน์ทั่วไป ซึ่งมีประโยชน์อย่างยิ่งในแอปพลิเคชันและอุตสาหกรรมต่างๆ ฟังก์ชันนี้สามารถใช้สำหรับการจัดหมวดหมู่เอกสารตามเนื้อหา คำสำคัญ หรือรูปแบบที่พบในข้อความ การค้นหาข้อกำหนดหรือเงื่อนไขเฉพาะภายในข้อตกลงและสัญญา การจัดระเบียบไฟล์ใหม่ตามคำสำคัญหรือเนื้อหาที่พบในไฟล์เหล่านั้น ค้นหาและระบุข้อมูลส่วนบุคคลภายในเอกสาร ทำให้ง่ายต่อการรับรองการปฏิบัติตาม GDPR และจัดการข้อมูลที่ละเอียดอ่อนได้อย่างมีประสิทธิภาพมากขึ้น การค้นหาด้วยรูปภาพยังช่วยให้สามารถสร้างขั้นตอนการทำงานอัตโนมัติและปรับปรุงกระบวนการทางธุรกิจต่างๆ เมื่อได้รับสัญญาและใบแจ้งหนี้ที่ลงนามแล้ว

ค้นหาข้อความในภาพ - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}