Tại sao chọn Aspose.OCR cho JavaScript qua C++?

Aspose.OCR dành cho JavaScript qua C++ cho phép bạn trích xuất văn bản từ các trang được quét, ảnh, ảnh chụp màn hình và các hình ảnh khác trực tiếp trên trang web hoặc từ các ứng dụng Electron đa nền tảng. Nó dựa trên công nghệ WebAssugging (Wasm), cho phép mã chạy trên thiết bị của người dùng cuối mà không cần máy chủ web. Nó có thể được tích hợp nguyên bản vào ngữ cảnh JavaScript của bạn, bao gồm quyền truy cập vào tất cả các chức năng của trình duyệt web. Aspose.OCR cho JavaScript thông qua C++ cung cấp mức độ bảo mật cao nhất khi được nhúng trên web và sẽ thực thi các chính sách bảo mật về quyền và nguồn gốc giống nhau của trình duyệt.

API nhận dạng ký tự quang học (OCR) mạnh mẽ và giàu tính năng của chúng tôi hỗ trợ 28 ngôn ngữ dựa trên chữ viết Latinh, Cyrillic và châu Á, bao gồm cả tiếng Trung và tiếng Hindi, đồng thời có thể nhận dạng tệp ở các định dạng phổ biến nhất. Các bộ lọc xử lý khác nhau cho phép bạn nhận dạng hình ảnh bị lệch, méo và nhiễu. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu phổ biến nhất.

Illustration ocr

OCR nhanh và chính xác

Đạt được kết quả OCR tốc độ cao và chính xác với JavaScript nâng cao thông qua công nghệ C++.

Hỗ trợ đa ngôn ngữ

Nhận dạng văn bản bằng 28 ngôn ngữ, bao gồm chữ viết Latinh, Cyrillic và tiếng Trung, đảm bảo tính linh hoạt cho các ứng dụng JavaScript của bạn thông qua tích hợp C++.

Hỗ trợ hình ảnh đa năng

Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách dễ dàng bằng JavaScript thông qua C++.

Độ chính xác trong nhận dạng ký tự tiếng Trung

Nhận dạng hơn 6.000 ký tự tiếng Trung một cách chính xác trong các dự án JavaScript của bạn thông qua C++.

Phát hiện bố cục

Xác định và phân loại các khối nội dung trong hình ảnh để đảm bảo văn bản được trích xuất theo đúng thứ tự, bất kể bố cục.

Mẫu mã trực tiếp

Bắt đầu nhận dạng văn bản từ hình ảnh chỉ bằng ba dòng mã. Trải nghiệm sự đơn giản!

Sẵn sàng công nhận Sẵn sàng công nhận Thả một tập tin ở đây hoặc bấm vào để duyệt *

* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụngChính sách bảo mật.

Kết quả công nhận
 

Chuyển đổi hình ảnh thành văn bản

Thêm ví dụ >
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = filename;
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Get recognition results as text
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);

Tích hợp OCR trong ứng dụng WEB của bạn

Aspose.OCR dành cho JavaScript cho phép mã chạy trực tiếp trong trình duyệt web của người dùng cuối (phía máy khách) hoặc trong môi trường dựa trên trình duyệt, chẳng hạn như Electon.

Microsoft Windows
Linux
MacOS

Các định dạng tập tin được hỗ trợ

Aspose.OCR for Javascript via C++ có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.

Hình ảnh

  • JPEG
  • PNG
  • TIFF
  • BMP

OCR hàng loạt

  • ZIP

Kết quả công nhận

  • Text
  • JSON
  • XML

Cài đặt dễ dàng

Aspose.OCR cho JavaScript qua C++ được phân phối dưới dạng gói có thể tải xuống độc lập và không yêu cầu cài đặt bất kỳ phụ thuộc bên ngoài nào. Chỉ cần giải nén nó bên cạnh trang HTML của bạn và bạn đã sẵn sàng chuyển đổi bất kỳ hình ảnh nào thành văn bản ngay trong trình duyệt.

Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.

28 ngôn ngữ nhận dạng

API JavaScript OCR nhận dạng 28 ngôn ngữ và tập lệnh viết phổ biến, bao gồm các ngôn ngữ hỗn hợp:

Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.

  • Bảng chữ cái Latin mở rộng: tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Anh, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Latvia, tiếng Litva, tiếng Na Uy, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Rumani, tiếng Slovak, tiếng Slovenia, tiếng Tây Ban Nha, tiếng Thụy Điển;
  • Bảng chữ cái Cyrillic: tiếng Belorussian, tiếng Bulgaria, tiếng Kazakhstan, tiếng Nga, tiếng Serbia, tiếng Ukraina;
  • Tiếng Trung: Hơn 6.000 ký tự;
  • Tiếng Hindi.

Phù hợp với mọi nội dung

API JavaScript OCR nhận dạng 28 ngôn ngữ và tập lệnh viết phổ biến, bao gồm các ngôn ngữ hỗn hợp:

Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.

Các tính năng chính

Aspose.OCR for Javascript via C++ Khám phá các tính năng nâng cao của Aspose.OCR cho JavaScript.

Feature icon

Ảnh OCR

Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức quét.

Feature icon

PDF có thể tìm kiếm

Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.

Feature icon

Nhận dạng URL

Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.

Feature icon

Nhận dạng hàng loạt

Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.

Feature icon

Bất kỳ phông chữ và phong cách

Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.

Feature icon

Tinh chỉnh nhận dạng

Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.

Mẫu mã JavaScript

Khám phá các mẫu mã để tích hợp liền mạch Aspose.OCR cho JavaScript qua C++ vào các trang HTML và ứng dụng Electron của bạn.

Cài đặt đơn giản cho JavaScript

Là một gói JavaScript hoặc một tệp có thể tải xuống với mức độ phụ thuộc tối thiểu, Aspose.OCR dành cho JavaScript đảm bảo việc phân phối dễ dàng. Tích hợp nó vào dự án của bạn trực tiếp từ JavaScript và bạn đã sẵn sàng tận dụng các khả năng OCR hoàn chỉnh, lưu kết quả nhận dạng ở nhiều định dạng khác nhau.

Nhận dạng hình ảnh bằng JavaScript

Việc áp dụng rộng rãi các ứng dụng OCR thường bị dừng lại do máy quét không phổ biến đối với hầu hết người dùng. Thư viện OCR của chúng tôi có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ có thể xử lý các hình ảnh tối, xoay, lệch và nhiễu. Kết hợp với sự hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy ngay cả ảnh trên điện thoại thông minh. Hầu hết quá trình tiền xử lý và chỉnh sửa ảnh đều được thực hiện tự động nên bạn sẽ chỉ phải can thiệp vào những trường hợp khó.

Áp dụng chỉnh sửa hình ảnh tự động - JavaScript

// Load photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;

// Automatically adjust contrast and remove noise
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.PHOTO;
settings.auto_contrast = true;
settings.auto_denoising = true;

// Extract text from photo:
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);

// Output recognition results
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);

Trình chuyển đổi hình ảnh thành văn bản phổ biến cho JavaScript

Trong khi nhiều doanh nghiệp, tổ chức, cá nhân đang tích cực nỗ lực giảm sự phụ thuộc vào tài liệu giấy thì đây vẫn là định dạng phổ biến nhất để lưu trữ và chia sẻ. Các tài liệu được quét được hỗ trợ bởi kho lưu trữ vật lý là đủ để tuân thủ quy định, mục đích pháp lý, sao lưu và dự phòng lâu dài. Tuy nhiên, các trường hợp kinh doanh thường phát sinh khi tạo nội dung mới dựa trên nội dung được quét hiện có hoặc các phần của tài liệu hiện có. Aspose.OCR cho JavaScript thông qua С++ giúp dễ dàng chuyển đổi trang được quét thành văn bản có thể tìm kiếm và chỉnh sửa. Nội dung được nhận dạng với độ chính xác và tốc độ cao, giúp bạn tiết kiệm thời gian và công sức gõ thủ công và đảm bảo không có lỗi của con người, đặc biệt khi làm việc với khối lượng thông tin lớn.

Chuyển đổi hình ảnh thành tài liệu - JavaScript

// Load a scanned page from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;

// Analyze content structure
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.DOCUMENT;
settings.upscale_small_font = true;

// Extract text from a page
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);

Trích xuất dữ liệu số từ bảng

Khi quản lý các bảng in lớn chứa dữ liệu số, chẳng hạn như dữ liệu thô của các cuộc khảo sát xã hội học tại hiện trường hoặc danh sách kiểm kê, việc trích xuất thủ công trở thành một quy trình chậm chạp, không thực tế và rất dễ mắc lỗi của con người. OCR giúp tự động hóa và chuẩn hóa việc trích xuất thông tin, đảm bảo kết quả nhất quán và đáng tin cậy. Aspose.OCR cho JavaScript thông qua С++ tự động hóa hoàn toàn việc chuyển đổi dữ liệu dạng bảng được quét hoặc chụp ảnh thành nội dung có thể đọc được bằng máy. Dữ liệu được trích xuất có thể dễ dàng tích hợp vào cơ sở dữ liệu và phân tích, góp phần đưa ra quyết định sáng suốt hơn.

Hình ảnh bảng thành văn bản - JavaScript

// Load a scan or photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;

// Analyze tabular structures
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.TABLE;

// Limit the subset of characters to improve recognition accuracy and increase performance
settings.alphabet = "1234567890.,;";
// Extract text from a table
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);