Thêm OCR vào trang WEB của bạn - JavaScript - Electron
OCR trên trang WEB của bạn
Thêm phòng trưng bày >var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
// Prepare settings
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = "<file name>";
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Serrialize result
var result_str = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(result_str);
Tại sao chọn Aspose.OCR cho JavaScript qua C++?
Aspose.OCR cho JavaScript qua C++ cho phép bạn trích xuất văn bản từ các trang được quét, ảnh, ảnh chụp màn hình và các hình ảnh khác trực tiếp trên trang web hoặc từ các ứng dụng Electron đa nền tảng. Nó dựa trên công nghệ WebAssugging (Wasm), cho phép mã chạy trên thiết bị của người dùng cuối mà không cần máy chủ web. Nó có thể được tích hợp nguyên bản vào ngữ cảnh JavaScript của bạn, bao gồm quyền truy cập vào tất cả các chức năng của trình duyệt web. Aspose.OCR cho JavaScript thông qua C++ cung cấp mức độ bảo mật cao nhất khi được nhúng trên web và sẽ thực thi các chính sách bảo mật về quyền và nguồn gốc giống nhau của trình duyệt.
API Nhận dạng Ký tự Quang học (OCR) mạnh mẽ và giàu tính năng của chúng tôi hỗ trợ hơn 130 ngôn ngữ dựa trên chữ viết Latinh, Cyrillic và Châu Á, bao gồm cả tiếng Trung và tiếng Hindi, đồng thời có thể nhận dạng tệp ở các định dạng phổ biến nhất. Các bộ lọc xử lý khác nhau cho phép bạn nhận dạng hình ảnh bị lệch, méo và nhiễu. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu phổ biến nhất.
OCR nhanh và chính xác
Đạt được kết quả OCR tốc độ cao và chính xác với JavaScript nâng cao thông qua công nghệ C++.
Hỗ trợ đa ngôn ngữ
Nhận dạng văn bản bằng hơn 130 ngôn ngữ, bao gồm chữ viết Latinh, Cyrillic, Ả Rập, Ba Tư, Ấn Độ và Trung Quốc, đảm bảo tính linh hoạt cho các ứng dụng JavaScript của bạn thông qua tích hợp C++.
Hỗ trợ hình ảnh đa năng
Xử lý hình ảnh từ máy quét, máy ảnh và điện thoại thông minh một cách dễ dàng bằng JavaScript thông qua C++.
Độ chính xác trong nhận dạng ký tự tiếng Trung
Nhận dạng hơn 6.000 ký tự tiếng Trung một cách chính xác trong các dự án JavaScript của bạn thông qua C++.
Phát hiện bố cục
Xác định và phân loại các khối nội dung trong hình ảnh để đảm bảo văn bản được trích xuất theo đúng thứ tự, bất kể bố cục.
Mẫu mã trực tiếp
Bắt đầu nhận dạng văn bản từ hình ảnh chỉ bằng ba dòng mã. Trải nghiệm sự đơn giản!
* Bằng cách tải lên các tập tin của bạn hoặc sử dụng dịch vụ, bạn đồng ý với chúng tôi Điều khoản sử dụng Và Chính sách bảo mật.
Chuyển đổi hình ảnh thành văn bản
Thêm ví dụ >const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = filename;
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Get recognition results as text
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);
Tích hợp OCR trong ứng dụng WEB của bạn
Aspose.OCR dành cho JavaScript cho phép mã chạy trực tiếp trong trình duyệt web của người dùng cuối (phía máy khách) hoặc trong môi trường dựa trên trình duyệt, chẳng hạn như Electon.
Các định dạng tập tin được hỗ trợ
Aspose.OCR for Javascript via C++ có thể hoạt động với hầu như mọi tệp bạn có thể lấy từ máy quét hoặc máy ảnh. Kết quả nhận dạng được trả về ở các định dạng trao đổi dữ liệu và tệp phổ biến nhất có thể được lưu, nhập vào cơ sở dữ liệu hoặc phân tích trong thời gian thực.
Hình ảnh
- JPEG
- PNG
- TIFF
- BMP
OCR hàng loạt
- ZIP
Kết quả công nhận
- Text
- JSON
- XML
Cài đặt dễ dàng
Aspose.OCR cho JavaScript qua C++ được phân phối dưới dạng gói có thể tải xuống độc lập và không yêu cầu cài đặt bất kỳ phụ thuộc bên ngoài nào. Chỉ cần giải nén nó bên cạnh trang HTML của bạn và bạn đã sẵn sàng chuyển đổi bất kỳ hình ảnh nào thành văn bản ngay trong trình duyệt.
Yêu cầu giấy phép dùng thử để bắt đầu phát triển ứng dụng OCR đầy đủ chức năng mà không có giới hạn.
Hơn 130 ngôn ngữ nhận dạng
API JavaScript OCR nhận dạng hơn 130 ngôn ngữ và tập lệnh viết phổ biến, bao gồm các ngôn ngữ hỗn hợp:
Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.
- Bảng chữ cái Latinh mở rộng: tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Indonesia, tiếng Bồ Đào Nha, tiếng Đức, tiếng Việt, tiếng Thổ Nhĩ Kỳ, tiếng Ý, tiếng Ba Lan và hơn 80 ngôn ngữ khác;
- Bảng chữ cái Cyrillic: tiếng Nga, tiếng Ukraina, tiếng Kazakhstan, tiếng Serbia, tiếng Belarus, tiếng Bungari;
- Tiếng Ả Rập, tiếng Ba Tư, tiếng Urdu;
- Chữ viết tiếng Trung và chữ Devanagari, bao gồm tiếng Hindi, tiếng Marathi, Bhojpuri và các chữ khác.
Phù hợp với mọi nội dung
API JavaScript OCR nhận dạng hơn 130 ngôn ngữ và tập lệnh viết phổ biến, bao gồm các ngôn ngữ hỗn hợp:
Để thư viện tự phát hiện ngôn ngữ hoặc tự xác định ngôn ngữ để nâng cao hiệu suất nhận dạng và độ tin cậy.
Các tính năng chính
Aspose.OCR for Javascript via C++ Khám phá các tính năng nâng cao của Aspose.OCR cho JavaScript.
Ảnh OCR
Trích xuất văn bản từ ảnh trên điện thoại thông minh với độ chính xác ở mức độ quét.
PDF có thể tìm kiếm
Chuyển đổi bất kỳ bản quét nào thành tài liệu có thể tìm kiếm và lập chỉ mục đầy đủ.
Nhận dạng URL
Nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ.
Nhận dạng hàng loạt
Đọc tất cả hình ảnh từ các tài liệu, thư mục và kho lưu trữ nhiều trang.
Bất kỳ phông chữ và phong cách
Xác định và nhận dạng văn bản ở tất cả các kiểu chữ và kiểu phổ biến.
Tinh chỉnh nhận dạng
Điều chỉnh mọi tham số OCR để có kết quả nhận dạng tốt nhất.
Mẫu mã JavaScript
Khám phá các mẫu mã để tích hợp liền mạch Aspose.OCR cho JavaScript thông qua C++ vào các trang HTML và ứng dụng Electron của bạn.
Cài đặt đơn giản cho JavaScript
Nhận dạng hình ảnh bằng JavaScript
Việc áp dụng rộng rãi các ứng dụng OCR thường bị dừng lại do máy quét không phổ biến đối với hầu hết người dùng. Thư viện OCR của chúng tôi có các bộ lọc xử lý trước hình ảnh tích hợp mạnh mẽ có thể xử lý các hình ảnh tối, xoay, lệch và nhiễu. Kết hợp với sự hỗ trợ cho tất cả các định dạng hình ảnh, nó cho phép nhận dạng đáng tin cậy ngay cả ảnh trên điện thoại thông minh. Hầu hết quá trình tiền xử lý và chỉnh sửa ảnh đều được thực hiện tự động nên bạn sẽ chỉ phải can thiệp vào những trường hợp khó.
Áp dụng chỉnh sửa hình ảnh tự động - JavaScript
// Load photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Automatically adjust contrast and remove noise
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.PHOTO;
settings.auto_contrast = true;
settings.auto_denoising = true;
// Extract text from photo:
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Output recognition results
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);
Trình chuyển đổi hình ảnh thành văn bản phổ biến cho JavaScript
Trong khi nhiều doanh nghiệp, tổ chức, cá nhân đang tích cực nỗ lực giảm sự phụ thuộc vào tài liệu giấy thì đây vẫn là định dạng phổ biến nhất để lưu trữ và chia sẻ. Các tài liệu được quét được hỗ trợ bởi kho lưu trữ vật lý là đủ để tuân thủ quy định, mục đích pháp lý, sao lưu và dự phòng lâu dài. Tuy nhiên, các trường hợp kinh doanh thường phát sinh khi tạo nội dung mới dựa trên nội dung được quét hiện có hoặc các phần của tài liệu hiện có. Aspose.OCR cho JavaScript thông qua С++ giúp dễ dàng chuyển đổi trang được quét thành văn bản có thể tìm kiếm và chỉnh sửa. Nội dung được nhận dạng với độ chính xác và tốc độ cao, giúp bạn tiết kiệm thời gian và công sức gõ thủ công và đảm bảo không có lỗi của con người, đặc biệt khi làm việc với khối lượng thông tin lớn.
Chuyển đổi hình ảnh thành tài liệu - JavaScript
// Load a scanned page from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze content structure
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.DOCUMENT;
settings.upscale_small_font = true;
// Extract text from a page
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
Trích xuất dữ liệu số từ bảng
Khi quản lý các bảng in lớn chứa dữ liệu số, chẳng hạn như dữ liệu thô của các cuộc khảo sát xã hội học tại hiện trường hoặc danh sách kiểm kê, việc trích xuất thủ công trở thành một quy trình chậm chạp, không thực tế và rất dễ mắc lỗi của con người. OCR giúp tự động hóa và chuẩn hóa việc trích xuất thông tin, đảm bảo kết quả nhất quán và đáng tin cậy. Aspose.OCR cho JavaScript thông qua С++ tự động hóa hoàn toàn việc chuyển đổi dữ liệu dạng bảng được quét hoặc chụp ảnh thành nội dung có thể đọc được bằng máy. Dữ liệu được trích xuất có thể dễ dàng tích hợp vào cơ sở dữ liệu và phân tích, góp phần đưa ra quyết định sáng suốt hơn.
Hình ảnh bảng thành văn bản - JavaScript
// Load a scan or photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze tabular structures
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.TABLE;
// Limit the subset of characters to improve recognition accuracy and increase performance
settings.alphabet = "1234567890.,;";
// Extract text from a table
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);