HTML JPG OCR XML BMP
Aspose.OCR  untuk .NET
DOC

Konversi DJVU ke DOC di C#

Lakukan pengenalan karakter optik pada dokumen DJVU dan simpan teks sebagai dokumen DJVU menggunakan Aspose.OCR dari pustaka .NET.

Cara mengonversi DJVU ke DOC menggunakan C#

Aspose.OCR untuk .NET adalah pustaka yang kuat namun mudah digunakan dan hemat biaya untuk mengonversi gambar DJVU ke dokumen DOC. Mendukung 26 bahasa berdasarkan bahasa Latin, Sirilik, dan Cina, mesin pengenalan karakter optik canggihnya memberikan kecepatan dan akurasi pengenalan yang unggul, sekaligus mengisolasi Anda dari rumus, jaringan saraf, dan detail teknis kompleks lainnya. Ini memungkinkan Anda untuk menambahkan fungsionalitas OCR ke aplikasi .NET Anda dalam waktu kurang dari 10 baris kode.

Aspose.OCR untuk .NET

memproses gambar pindaian atau bahkan foto ponsel cerdas dalam format DJVU dan membuat dokumen DJVU yang berisi teks yang dikenali. Untuk menambahkannya ke proyek Anda, Anda hanya perlu menginstal Aspose.OCR

NuGet

paket dalam proyek Anda dengan perintah berikut:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Langkah-langkah untuk Mengonversi DJVU ke DOC

Dengan .NET OCR dan hanya beberapa baris kode, Anda dapat membuat aplikasi berfitur lengkap yang mengubah gambar DJVU menjadi dokumen DOC:

  • Buat turunan dari kelas AsposeOcr
  • Panggil metode AsposeOCR.RecognizeImage
  • Lewati jalur file DJVU sebagai parameter
  • AsposeOCR.RecognizeImage mengembalikan String atau file tipe DOC

Persyaratan sistem

Sebelum menjalankan contoh, pastikan bahwa .NET API kompatibel dengan spesifikasi NET Standard 2.0 diinstal pada sistem Anda dan semua [dependensi eksternal]( https://docs.aspose.com/ocr/net/system-requirements/#external- dependensi) dari paket Aspose.OCR direferensikan dalam proyek Anda.

  • NET Standard 2.0+ solusi yang kompatibel
  • Aspose.OCR untuk .NET yang dirujuk dalam proyek Anda.

Kode contoh ini menunjukkan Konversi DJVU ke DOC .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOC", riText);
  • DJVU Apa DJVU Format Berkas

    DjVu, diucapkan sebagai "déjà vu", adalah format file grafik yang ditujukan untuk dokumen dan buku yang dipindai terutama yang berisi kombinasi teks, gambar, gambar, dan foto. Ini dikembangkan oleh AT&T Labs. Ini menggunakan beberapa teknik seperti pemisahan lapisan gambar teks dan gambar latar belakang, pemuatan progresif, pengkodean aritmatika dan kompresi lossy untuk gambar bitonal. Karena file DJVU dapat berisi gambar, foto, teks, dan gambar berwarna yang terkompresi namun berkualitas tinggi dan dapat disimpan dalam ruang yang lebih sedikit, oleh karena itu, file ini digunakan di web sebagai eBuku, manual, surat kabar, dokumen kuno, dll.

    Baca selengkapnya

    DOC Apa DOC Format Berkas

    File dengan ekstensi .doc mewakili dokumen yang dihasilkan oleh Microsoft Word atau dokumen pengolah kata lainnya dalam format file biner. Ekstensi awalnya digunakan untuk dokumentasi teks biasa pada beberapa sistem operasi yang berbeda. Ini dapat berisi beberapa jenis data yang berbeda seperti gambar, diformat serta teks biasa, grafik, bagan, objek yang disematkan, tautan, halaman, pemformatan halaman, pengaturan cetak, dan banyak lainnya. Format ini populer untuk semua jenis dokumentasi karena berbagai opsi yang ditawarkannya kepada pengguna untuk menulis manual, proposal, spesifikasi, resume, artikel, atau dokumen serupa lainnya. Versi terbaru DOC adalah DOCX yang didasarkan pada Office OpenXML yang spesifikasinya tersedia secara terbuka.

    Baca selengkapnya

    Konversi lain yang Didukung

    Menggunakan C#, seseorang dapat dengan mudah mengonversi berbagai format termasuk.

    TXT (File Dokumen Teks)
    Text (File Dokumen Teks)
    DOC (Dokumen yang dihasilkan oleh Microsoft Word)
    DOCX (dokumen Microsoft Word)
    XLS (Format File Biner Microsoft Excel)
    XLSX (dokumen Microsoft Excel)
    PDF (Format Dokumen Portabel (PDF))
    Searchable PDF (Grafik Jaringan Portabel yang Dapat Dicari)
    XML (Bahasa Markup yang Dapat Diperluas)
    JSON (Notasi Objek JavaScript)