HTML JPG OCR XML BMP
Aspose.OCR  dla .NET
DOCX

Konwertuj DJVU na DOCX w C#

Wykonaj optyczne rozpoznawanie znaków na dokumencie DJVU i zapisz tekst jako dokument DJVU przy użyciu Aspose.OCR z biblioteki .NET.

Jak przekonwertować DJVU na DOCX za pomocą C#

Aspose.OCR dla .NET to potężna, ale łatwa w użyciu i opłacalna biblioteka do konwersji obrazów DJVU na dokumenty DOCX. Dzięki obsłudze 26 języków opartych na łacinie, cyrylicy i chińskim, najnowocześniejszy mechanizm optycznego rozpoznawania znaków zapewnia doskonałą szybkość i dokładność rozpoznawania, izolując Cię od formuł, sieci neuronowych i innych złożonych szczegółów technicznych. Umożliwia dodanie funkcji OCR do aplikacji .NET w mniej niż 10 wierszach kodu.

Aspose.OCR dla .NET

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie DJVU i tworzy dokumenty DJVU zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy zainstalować Aspose.OCR

NuGet

zapakuj w swój projekt za pomocą następującego polecenia:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Kroki, aby przekonwertować DJVU na DOCX

Dzięki .NET OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz DJVU na dokument DOCX:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizeImage
  • Przekaż ścieżkę pliku DJVU jako parametr
  • AsposeOCR.RecognizeImage zwraca ciąg lub plik typu DOCX

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że .NET API zgodne ze specyfikacją NET Standard 2.0 jest zainstalowane w Twoim systemie i wszystkie [zewnętrzne zależności]( https://docs.aspose.com/ocr/net/system-requirements/#external- zależności) pakietu Aspose.OCR są przywoływane w projekcie.

  • Rozwiązanie kompatybilne z NET Standard 2.0+
  • Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.

Ten przykładowy kod pokazuje konwersję DJVU na DOCX .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOCX", riText);
  • DJVU Co jest DJVU Format pliku

    DjVu, wymawiane jako „déjà vu”, to format plików graficznych przeznaczony dla zeskanowanych dokumentów i książek, zwłaszcza zawierających kombinację tekstu, rysunków, obrazów i fotografii. Został opracowany przez AT&T Labs. Wykorzystuje wiele technik, takich jak separacja warstw obrazu tekstu i obrazów tła, ładowanie progresywne, kodowanie arytmetyczne i kompresja stratna dla obrazów dwukolorowych. Ponieważ plik DJVU może zawierać skompresowane, ale wysokiej jakości kolorowe obrazy, zdjęcia, tekst i rysunki, i może być zapisany na mniejszej przestrzeni, dlatego jest używany w Internecie jako e-booki, podręczniki, gazety, starożytne dokumenty itp.

    Czytaj więcej

    DOCX Co jest DOCX Format pliku

    DOCX to dobrze znany format dokumentów Microsoft Word. Wprowadzony w 2007 roku wraz z wydaniem pakietu Microsoft Office 2007, struktura tego nowego formatu dokumentu została zmieniona ze zwykłego binarnego na kombinację plików XML i binarnych. Pliki Docx można otwierać w programie Word 2007 i wersjach pobocznych, ale nie we wcześniejszych wersjach programu MS Word, które obsługują rozszerzenia plików DOC.

    Czytaj więcej

    Inne obsługiwane konwersje

    Za pomocą C# można łatwo konwertować różne formaty, w tym.

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)
    XML (Rozszerzalny język znaczników)
    JSON (Notacja obiektu JavaScript)