Konwertuj DJVU na XML w C#
Wykonaj optyczne rozpoznawanie znaków na dokumencie DJVU i zapisz tekst jako dokument DJVU przy użyciu Aspose.OCR z biblioteki .NET.
Jak przekonwertować DJVU na XML za pomocą C#
Aspose.OCR dla .NET to potężna, ale łatwa w użyciu i opłacalna biblioteka do konwersji obrazów DJVU na dokumenty XML. Dzięki obsłudze 26 języków opartych na łacinie, cyrylicy i chińskim, najnowocześniejszy mechanizm optycznego rozpoznawania znaków zapewnia doskonałą szybkość i dokładność rozpoznawania, izolując Cię od formuł, sieci neuronowych i innych złożonych szczegółów technicznych. Umożliwia dodanie funkcji OCR do aplikacji .NET w mniej niż 10 wierszach kodu.
przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie DJVU i tworzy dokumenty DJVU zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy zainstalować Aspose.OCR
zapakuj w swój projekt za pomocą następującego polecenia:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Kroki, aby przekonwertować DJVU na XML
Dzięki .NET OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz DJVU na dokument XML:
- Utwórz instancję klasy AsposeOcr
- Wywołaj metodę AsposeOCR.RecognizeImage
- Przekaż ścieżkę pliku DJVU jako parametr
- AsposeOCR.RecognizeImage zwraca ciąg lub plik typu XML
wymagania systemowe
Przed uruchomieniem przykładu upewnij się, że .NET API zgodne ze specyfikacją NET Standard 2.0 jest zainstalowane w Twoim systemie i wszystkie [zewnętrzne zależności]( https://docs.aspose.com/ocr/net/system-requirements/#external- zależności) pakietu Aspose.OCR są przywoływane w projekcie.
- Rozwiązanie kompatybilne z NET Standard 2.0+
- Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.
Ten przykładowy kod pokazuje konwersję DJVU na XML .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.XML", riText);
DJVU Co jest DJVU Format pliku
DjVu, wymawiane jako „déjà vu”, to format plików graficznych przeznaczony dla zeskanowanych dokumentów i książek, zwłaszcza zawierających kombinację tekstu, rysunków, obrazów i fotografii. Został opracowany przez AT&T Labs. Wykorzystuje wiele technik, takich jak separacja warstw obrazu tekstu i obrazów tła, ładowanie progresywne, kodowanie arytmetyczne i kompresja stratna dla obrazów dwukolorowych. Ponieważ plik DJVU może zawierać skompresowane, ale wysokiej jakości kolorowe obrazy, zdjęcia, tekst i rysunki, i może być zapisany na mniejszej przestrzeni, dlatego jest używany w Internecie jako e-booki, podręczniki, gazety, starożytne dokumenty itp.
Czytaj więcejXML Co jest XML Format pliku
XML oznacza Extensible Markup Language, który jest podobny do HTML, ale różni się w użyciu znaczników do definiowania obiektów. Cała idea stworzenia formatu pliku XML polegała na przechowywaniu i transporcie danych bez uzależnienia od narzędzi programowych lub sprzętowych. Jego popularność wynika z tego, że jest czytelny zarówno dla ludzi, jak i maszyn. Umożliwia to tworzenie wspólnych protokołów danych w postaci obiektów, które mają być przechowywane i udostępniane w sieci, takiej jak World Wide Web (WWW). „X” w XML oznacza rozszerzalność, co oznacza, że język można rozszerzyć na dowolną liczbę symboli zgodnie z wymaganiami użytkownika. Z tych funkcji korzysta wiele standardowych formatów plików, takich jak Microsoft Open XML, LibreOffice OpenDocument, XHTML i SVG.
Czytaj więcejInne obsługiwane konwersje
Za pomocą C# można łatwo konwertować różne formaty, w tym.