HTML JPG OCR XML BMP
Aspose.OCR  dla .NET
XML

Konwertuj JPEG2000 na XML w C#

Wykonaj optyczne rozpoznawanie znaków na dokumencie JPEG2000 i zapisz tekst jako dokument JPEG2000 przy użyciu Aspose.OCR z biblioteki .NET.

Jak przekonwertować JPEG2000 na XML za pomocą C#

Aspose.OCR dla .NET to potężna, ale łatwa w użyciu i opłacalna biblioteka do konwersji obrazów JPEG2000 na dokumenty XML. Dzięki obsłudze 26 języków opartych na łacinie, cyrylicy i chińskim, najnowocześniejszy mechanizm optycznego rozpoznawania znaków zapewnia doskonałą szybkość i dokładność rozpoznawania, izolując Cię od formuł, sieci neuronowych i innych złożonych szczegółów technicznych. Umożliwia dodanie funkcji OCR do aplikacji .NET w mniej niż 10 wierszach kodu.

Aspose.OCR dla .NET

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie JPEG2000 i tworzy dokumenty JPEG2000 zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy zainstalować Aspose.OCR

NuGet

zapakuj w swój projekt za pomocą następującego polecenia:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Kroki, aby przekonwertować JPEG2000 na XML

Dzięki .NET OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz JPEG2000 na dokument XML:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizeImage
  • Przekaż ścieżkę pliku JPEG2000 jako parametr
  • AsposeOCR.RecognizeImage zwraca ciąg lub plik typu XML

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że .NET API zgodne ze specyfikacją NET Standard 2.0 jest zainstalowane w Twoim systemie i wszystkie [zewnętrzne zależności]( https://docs.aspose.com/ocr/net/system-requirements/#external- zależności) pakietu Aspose.OCR są przywoływane w projekcie.

  • Rozwiązanie kompatybilne z NET Standard 2.0+
  • Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.

Ten przykładowy kod pokazuje konwersję JPEG2000 na XML .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG2000");
// print text
File. File.WriteAllText("document.XML", riText);
  • JPEG2000 Co jest JPEG2000 Format pliku

    JPEG 2000 (JP2) to system kodowania obrazu i najnowocześniejszy standard kompresji obrazu. Zaprojektowany przy użyciu technologii wavelet JPEG 2000 może kodować bezstratne treści w dowolnej jakości na raz. Co więcej, bez znaczącej utraty wydajności kodowania, JPEG 2000 ma możliwość skutecznego dostępu i dekodowania tej samej treści w różnych innych rozdzielczościach i jakościach. Strumienie kodu w JPEG 2000 są znacznie skalowalne, posiadając obszary zainteresowania, które zapewniają możliwość przestrzennego dostępu losowego. Posiada do 16384 różnych komponentów o wymiarach w terapikselach i precyzji, która może sięgać nawet 38 bitów na próbkę.

    Czytaj więcej

    XML Co jest XML Format pliku

    XML oznacza Extensible Markup Language, który jest podobny do HTML, ale różni się w użyciu znaczników do definiowania obiektów. Cała idea stworzenia formatu pliku XML polegała na przechowywaniu i transporcie danych bez uzależnienia od narzędzi programowych lub sprzętowych. Jego popularność wynika z tego, że jest czytelny zarówno dla ludzi, jak i maszyn. Umożliwia to tworzenie wspólnych protokołów danych w postaci obiektów, które mają być przechowywane i udostępniane w sieci, takiej jak World Wide Web (WWW). „X” w XML oznacza rozszerzalność, co oznacza, że ​​język można rozszerzyć na dowolną liczbę symboli zgodnie z wymaganiami użytkownika. Z tych funkcji korzysta wiele standardowych formatów plików, takich jak Microsoft Open XML, LibreOffice OpenDocument, XHTML i SVG.

    Czytaj więcej

    Inne obsługiwane konwersje

    Za pomocą C# można łatwo konwertować różne formaty, w tym.

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)
    XML (Rozszerzalny język znaczników)
    JSON (Notacja obiektu JavaScript)