HTML JPG OCR XML BMP
Aspose.OCR  dla .NET
XLS

Konwertuj PDF na XLS w C#

Wykonaj optyczne rozpoznawanie znaków na dokumencie PDF i zapisz tekst jako dokument PDF przy użyciu Aspose.OCR z biblioteki .NET.

Jak przekonwertować PDF na XLS za pomocą C#

Aspose.OCR dla .NET to potężna, ale łatwa w użyciu i opłacalna biblioteka do konwersji obrazów PDF na dokumenty XLS. Dzięki obsłudze 26 języków opartych na łacinie, cyrylicy i chińskim, najnowocześniejszy mechanizm optycznego rozpoznawania znaków zapewnia doskonałą szybkość i dokładność rozpoznawania, izolując Cię od formuł, sieci neuronowych i innych złożonych szczegółów technicznych. Umożliwia dodanie funkcji OCR do aplikacji .NET w mniej niż 10 wierszach kodu.

Aspose.OCR dla .NET

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie PDF i tworzy dokumenty PDF zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy zainstalować Aspose.OCR

NuGet

zapakuj w swój projekt za pomocą następującego polecenia:

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Kroki, aby przekonwertować PDF na XLS

Dzięki .NET OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz PDF na dokument XLS:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.RecognizeImage
  • Przekaż ścieżkę pliku PDF jako parametr
  • AsposeOCR.RecognizeImage zwraca ciąg lub plik typu XLS

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że .NET API zgodne ze specyfikacją NET Standard 2.0 jest zainstalowane w Twoim systemie i wszystkie [zewnętrzne zależności]( https://docs.aspose.com/ocr/net/system-requirements/#external- zależności) pakietu Aspose.OCR są przywoływane w projekcie.

  • Rozwiązanie kompatybilne z NET Standard 2.0+
  • Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.

Ten przykładowy kod pokazuje konwersję PDF na XLS .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.XLS", riText);
  • PDF Co jest PDF Format pliku

    Portable Document Format (PDF) to rodzaj dokumentu stworzony przez firmę Adobe w latach 90. XX wieku. Celem tego formatu pliku było wprowadzenie standardu reprezentacji dokumentów i innych materiałów referencyjnych w formacie niezależnym od oprogramowania aplikacji, sprzętu oraz systemu operacyjnego. Format pliku PDF ma pełną zdolność do przechowywania informacji, takich jak tekst, obrazy, hiperłącza, pola formularzy, multimedia, podpisy cyfrowe, załączniki, metadane, funkcje geoprzestrzenne i obiekty 3D, które mogą stać się częścią dokumentu źródłowego.

    Czytaj więcej

    XLS Co jest XLS Format pliku

    Pliki z rozszerzeniem XLS reprezentują format pliku binarnego Excel. Takie pliki mogą być tworzone przez Microsoft Excel, a także inne podobne programy do arkuszy kalkulacyjnych, takie jak OpenOffice Calc lub Apple Numbers. Plik zapisany przez program Excel jest znany jako skoroszyt, w którym każdy skoroszyt może zawierać jeden lub więcej arkuszy. Dane są przechowywane i wyświetlane użytkownikom w formacie tabeli w arkuszu i mogą obejmować wartości liczbowe, dane tekstowe, formuły, połączenia danych zewnętrznych, obrazy i wykresy. Aplikacje takie jak Microsoft Excel umożliwiają eksportowanie danych ze skoroszytu do kilku różnych formatów, w tym PDF, CSV, XLSX, TXT, HTML, XPS i kilku innych. Format pliku XLS został zastąpiony bardziej otwartym i ustrukturyzowanym formatem, XLSX, wraz z wydaniem Microsoft Excel 2007. Najnowsze wersje nadal zapewniają obsługę tworzenia i odczytywania plików XLS, chociaż XLSX jest teraz pierwszym wyborem.

    Czytaj więcej

    Inne obsługiwane konwersje

    Za pomocą C# można łatwo konwertować różne formaty, w tym.

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)
    XML (Rozszerzalny język znaczników)
    JSON (Notacja obiektu JavaScript)