Konwertuj obrazy i pliki PDF na tekst w .NET
Dodaj optyczne rozpoznawanie znaków (OCR) do aplikacji .NET za pomocą kilku linijek kodu.
Download Free TrialAspose.OCR for .NET to potężny, ale łatwy w użyciu i ekonomiczny interfejs API do optycznego rozpoznawania znaków. Dzięki niemu możesz dodać funkcję OCR do swoich aplikacji .NET w mniej niż 5 wierszach kodu, nie martwiąc się o złożoną matematykę, sieci neuronowe i inne szczegóły techniczne. Nasze doświadczenie w technologiach uczenia maszynowego i lata rozwoju zaowocowały silnikiem OCR o doskonałej szybkości i dokładności, który obsługuje 26 języków opartych na skryptach łacińskich i cyrylicy oraz chińskim . OCR API może rozpoznawać zeskanowane obrazy, zdjęcia smartfona, zrzuty ekranu, obszary obrazów i zeskanowane pliki PDF oraz zwracać wyniki w najpopularniejszych formatach wymiany dokumentów i danych. Różne filtry przetwarzania wstępnego umożliwiają rozpoznawanie obróconych, przekrzywionych i zaszumionych obrazów. Wydajność rozpoznawania i obciążenie systemu można dodatkowo poprawić, przenosząc zadania obliczeniowe wymagające dużej ilości zasobów do procesora graficznego .
Funkcje i możliwości Aspose.OCR dla .NET
Konwertuje obrazy i pliki PDF na tekst
Obsługuje wszystkie formaty obrazów, które można uzyskać ze skanera lub aparatu
Czyta języki oparte na łacinie i cyrylicy
Rozpoznaje ponad 6000 chińskich znaków
Wykrywa i rozpoznaje wszystkie popularne kroje pisma
Starannie zachowuje style czcionek i formatowanie
Przetwarza cały obraz lub tylko wybrane obszary
Obsługuje obrazy obrócone, przekrzywione i zaszumione
Rozpoznawanie wsadowe wszystkich obrazów w folderze lub archiwum
Rozpoznaje obrazy dostarczone jako linki internetowe
Znajduje i automatycznie poprawia błędnie napisane słowa
W pełni kompatybilny z innymi produktami Aspose
Łatwe do zainstalowania
Aspose.OCR dla platformy .NET jest dystrybuowany jako lekki pakiet NuGet lub jako plik do pobrania z minimalnymi zależnościami. Po prostu zainstaluj go w swoim projekcie i jesteś gotowy do rozpoznawania tekstów w dowolnych obsługiwanych językach i zapisywania wyników rozpoznawania w dowolnym z obsługiwanych formatów.
Poproś o tymczasową licencję , aby rozpocząć tworzenie w pełni funkcjonalnej aplikacji OCR bez żadnych ograniczeń i ograniczeń.
Łatwy w użyciu
Do rozpoznania obrazu i wyświetlenia wyniku potrzebne są trzy linijki kodu. Tak, to naprawdę takie proste!
Obraz do tekstu w 3 wierszach - C#
// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Rozpoznaj obraz do tekstu
string result = recognitionEngine.RecognizeImage("sample.jpg");
// Wyświetl wynik rozpoznawania
Console.WriteLine(result);
Wieloplatformowy
Biblioteka w pełni obsługuje .NET Standard 2.0. Oznacza to, że aplikacje mogą działać na dowolnej platformie: desktopowej Windows, Windows Server, macOS, Linux i chmurze.
26 języków rozpoznawania
OCR API może rozpoznawać dużą liczbę języków i wszystkie popularne skrypty do pisania, w tym teksty w językach mieszanych.
- Rozszerzony alfabet łaciński : chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki.
- Alfabet cyrylicy : białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński.
- Chiński : ponad 6000 znaków.
Wykrywanie języka można pozostawić bibliotece lub samodzielnie zdefiniować język, aby zwiększyć wydajność i niezawodność rozpoznawania.
Rozpoznawaj zdjęcia
Największą barierą dla aplikacji OCR jest to, że skanery nie są powszechne dla użytkowników końcowych. Interfejs API ma zaawansowane wbudowane filtry wstępnego przetwarzania obrazu, które mogą obsługiwać obrazy obrócone, przekrzywione i zaszumione. W połączeniu z obsługą wszystkich formatów obrazu pozwala na niezawodne rozpoznawanie nawet zdjęć ze smartfona. Większość wstępnego przetwarzania i korekcji obrazu odbywa się automatycznie, więc będziesz musiał interweniować tylko w trudnych przypadkach.
Zastosuj automatyczne poprawki obrazu — C#
// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Włącz automatyczne obliczanie pochylenia i kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true,
AutoSkew = true
};
// Rozpoznaj obraz
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);
Uniwersalny konwerter
API może odczytać dosłownie każdy obraz, który można uzyskać ze skanera, aparatu fotograficznego lub smartfona: dokumenty PDF, JPEG, PNG, TIFF, GIF, obrazy BMP, a nawet pliki DjVu. W pełni obsługiwane są wielostronicowe dokumenty PDF, obrazy TIFF i DjVu. Możesz również dostarczyć obraz z Internetu za pośrednictwem adresu URL.
Wyniki rozpoznawania są zwracane w najpopularniejszych formatach wymiany dokumentów i danych: zwykły tekst, PDF, Microsoft Word, Microsoft Excel, JSON i XML.
Rozpoznaj PDF i zapisz wyniki w JSON - C#
// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Rozpoznaj wszystkie strony zeskanowanego pliku PDF
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());
// Wypisz każdą stronę jako JSON
foreach(var page in pages)
{
Console.WriteLine(page.GetJson());
}
Optymalizacja zasobów
Optyczne rozpoznawanie znaków to proces wymagający dużej ilości zasobów. API oferuje bardzo elastyczne sposoby na znalezienie równowagi w klasycznej triadzie czas-cena-jakość:
- Wybierz między dokładnym rozpoznaniem a szybkim rozpoznaniem.
- Określ liczbę wątków przydzielonych do rozpoznawania lub zezwól bibliotece na automatyczne skalowanie do liczby rdzeni procesora.
- Zwolnij procesor, przenosząc obliczenia na GPU.
Szybkie rozpoznawanie - C#
// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Rozpoznaj obraz w najszybszym trybie
string result = recognitionEngine.RecognizeImageFast("sample.jpg");
Sprawdzanie pisowni
Chociaż funkcja OCR zapewnia wiarygodne wyniki, kurz i defekty druku mogą powodować nieprawidłowe rozpoznawanie niektórych symboli. Interfejs API OCR ma wbudowany moduł sprawdzania pisowni, który automatycznie zastępuje błędnie napisane słowa i uwalnia od konieczności ręcznego poprawiania wyników rozpoznawania.
Sprawdzanie pisowni w wynikach rozpoznawania — C#
// Zainicjuj silnik OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Włącz automatyczny kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true
};
// Rozpoznaj obraz
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);
// Popraw błędnie napisane słowa
string text = result.GetSpellCheckCorrectedText();
Przetwarzanie wsadowe
OCR API uwalnia Cię od rozpoznawania każdego obrazu jeden po drugim, oferując różne metody przetwarzania wsadowego, które pozwalają rozpoznać wiele obrazów w jednym wywołaniu:
- Rozpoznawanie wielostronicowych plików PDF, TIFF i DjVu.
- Rozpoznawanie wszystkich plików w folderze.
- Rozpoznawanie wszystkich plików w archiwum.
- Rozpoznawanie wszystkich plików z listy.
Ucz się przez przykład
Aspose.OCR for .NET zawiera szereg przykładów napisanych w C#, które pozwalają szybko zapoznać się z jego funkcjami i możliwościami oraz dają wyobrażenie o tworzeniu rozwiązań dla potrzeb biznesowych.
Support and Learning Resources
- Zasoby edukacyjne
- Dokumentacja
- Kod źródłowy
- Referencje API
- Filmy instruktażowe
- Wsparcie produktu
- Bezpłatne wsparcie
- Płatne wsparcie
- Blog
- Informacje o wydaniu
- Dlaczego Aspose.OCR dla platformy .NET?
- Lista klientów
- Historie sukcesów