Elemezze a PDF fájlt online, valamint bontsa ki a szöveget vagy képeket a Python segítségével
Hatékony Python alapú PDF dokumentumelemző segédprogram fejlesztése.A PDF-dokumentumképekhez és a Python-on keresztüli szövegkivonathoz listázott kód.
Elemezze a PDF dokumentumot online alkalmazáson keresztül
- Importáljon PDF fájlt az elemzéshez a feltöltéssel.
- Ezt úgy teheti meg, hogy az elemző alkalmazás húzásával az ejtőterületen belülre kattint.
- A PDF fájl méretétől és az internet sebességétől függően várjon néhány másodpercet.
- A dokumentum elemzéséhez kattintson az “Elemzés most” gombra.
- Töltse le az elemzett fájlokat, hogy azonnal megtekinthesse.
Szöveg kibontása a PDF fájlból Python segítségével
- Referencia API-k a projekten belül közvetlenül a PyPI ( Aspose.Words )-ből
- Töltse be a PDF fájlt a Dokumentum osztály segítségével
- Használja a mentési módot .txt fájlként való mentéséhez
- Minden PDF tartalom szöveggé jelenik meg
Kódpélda Pythonban a PDF dokumentum szövegének kinyeréséhez
import aspose.words as aw | |
pdfDoc = aw.Document("file.pdf") | |
pdfDoc.save("PDFtoTextFile.txt") |
Kivonja a képeket a PDF fájlból Python segítségével
- Referencia API-k a projekten belül közvetlenül a PyPI ( Aspose.Words )-ből
- Töltse be a PDF-et a Document class objektum használatával
- Mentse el a fájlt Word fájlként
- Töltse be a Word fájlt a Document class objektum segítségével
- Dokumentumobjektum Shape csomópontjaiban tárolt képek
- Az összes Shape csomópont kijelöléséhez használja a Document.get_child_nodes metódust
- Lapozzon át az eredményül kapott csomópontgyűjtemények között
- Ha a Shape.has_image true értéket ad vissza.
- Használja a Shape.image_data tulajdonságot a képadatok kinyeréséhez.
- Képadatok mentése fájlba
Kódpélda Pythonban a PDF dokumentumképek kivonásához
import aspose.words as aw | |
pdfDoc = aw.Document("sourcefile.pdf") | |
pdfDoc.save("pdftoword.docx") | |
docWithImages = aw.Document("pdftoword.docx") | |
shapes = docWithImages.get_child_nodes(aw.NodeType.SHAPE, True) | |
imageIndex = 0 | |
for shape in shapes : | |
shape = shape.as_shape() | |
if (shape.has_image) : | |
imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}" | |
shape.image_data.save(imageFileName) | |
imageIndex += 1 |
Develop PDF File Parser Application via Python
PDF elemző alkalmazást vagy segédprogramot szeretne fejleszteni?A
Aspose.Words for Python via .NET
-mal a
Aspose.Total for Python via .NET
gyermek API-jával bármely python-fejlesztő integrálhatja a fenti API-kódot a dokumentumelemző alkalmazásába.A hatékony Python-könyvtár lehetővé teszi bármilyen dokumentumelemző megoldás programozását képek és szövegek kinyerésére.Ezenkívül számos népszerű formátumot támogat, beleértve a PDF formátumot.
Python segédprogram PDF fájl feldolgozásához az elemző alkalmazáshoz
Vannak alternatív lehetőségek a „
Aspose.Words for Python via .NET
” vagy „
Aspose.Total for Python via .NET
” telepítésére a rendszerre.Kérjük, válasszon egyet, amely megfelel az Ön igényeinek, és kövesse a lépésről lépésre található utasításokat:
- Telepítse a Aspose.Words for Python via .NET -at a PyPI -ből
- Vagy Használja a következő pip parancsokat
pip install aspose-pdf
.
rendszerkövetelmények
- Python 3.5 vagy újabb verzió van telepítve
- GCC-6 futásidejű könyvtárak (vagy újabb).
- Python 3.5-3.7 esetén: A Python pymalloc buildje szükséges.
További részletekért lásd a Product Documentation -öt.
GYIK
- Használhatom a fenti Python kódot az alkalmazásomban?Igen, letöltheti ezt a kódot, és felhasználhatja Python-alapú dokumentumelemző alkalmazás fejlesztésére.Ez a kód értékes erőforrásként szolgálhat projektjei funkcionalitásának és képességeinek javításához a háttérdokumentum-feldolgozás tartományában, például csomópontok olvasása és a dokumentum betöltése szöveg- és képkivonás céljából.
- Ez az online dokumentumelemző alkalmazás csak Windows rendszeren működik?Bármilyen eszközön rugalmasan kezdeményezheti a dokumentumok elemzését, függetlenül attól, hogy melyik operációs rendszeren fut, legyen az Windows, Linux, Mac OS vagy Android.Csak egy modern webböngészőre és egy aktív internetkapcsolatra van szükség.
- Biztonságos az online alkalmazás használata a PDF dokumentum elemzéséhez?Természetesen! A szolgáltatásunkon keresztül generált kimeneti fájlokat 24 órás időkereten belül biztonságosan és automatikusan eltávolítjuk szervereinkről.Ennek eredményeként az ezekhez a fájlokhoz társított megjelenítési hivatkozások ezen időszak után megszűnnek.
- Milyen böngészőt kell használni az alkalmazáshoz?Az online PDF dokumentumelemzőhöz bármilyen modern webböngészőt használhat, például a Google Chrome-ot, a Firefoxot, az Opera-t vagy a Safarit. Ha azonban asztali alkalmazást fejleszt, javasoljuk az Aspose.Total dokumentumfeldolgozási API használatát a hatékony kezelés érdekében.