Elemezze a RTF fájlt online, valamint bontsa ki a szöveget vagy képeket a Python segítségével
Hatékony Python alapú RTF dokumentumelemző segédprogram fejlesztése.A RTF-dokumentumképekhez és a Python-on keresztüli szövegkivonathoz listázott kód.
Elemezze a RTF dokumentumot online alkalmazáson keresztül
- Importáljon RTF fájlt az elemzéshez a feltöltéssel.
- Ezt úgy teheti meg, hogy az elemző alkalmazás húzásával az ejtőterületen belülre kattint.
- A RTF fájl méretétől és az internet sebességétől függően várjon néhány másodpercet.
- A dokumentum elemzéséhez kattintson az “Elemzés most” gombra.
- Töltse le az elemzett fájlokat, hogy azonnal megtekinthesse.
Szöveg kibontása a RTF fájlból Python segítségével
- Referencia API-k a projekten belül közvetlenül a PyPI ( Aspose.Words )-ből
- Határozza meg a szövegkivonási folyamatba bevonandó csomópontokat
- Az első és az utolsó csomópontok felvétele vagy kizárása
- Tartalom kibontása a megadott csomópontokban
- Hozzon létre egy külön RTF dokumentumot a kivont szöveghez
- Az Extract_content függvényben felsorolt kód.
Kódpélda Pythonban a RTF dokumentum szövegének kinyeréséhez
def extract_content(startNode : aw.Node, endNode : aw.Node, isInclusive : bool): | |
verify_parameter_nodes(startNode, endNode) | |
nodes = [] | |
if (endNode.node_type == aw.NodeType.COMMENT_RANGE_END and isInclusive) : | |
node = find_next_node(aw.NodeType.COMMENT, endNode.next_sibling) | |
if (node != None) : | |
endNode = node | |
originalStartNode = startNode | |
originalEndNode = endNode | |
startNode = get_ancestor_in_body(startNode) | |
endNode = get_ancestor_in_body(endNode) | |
isExtracting = True | |
isStartingNode = True | |
currNode = startNode | |
while (isExtracting) : | |
cloneNode = currNode.clone(True) | |
isEndingNode = currNode == endNode | |
if (isStartingNode or isEndingNode) : | |
if (isEndingNode) : | |
process_marker(cloneNode, nodes, originalEndNode, currNode, isInclusive, False, not isStartingNode, False) | |
isExtracting = False | |
if (isStartingNode) : | |
process_marker(cloneNode, nodes, originalStartNode, currNode, isInclusive, True, True, False) | |
isStartingNode = False | |
else : | |
nodes.append(cloneNode) | |
if (currNode.next_sibling == None and isExtracting) : | |
nextSection = currNode.get_ancestor(aw.NodeType.SECTION).next_sibling.as_section() | |
currNode = nextSection.body.first_child | |
else : | |
currNode = currNode.next_sibling | |
if (isInclusive and originalEndNode == endNode and not originalEndNode.is_composite) : | |
include_next_paragraph(endNode, nodes) | |
return nodes |
Kivonja a képeket a RTF fájlból Python segítségével
- Referencia API-k a projekten belül közvetlenül a PyPI ( Aspose.Words )-ből
- A Dokumentumobjektum Shape csomópontjaiban tárolt képek
- Az összes Shape csomópont kijelöléséhez használja a Document.get_child_nodes metódust
- Lapozzon át az eredményül kapott csomópontgyűjtemények között
- Ha a Shape.has_image true értéket ad vissza.
- Használja a Shape.image_data tulajdonságot a képadatok kinyeréséhez.
- Képadatok mentése fájlba
Kódpélda Pythonban a RTF dokumentumképek kivonásához
doc = aw.Document(docs_base.my_dir + "sourcefile.docx") | |
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True) | |
imageIndex = 0 | |
for shape in shapes : | |
shape = shape.as_shape() | |
if (shape.has_image) : | |
imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}" | |
shape.image_data.save(docs_base.artifacts_dir + imageFileName) | |
imageIndex += 1 |
RTF fájlelemző alkalmazás fejlesztése Python segítségével
RTF elemző alkalmazást vagy segédprogramot szeretne fejleszteni?A
Aspose.Words for Python via .NET
-mal a
Aspose.Total for Python via .NET
gyermek API-jával bármely python-fejlesztő integrálhatja a fenti API-kódot a dokumentumelemző alkalmazásába.A hatékony Python-könyvtár lehetővé teszi bármilyen dokumentumelemző megoldás programozását képek és szövegek kinyerésére.Ezenkívül számos népszerű formátumot támogat, beleértve a RTF formátumot.
Python segédprogram RTF fájl feldolgozásához az elemző alkalmazáshoz
Vannak alternatív lehetőségek a „
Aspose.Words for Python via .NET
” vagy „
Aspose.Total for Python via .NET
” telepítésére a rendszerre.Kérjük, válasszon egyet, amely megfelel az Ön igényeinek, és kövesse a lépésről lépésre található utasításokat:
- Telepítse a Aspose.Words for Python via .NET -at a PyPI -ből
- Vagy Használja a következő pip parancsokat:
pip install aspose.words
.
rendszerkövetelmények
- Python 3.5 vagy újabb telepítve van
- GCC-6 futásidejű könyvtárak (vagy újabb).
- A .NET Core Runtime függőségei. Maga a .NET Core Runtime telepítése NEM szükséges.
- Python 3.5-3.7 esetén: A Python pymalloc buildje szükséges.
További részletekért lásd a Termékdokumentáció -öt.
GYIK
- Használhatom a fenti Python kódot az alkalmazásomban?Igen, letöltheti ezt a kódot, és felhasználhatja Python-alapú dokumentumelemző alkalmazás fejlesztésére.Ez a kód értékes erőforrásként szolgálhat projektjei funkcionalitásának és képességeinek javításához a háttérdokumentum-feldolgozás tartományában, például csomópontok olvasása és a dokumentum betöltése szöveg- és képkivonás céljából.
- Ez az online dokumentumelemző alkalmazás csak Windows rendszeren működik?Bármilyen eszközön rugalmasan kezdeményezheti a dokumentumok elemzését, függetlenül attól, hogy melyik operációs rendszeren fut, legyen az Windows, Linux, Mac OS vagy Android.Mindössze egy modern webböngészőre és egy aktív internetkapcsolatra van szükség.
- Biztonságos az online alkalmazás használata a RTF dokumentum elemzéséhez?Természetesen! A szolgáltatásunkon keresztül generált kimeneti fájlokat 24 órás időkereten belül biztonságosan és automatikusan eltávolítjuk szervereinkről.Ennek eredményeként az ezekhez a fájlokhoz társított megjelenítési hivatkozások ezen időszak után megszűnnek.
- Milyen böngészőt kell használni az alkalmazáshoz?Az online RTF dokumentumelemzőhöz bármilyen modern webböngészőt használhat, például a Google Chrome-ot, a Firefoxot, az Opera-t vagy a Safarit.Ha azonban asztali alkalmazást fejleszt, javasoljuk az Aspose.Total dokumentumfeldolgozási API használatát a hatékony kezelés érdekében.