Pomocí Aspose.Total for Java můžete do svých aplikací Java integrovat funkci převodu MHTML na TXT ve dvou krocích. Za prvé, pomocí Aspose.PDF for Java můžete vykreslit MHTML do XLSX. Ve druhém kroku můžete převést XLSX na TXT pomocí Spreadsheet Programming API Aspose.Cells for Java .
Převeďte soubor MHTML na TXT přes Java
- Otevřete soubor MHTML pomocí třídy Document
- Převeďte MHTML na XLSX pomocí save metoda
- Načtěte dokument XLSX pomocí třídy Workbook
- Uložte dokument do formátu TXT pomocí SaveOptions metoda
Požadavky na převod
Aspose.Total pro Javu můžete snadno používat přímo z projektu založeného na Maven a zahrnují Aspose.PDF for Java a Aspose.Cells for Java ve vašem pom.xml.
Požadavky na převod
Pokud je váš dokument MHTML chráněn heslem, nemůžete jej bez hesla převést na TXT. Pomocí API můžete nejprve otevřít chráněný dokument pomocí platného hesla a poté jej převést. Chcete-li otevřít zašifrovaný soubor, můžete inicializovat novou instanci Document a předejte název souboru a heslo jako argumenty.
Převeďte chráněné MHTML na TXT přes Java
Při převodu souboru MHTML na TXT můžete také přidat vodoznak do výstupního formátu souboru TXT. Chcete-li přidat vodoznak, vytvořte nový sešit a otevřete převedený soubor XLSX. Vyberte pracovní list přes jeho index, vytvořte tvar a použijte jeho funkci addTextEffect, nastavte barvy, průhlednost a další. Poté můžete uložit dokument XLSX jako TXT s vodoznakem.
Klíčové použití
Archivace webového obsahu jako čistého textu pro offline čtení.
Extrahování textových zpráv z MHTML stránek pro analýzu.
Převod online článků nebo tutoriálů do formátu TXT pro rychlý odkaz.
Příprava obsahu pro zpracování založené na textu, NLP nebo nástroje AI.
Automatizační scénáře
Hromadný převod MHTML na TXT pro archivaci webového obsahu ve velkém měřítku.
Plánované extrahování textových dat z webových stránek pro analýzu.
Integrace s AI/ML potrubími pro automatizované zpracování textu.
Spouštěný převod pro monitorování a hlášení obsahu webových stránek v reálném čase.