Проаналізуйте файл DOCX онлайн, а також витягніть текст за допомогою програм Android
Розробіть потужну утиліту аналізатора документів DOCX на базі Android. Код, указаний для вилучення тексту документа DOCX.
Проаналізуйте документ DOCX онлайн
- Імпортуйте файл DOCX для аналізу, завантаживши його.
- Зробіть це, клацнувши всередині області перетягування за допомогою програми аналізатора.
- Залежно від розміру файлу DOCX і швидкості Інтернету зачекайте кілька секунд.
- Натисніть кнопку «Проаналізувати зараз», щоб проаналізувати документ.
- Завантажте проаналізовані файли для миттєвого перегляду.
Витягніть текст із файлу DOCX за допомогою програми Android
- Додайте посилання на бібліотеку до проекту Java
- Завантажте файл DOCX за допомогою об’єкта класу документа
- Визначте вузли за допомогою getLastSection().getChild відповідного типу
- Визначте ArrayList, опублікувавши відповідні вузли
- Визначте колекцію та виконайте ітерацію, щоб отримати інформацію
Код: витягти текст документа DOCX
Document doc = new Document("sourceFile.doc"); | |
Paragraph startPara = (Paragraph) doc.getLastSection().getChild(NodeType.PARAGRAPH, 2, true); | |
Table endTable = (Table) doc.getLastSection().getChild(NodeType.TABLE, 0, true); | |
ArrayList extractedNodes = extractContent(startPara, endTable, true); | |
Collections.reverse(extractedNodes); | |
while (extractedNodes.size() > 0) { | |
endTable.getParentNode().insertAfter((Node) extractedNodes.get(0), endTable); | |
extractedNodes.remove(0); | |
} | |
doc.save("output.doc"); |
Розробка програми аналізатора файлів DOCX для Android
Необхідно розробити програму або програмне забезпечення аналізатора DOCX? Завдяки
Aspose.Words for Android via Java
, дочірньому API
Aspose.Total for Android via Java
, будь-який розробник Android може інтегрувати наведений вище код API у свою програму аналізатора документів. Потужна бібліотека Android дозволяє програмувати будь-яке рішення аналізу документів для вилучення зображень, а також тексту. Крім того, він може підтримувати багато популярних форматів, включаючи формат DOCX.
Утиліта Android для обробки файлу DOCX для програми парсера
- Ми розміщуємо наші пакети Java у Репозиторії Maven .
- Aspose.Words for Java — це звичайний файл JAR, що містить байт-код.
- Дотримуйтесь покрокова інструкція , щоб інсталювати Aspose.Words for Android via Java.
Системні вимоги
- Підтримуються Java SE 7 і новіші версії Java.
- Окремий пакет для Java SE 6 на випадок, якщо потрібно використовувати застарілу JRE.
- Пакет Java є кросплатформним і працює на всіх операційних системах із реалізацією JVM.
- Операційні системи включають Microsoft Windows, Linux, macOS, Android та iOS.
Для отримання додаткової інформації про додаткові залежності пакетів, як-от JogAmp JOGL, механізм шрифтів Harfbuzz, Java Advanced Imaging JAI, зверніться до [Документація продукту](https://docs.aspose.com/words/java/system-requirements/).