DOCX Dosyasını Çevrimiçi Ayrıştırmanın yanı sıra Android Uygulamaları aracılığıyla Metin Çıkarma
Güçlü Android tabanlı DOCX belge ayrıştırıcı yardımcı programı uygulaması geliştirin. DOCX belge metni çıkarma için listelenen kod.
DOCX Belgesini Çevrimiçi Ayrıştırma
- DOCX dosyasını yükleyerek ayrıştırmak için içe aktarın.
- Ayrıştırıcı uygulamasının sürükleyip bırakma yöntemiyle bırakma alanının içine tıklayarak bunu yapın.
- DOCX dosyasının boyutuna ve internet hızına bağlı olarak birkaç saniye bekleyin.
- Belgeyi ayrıştırmak için ‘Şimdi Ayrıştır’ düğmesini tıklayın.
- Anında görüntülemek için ayrıştırılan dosyaları indirin.
Android Uygulaması aracılığıyla DOCX Dosyasından Metin Çıkarma
- Java projesine kitaplık referansı ekleme
- Document sınıfı nesnesini kullanarak DOCX dosyasını yükleyin
- İlgili türden getLastSection().getChild’i kullanarak Düğümleri tanımlayın
- İlgili düğümleri göndererek ArrayList’i tanımlayın
- Koleksiyonu tanımlayın ve bilgileri çıkarmak için yineleyin
Kod: DOCX Belge Metnini Çıkart
Document doc = new Document("sourceFile.doc"); | |
Paragraph startPara = (Paragraph) doc.getLastSection().getChild(NodeType.PARAGRAPH, 2, true); | |
Table endTable = (Table) doc.getLastSection().getChild(NodeType.TABLE, 0, true); | |
ArrayList extractedNodes = extractContent(startPara, endTable, true); | |
Collections.reverse(extractedNodes); | |
while (extractedNodes.size() > 0) { | |
endTable.getParentNode().insertAfter((Node) extractedNodes.get(0), endTable); | |
extractedNodes.remove(0); | |
} | |
doc.save("output.doc"); |
DOCX Dosya Ayrıştırıcı Android Uygulamasını Geliştirin
Bir DOCX ayrıştırıcı uygulaması veya yazılımı geliştirmeniz mi gerekiyor?
Aspose.Words for Android via Java
,
Aspose.Total for Android via Java
’nin alt API’si olduğundan, herhangi bir android geliştiricisi yukarıdaki API kodunu kendi belge ayrıştırıcı uygulamasına entegre edebilir. Güçlü Android kitaplığı, metinlerin yanı sıra görüntüleri de çıkarmak için herhangi bir belge ayrıştırma çözümünün programlanmasına olanak tanır. Üstelik DOCX formatı da dahil olmak üzere birçok popüler formatı destekleyebilir.
Ayrıştırıcı uygulaması için DOCX dosyasını işlemeye yönelik Android yardımcı programı
- Java paketlerimizi Maven depoları ‘de barındırıyoruz.
- Aspose.Words for Java, bayt kodunu içeren yaygın bir JAR dosyasıdır.
- Aspose.Words for Android via Java’in nasıl kurulacağını öğrenmek için adım adım talimatlar ‘yi takip edin.
sistem gereksinimleri
- Java SE 7 ve daha yeni Java sürümleri desteklenmektedir.
- Güncel olmayan JRE kullanmak zorunda kalmanız durumunda Java SE 6 için ayrı paket.
- Java paketi çapraz platformdur ve JVM uygulamasına sahip tüm işletim sistemlerinde çalışır.
- İşletim sistemleri Microsoft Windows, Linux, macOS, Android ve iOS’u içerir.
JogAmp JOGL, Harfbuzz yazı tipi motoru, Java Gelişmiş Görüntüleme JAI gibi isteğe bağlı paket bağımlılıkları hakkında daha fazla ayrıntı için lütfen [Ürün Dokümantasyonu](https://docs.aspose.com/words/java/system-requirements/)'e bakın.