Bir pdf içeriğini bash'dan çıkarmak için herhangi bir yol var mı? (Ne yazık ki "1010.3423.pdf" gibi etiketlere sahip olan büyük bir akademik makale klasörüne sahibim. Daha mantıklı bir isme daha yazmak için bash komut dosyası yazmak istiyorum. Bu da ilk birkaç satırda googling yapıyor.)Bir pdf içeriğini bash'dan çıkarmak için herhangi bir yol var mı?
5
A
cevap
3
pdftotext, pdf dosyasındaki başlıkları ve yazarları almanıza yardımcı olabilir. Bunu daha sonra google'a kullanabilir veya kendiniz bir dosya adı oluşturabilirsiniz.
3
Metni çıkarmak için pdftotext dosyasını deneyin. http://en.wikipedia.org/wiki/Pdftotext
1
pdf2xml size daha ayrıntılı bilgi alacaktır, geçen sene böyle bir kullanım için aradım ve hepsinden önemlisi, en iyi pdf2xml olduğunu düşünüyorum.
İlgili konular
- 1. TabLayout'ta SpannableString'i kullanmak için herhangi bir yol var mı?
- 2. İki seçeneği "birleştirmek" için herhangi bir yol var mı?
- 3. CSS'yi durdurmak için herhangi bir yol var mı?
- 4. Flyway geçişlerini "sıkıştırmak" için herhangi bir yol var mı?
- 5. İşaretleme tablolarını sıralamak için herhangi bir yol var mı?
- 6. SFSafariViewController'ı UI testlerinde otomatikleştirmek için herhangi bir yol var mı?
- 7. Bir pdf'yi C# ile düzenlemek için bir yol var mı?
- 8. JavaFX'te yol gradyanı oluşturmanın herhangi bir yolu var mı?
- 9. Kovaryans bildirmek için bir yol var mı?
- 10. Bir dosya oluşturup açmak için herhangi bir yol var mı, yoksa başka türlü başarısız mı?
- 11. Visual Studio'daki geçerli sekmeyi en üst düzeye çıkarmak için bir yol var mı?
- 12. Moodle için herhangi bir API var mı?
- 13. Başka bir mvc projesinden bir mvc projesinin görünüşüne yönlendirilmek için herhangi bir yol var mı?
- 14. Bir inşaat demiri klonlamadan önce yerel bir önbelleği kontrol etmek için herhangi bir yol var mı?
- 15. Bir bileşenin durumunu farklı bir bileşenden değiştirebilmem için herhangi bir yol var mı?
- 16. Normal bir ifadede bir Golang dizesinden kaçmak için herhangi bir yol var mı?
- 17. WADL dosyası oluşturmak için herhangi bir araç var mı?
- 18. SASS'de bir dersi “genişletmek” için bir yol var mı?
- 19. : raylar için herhangi bir seçenek 3 yol
- 20. Her döngü için paralel olması için bir yol var mı?
- 21. "Vurgulu" kodun herhangi bir yolu var mı?
- 22. Android'de yerleşik bir PDF görüntüleyici var mı?
- 23. Bir istemci tarafı tetikleyicisine sahip olmak için herhangi bir yol veya geçici çözüm var mı?
- 24. Android: MMS'i herhangi bir android cihazda göndermek için evrensel bir yol var mı?
- 25. XmlSerializer xml'yi tanımlanmış bir sırada xml yapmak için herhangi bir yol var mı?
- 26. Python'da varolan bir nesneye yöntem eklemek için herhangi bir zarif yol var mı?
- 27. Bir nesneyi C# kodundan javascript'e geçirmek için herhangi bir yol var mı?
- 28. Node.js'de bir dize yeniden alıntılamak için herhangi bir yol var mı?
- 29. Bir belgeyi kapattığınızda tanımlara otomatik olarak daraltmak için herhangi bir yol var mı?
- 30. Java kodunu bir DLL'ye derlemek için herhangi bir yol var mı?
[kopyalanmış metin içeriğinin PDF'den nasıl çıkarılacağı] olası bir kopyası (http://stackoverflow.com/questions/2196621/how-to-extract-formatted-text-content-from-pdf) –