DOM/SAX bölmesi temel olanıdır. DOM ve SAX çapraz dil olduğu için sadece python için değil. Tüm belgeyi belleğe okuyun ve işleyin. Avantajlar: işaretlemesinde etiketlere
- karmaşık ilişkiler
- küçük karmaşık XML belgeleri
- Dikkat:
- Kullanımı kolay aşırı bellek
SAX: ayrıştırma t okurken dokümanı okuyor. Avantajlar:
- Uzun belgeleri veya açık uçlu akışları hafıza bir kısıtlama
- Dikkat olan
- yerleri:
- Sen yanıltıcı olabilir bir durum bilgisi ayrıştırıcı, kod gerekir
BeautifulSoup:
HTML veya gayet iyi biçimlendirilmiş biçimlendirme için idealdir. Kullanımı kolay ve hızlı. Ekran kazıma, vb. Için iyi. XML tabanlı olanların işaretlemenin yanlış olduğunu söyleyen bir hatadan geçtiği yerlerde işaretleme ile çalışabilir.
Geri kalanların çoğu kullanmıyorum ama ne zaman kullanacağım konusunda sert ve hızlı kurallar olduğunu sanmıyorum. Sadece standart düşünceleriniz: kim kodları korumak için gidiyor, hangi API'ları kullanmak en kolay buluyorsunuz, ne kadar iyi çalışıyorlar, vb.
Genel olarak, temel ihtiyaçlar için, standart kütüphane modüllerini kullanmak güzel Çünkü bunlar "standart" ve dolayısıyla mevcut ve iyi bilinir.Bununla birlikte, eğer bir şeyi derinlemesine kazmanız gerekiyorsa, hemen hemen her zaman standart kütüphanenin dışında üstün işlevsellik ile yeni standart dışı modüller vardır.
Bu vesileyle güzel çorba ile gittim, diğerleri girdiler hakkında bilgi vermiyordu; Kontrol etmediğim bir şey. –
Geliştirici verimliliğinden ve kullanım kolaylığı açısından bakıldığında, BeautifulSoup ile harika bir deneyim yaşadım. Anaconda python onunla birlikte geliyor. http://www.doughellmann.com/PyMOTW/xml/etree/ElementTree/parse.html – arun