Ayrıştırma CDATA piton

2012-12-04 39 views 9 likes

ben sonradan planlamaktan korumak için gereken CDATA'da blokları bir dizi XML dosyasını ayrıştırmak gerekiyor

<process id="process1"> <log name="name1" device="device1"><![CDATA[timestamp value]]]></log> <log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]]></log> </process>

Ben defalarca ve hızlı bir şekilde bunu yapmak gerekecektir ve bunu yapmanın en iyi yolunu arıyorum. ElementTree'nin yöntemlerin daha hızlı olduğunu okudum ama diğer önerilere açığım.

kaynak

2012-12-04 Jen

xtree, sorununuz için öğe ağacından daha iyi bir alternatiftir. – Rajendra

cevap

İşte bunu nasıl iki örnek:

from lxml import etree 
import xml.etree.ElementTree as ElementTree 

CONTENT = """ 
<process id="process1"> 
<log name="name1" device="device1"><![CDATA[timestamp value]]></log> 
<log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]></log> 
</process> 
""" 

def parse_with_lxml(): 
    root = etree.fromstring(CONTENT) 
    for log in root.xpath("//log"): 
     print log.text 

def parse_with_stdlib(): 
    root = ElementTree.fromstring(CONTENT) 
    for log in root.iter('log'): 
     print log.text 

if __name__ == '__main__': 
    parse_with_lxml() 
    parse_with_stdlib()

Çıktı:

timestamp value 
timestamp value, timestamp value, timestamp 
timestamp value 
timestamp value, timestamp value, timestamp

metin her iki durumda da; o işi bağlıyor.

kaynak

2013-01-21 03:22:55 Joe

Performans için, "cElementTree" kullanılabilir (not: leadind 'c') – jfs

İlgili konular

1. XML ile Ayrıştırma XML CDATA
2. Ayrıştırma DİNLENME API sonuç piton
3. ayıklanıyor içerik <![CDATA []]>
4. piton
5. xml.dom.minidom: CDATA değerleri alınıyor
6. Java'da CDATA XML Okuma
7. CDATA gerçekten gerekli mi?
8. LXML benim CDATA bölümleri öldürür
9. piton
10. piton
11. piton
12. piton
13. piton -
14. piton
15. piton:
16. piton
17. (piton)
18. piton
19. piton
20. piton
21. piton
22. piton
23. piton
24. piton
25. Geçiş piton liste boost piton
26. nokogiri'yi kullanarak xml dosyasında cdata etiketlerini içeri almaya çalışırken
27. GDataXMLNode'u kullanarak nasıl bir cdata bloğu ekleyebilirim?
28. XML'ye LINQ kullanarak CData nasıl dahil edilir?
29. CDATA PowerShell ile XML dosyasında nasıl okunur?
30. HTML Etiketlerini XSL içinde CDATA etiketinden düzenleme