2016-03-30 16 views
1

Tüm sütun içeriğini HTML tablolarında yakalamaya çalışıyorum. Çok yakınım, ama rejeksim sadece her tablonun ilk sütununu yakalıyor. Tüm sütunları yakalamak için ne yapmam gerekiyor? https://regex101.com/r/jA3sS6/1Regex Yinelenen Desen Tüm HTML Tablosunu Yakalamak İçin Sütun İçerikleri

+2

'DOMDocument' PHP kullanarak değil bir nedeni var? – frz3993

+0

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 Bir durum makinesi oluşturun (veya frz3993'ün yöntemini kullanın. kaput) – Petro

+0

Vay, keşke uzun zamandır https://regex101.com hakkında bilinmesini isterdim. –

cevap

1

, normal ifadeyi kullanmak yerine Ayrıştırıcı kullanmayın:

İşte benim düzenli ifade ve HTML! Bununla

Başlangıç:

foreach($xpath->query('//td[@class="large-text"]') as $td) 
{ 
    echo $td->nodeValue . PHP_EOL; 
} 

    :

    foreach($dom->GetElementsByTagName('td') as $td) 
    { 
        echo $td->nodeValue . PHP_EOL; 
    } 
    

    tüm <td class="large-text"> geri almak için:

    $dom = new DOMDocument(); 
    libxml_use_internal_errors(1); 
    $dom->loadHTML($html); 
    $xpath = new DOMXPath($dom); 
    

    tüm <td> almak için 10

  • DOMDocument
  • Oku daha yaklaşık Devamı yaklaşık DOMXPath
  • Oku why you can't parse [X]HTML with regular expressions
İlgili konular