Aşağıdaki HTML yapısını perl ile ayrıştırmaya çalışıyorum. Sınıf mesajını içeren tüm dd öğelerini ve ayrıca bir kimliği seçmem gerekiyor. Komut dosyasının yapmasını istediğim, tüm dd öğelerinin arasında dolaşmak ve dd öğesinin kimliğini yazdırmaktır, ancak ilk dd öğesinin statik olduğu ve değişmeyeceği ilkesini yok sayması gerekir.HTML pars içinde ayrıştırma
Bana kolaylık sağlamak için cpan'dan yüklenebildiği sürece herhangi bir perl modülü ile olabilir. Perl ile çok fazla tecrübem yok ve html'yi ayrıştırarak herhangi bir işaretçiyi çok yardımcı olacaktı.
Thanks :)
HTML Yapısı:
<pre><code>
<html>
<head>
</head>
<body>
.....other elements
<div id="messages">
<div class="header"></div>
<dl>
<dd class="message unread mc-friend mc-message">This is just a random message, do not parse</dd>
<dd id="msg2" class="message unread mc-message">
Hello
</div>
<dd id="msg3" class="message unread mc-message">
Hello
</dd>
</dl>
</div>
</body>
</html>
</pre></code>
sen [böyle bir şey] denedin mi (http://lmctfy.org/html%20parser/)? – Ether
Vay, google bir tane gördüm, ama thats sadece çok daha iyi: P Ama evet, bir sürü var gibi görünüyor ama hangisi ile gitmek emin değilim. – Jack
:) Genel olarak HTML :: Ayrıştırıcı harika, ancak başka bir yere işaret eden özel ihtiyaçlarınız olabilir ... Burada da size bazı yararlı ipuçları veren benzer soruların iyi bir arşivi var. – Ether