2010-11-04 24 views
9

Şu anda F # içinde ayrıştırma html için başka hangi seçenekler var? Şu anda bazı düzenli ifadeler var ama Pythons Beautiful Soup http://www.crummy.com/software/BeautifulSoup/ gibi bir şeyi tercih edebilir veya F # dan jQuery'ye benzer bir api kullanabilir.F # html ayrıştırma

Fslex ve fparsec'i gördüm ama birileri zaten bir html ayrıştırma kütüphanesi hazırlamış mıyım yoksa kendim yazmam gerekecek.

cevap

8

Bunu (den F # veya başka bir şekilde) kullanmayı denemedim, ancak Html Agility Pack .NET için tercih edilen çözüm gibi görünüyor.

What is the best way to parse html in C#?

+0

Bunu bir yıldan fazla bir süredir kullanıyorum ve gerçekten beğendim. Bir XPath hatasıyla karşılaştım, aksi halde tamamen güvenilir oldu. – Daniel

+0

XPath hatası neydi? Bu kütüphaneyi XPath ile kullanıyorum ve şu ana kadar iyi oldu. Yine de başka seçenekler için umuyoruz. – yanta

+0

@yanta, görünüşte "Html Agility Pack artık Linq'den Objects'e (LINQ'dan Xml Like arayüzü ile) destek veriyor." Her ne kadar F # 'dan nasıl kaldırabileceğinden emin değilim. –