2016-03-19 30 views
2

Kullanmak için bir sınıf adınız veya kimliğiniz yoksa, ayrıştırma için AngleSharp kullanmanın birçok örneği bulamıyor.AngleSharp Ayrıştırma

HTML

<span><a href="google.com" title="Google"><span class="icon icon_none"></span></a></span> 
<span><a href="bing.com" title="Bing"><span class="icon icon_none"></span></a></span> 
<span><a href="yahoo.com" title="Yahoo"><span class="icon icon_none"></span></a></span> 

Python BeautifulSoup bir başlık = Bing

sahip herhangi <a> etiketlerinden href bulmak istiyorum ben

item_needed = a_row.find('a', {'title': 'Bing'}) 

kullanmak ve sonra href kapmak istiyorum özniteliği

veya jQuery

a[title='Bing'] 

Ancak, AngleSharp kullanarak takılıyorum. örnek aşağıdaki https://github.com/AngleSharp/AngleSharp/wiki/Examples#getting-certain-elements

C# AngleSharp

var parser = new AngleSharp.Parser.Html.HtmlParser(); 
var document = parser.Parse(@"<span><a href=""google.com"" title=""Google""><span class=""icon icon_none""></span></a></span><span>< a href = ""bing.com"" title = ""Bing"" >< span class=""icon icon_none""></span></a></span><span><a href = ""yahoo.com"" title=""Yahoo""><span class=""icon icon_none""></span></a></span>"); 

//Do something with LINQ 
var blueListItemsLinq = document.All.Where(m => m.LocalName == "a" && //stuck); 

cevap

4
orada AngleSharp neden HTML işaretlemesinde sorun oldu açı-parantez etrafında boşluklar yani hedef elemanı bulamayan gibi

görünüyor:

<span>< a href = ""bing.com"" title = ""Bing"" >< span class=""icon icon_none""> 

HTML'nin sabit olması, hem LINQ hem de CSS seçicinin hedef bağlantıyı başarıyla seçmesini sağlar:

var parser = new AngleSharp.Parser.Html.HtmlParser(); 
var document = parser.Parse(@"<span><a href=""google.com"" title=""Google""><span class=""icon icon_none""></span></a></span><span><a href = ""bing.com"" title = ""Bing""><span class=""icon icon_none""></span></a></span><span><a href = ""yahoo.com"" title=""Yahoo""><span class=""icon icon_none""></span></a></span>"); 

//LINQ example 
var blueListItemsLinq = document.All 
           .Where(m => m.LocalName == "a" && 
              m.GetAttribute("title") == "Bing" 
             ); 

//LINQ equivalent CSS selector example 
var blueListItemsCSS = document.QuerySelectorAll("a[title='Bing']"); 

//print href attributes value to console 
foreach (var item in blueListItemsCSS) 
{ 
    Console.WriteLine(item.GetAttribute("href")); 
}