2010-10-15 23 views
5

Ben tuts bir sürü baktı ama this biri ben kontrolörNokogiri XML Ayrıştırma

def index 
     require 'nokogiri' 
     doc = Nokogiri::XML(open("http://sports.yahoo.com/top/rss.xml")) 

     @links = doc.xpath('//item').map do |i| 
     {'title' => i.xpath('title'), 'link' => i.xpath('link'), 'description' => i.xpath('description')} 
     end 
    end 

görünüm

<ul> 
    <%= debug @links.each.first %> 
</ul> 

ayıklama dışarı

koymak

duyuyorum beni görünüyor

{"title"=>[#<Nokogiri::XML::Element:0x8199ce34 name="title" children=[#<Nokogiri::XML::Text:0x8199c6f0 "Kolb to get start for Eagles vs. Falcons (AP)">]>], "description"=>[#<Nokogiri::XML::Element:0x8199b660 name="description" children=[#<Nokogiri::XML::Text:0x8199a594 "Kevin Kolb will make his second straight start in place of the injured Michael Vick when the Philadelphia Eagles host Atlanta on Sunday. Eagles coach Andy Reid says Vick practiced Friday for the first time since sustaining a rib cartilage injury on Oct. 3. There's a chance Vick will be the backup quarterback against his former team.">]>], "link"=>[#<Nokogiri::XML::Element:0x81999f40 name="link" children=[#<Nokogiri::XML::Text:0x81999b58 "http://us.rd.yahoo.com/sports/rss/top/SIG=11npql9k5/*http%3A//sports.yahoo.com/nfl/news?slug=ap-eagles-qbs">]>]}

İhtiyacım olan şey, bağlantı dizisini devretmek ve hash ile başlığa ve bağlantıya erişmek, ancak bunu nasıl yapacağımı bilmiyorum.

cevap

11

Doğru bir şekilde anlaşılıyorsa, yalnızca iç metni xpath düğümlerinden almanız gerekir.); -

{'title' => i.xpath('title').inner_text, 
'link' => i.xpath('link').inner_text, 
'description' => i.xpath('description').inner_text 
} 

.......

+0

:) o 'inner_text' için – s84

+0

sayesinde idi –