CSSセレクタ
http://weboook.blog22.fc2.com/blog-entry-268.html
Hpricot
http://route477.net/rubyscraping/?Hpricot%2FShowcase
HpricotとCSSセレクタ
http://route477.net/d/?date=20070205
require "rubygems" require "mechanize" require "hpricot" require "kconv" require "uri" $KCODE="u" text="日本電信電話" search=URI.encode(text.toutf8) URL="http://search.yahoo.co.jp/search?p="+search agent=Mechanize.new() page=agent.get(URL) qq=Hpricot(page.body) f=qq/"a[@href$='http://www.ntt.co.jp/']" puts f
出力例
<a href="http://www.ntt.co.jp/">NTT公式ホームページ</a>
CSSセレクタの意味:
@?
x[yyy='zzz']
x属性の属性値yyyがzzzのとく適用
a属性のhref属性がhttp://www.ntt.co.jp/のとき適応.
$後半一致