CSSセレクタとhpricotのWeb切り出し

CSSセレクタ
http://weboook.blog22.fc2.com/blog-entry-268.html
Hpricot
http://route477.net/rubyscraping/?Hpricot%2FShowcase
HpricotとCSSセレクタ
http://route477.net/d/?date=20070205

require "rubygems"
require "mechanize"
require "hpricot"
require "kconv"
require "uri"
$KCODE="u"

text="日本電信電話"
search=URI.encode(text.toutf8)

URL="http://search.yahoo.co.jp/search?p="+search

agent=Mechanize.new()
page=agent.get(URL)

qq=Hpricot(page.body)
f=qq/"a[@href$='http://www.ntt.co.jp/']"
puts f

出力例

<a href="http://www.ntt.co.jp/">NTT公式ホームページ</a>

CSSセレクタの意味:
@?
x[yyy='zzz']
x属性の属性値yyyがzzzのとく適用
a属性のhref属性がhttp://www.ntt.co.jp/のとき適応.
$後半一致