2012-09-05から1日間の記事一覧

日本の全上場企業名一覧?の取得 [csv、tab区切り]

日本の全上場企業名一覧?をcsvで取得(重複あり)。 http://www.jpubb.com/様を利用させていただいています。 get.rb require 'rubygems' require 'hpricot' require 'mechanize' require 'kconv' require 'uri' $KCODE="u" #exit(); str3="http://www.jpub…

:すべての要素

.:クラス名 not それ以外に puts (j.search("*:not(.nextprev)"));

[ruby]Hpricot スプレイピング 特定のクラス名以外の要素を検索

nextprevを含まない要素を検索

Hpricot スプレイピング 特定のクラス名以外の要素を検索

nextprevを含まない要素を検索

HpricotのCSSセレクタの注意 の検索:リンク内のタイトル検索

Hpricotでタイトルダグが"title=Last Page"で終わるリンクの取得 ポイントは[]のセレクタの前に「@」をつけること。 str3="http://www.jpubb.com/list/list.php?se="+market+"&pageID="+"1" tmp=agent.get(str3).body doc=Hpricot(tmp); j=((doc/"a[@title$=…