2015-07-03から1日間の記事一覧

CSVやTSVファイルをhtmlに変換するワンライナーとHTMLによる表データの・グラフ化・可視化

◆ワンライナー シェル芸 input.csv: タブ区切りのテーブル cat input.csv | ruby -F"\t" -ane 'BEGIN{puts "<table>"}; puts "<tr>";print $F.map{|i| "<td>"+i.to_s+"</td>"}.join("");puts "</tr>";END{puts "</table>"}' > tmp1.html ◆可視化 入力ファイル tmp2 例: A,2013-01-01,3,4,5,6,…

mecabの未知語処理

mecabの未知語処理 まず、http://www.mwsoft.jp/programming/munou/mecab_nitteretou.html でmecabのコスト計算のしくみを学習.コスト -単語の生成コスト+周りとのつながりのコスト -> 小さいルートを選ぶ. mecabの未知語処理 未知語処理は辞書をつかう ht…