すごく原始的だけど。。
rubyで食べたいの前にくるの単語を抽出
# -*- coding: Utf-8 -*- require 'MeCab' m=MeCab::Tagger.new() text1="おはよう.うさぎを食べたい" node=m.parseToNode(text1) # node=node.next #node=node.next.next strold1="" strold2="" flg=true while node.next!=nil and flg do node=node.next str=node.feature.split(",")[6].chomp.strip str=str.encode("UTF-8","UTF-8").strip; if str == "食べる" then if strold1 == "を" then puts strold2 flg=false end end strold2=strold1 strold1=str #puts str end exit
元ファイル
日付,ID1,ID2,,,イヌを食べたい。
日付,ID1,ID2,,,吾輩はネコである。ネコを食べたい。
....
タブ区切り
改行はNNEEWWLLIINNEEで区切られる。