C++でユニコード文字列を扱う。　（この方法じゃぁだめだそうです）

c++ データ処理日本語

wstringというクラスを使う。代入の時にはL"xxx"とする。 cygwin ではwstringだとコンパイルできないので std::basic_stringとする．http://www.geocities.co.jp/bleis_tift/cpp/string.html http://others2.blog.so-net.ne.jp/2010-09-24 http://wisdom.sa…

2012-02-23

Rで対数軸の等高線。　

R データ処理

Rで対数軸の等高線。 matmat<-function(x,y,z,kugirix=27,kugiriy=27,add=F, plot=T,col=col2){ dimx<-exp(seq(min(log(x)),max(log(x)),length.out=kugirix)) dimy<-exp(seq(min(log(y)),max(log(y)),length.out=kugiriy)) mat1<-matrix(nrow=(kugirix-1),n…

2010-09-08

Rで2次元ヒストグラム

R データ処理

Rで2次元ヒストグラムを書く。 hist2db<-function(x,y,kugirix,kugiriy){ sx<-kugirix[1:(length(kugirix)-1)] sy<-kugiriy[1:(length(kugiriy)-1)] fx<-kugirix[2:(length(kugirix))] fy<-kugiriy[2:(length(kugiriy))] counts<-0 i1<-0 i2<-0 j1<-0 j2<-0 …

2010-05-08

一般の離散分布の従う乱数の発生させる方法

データ処理 R

エイリアス法は有限要素の離散分布を発生させる方法。一般の離散分布を発生できる。 http://amath.colorado.edu/courses/7400/2004fall/002/Web/SS-10.ppt二者択一法ともいう。(alias method)基本は、npが平均が１になる性質を利用すして、乱数を一様分布に…

2010-05-04

カセンエンジニアリング株式会社

データ処理ネットワーク cytoscape

カセンエンジニアリング株式会社

2010-04-18

　グラフの可視化cytoscapeの使用メモリー数を増やす

データ処理ネットワーク cytoscape

大規模ネットワークを扱う場合、 cytoscapeの使用メモリを増やす必要がある。 http://cydoc.sourceforge.jp/cydocwiki/index.php?%E6%9C%80%E5%A4%A7%E4%BD%BF%E7%94%A8%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%92%E5%A2%97%E3%82%84%E3%81%99%E3%81%AB%E3%81%AF%…

2010-04-16

pythonの辞書型（連想配列の）削除。

データ処理 python

pythonの辞書型（連想配列の）要素の削除の色々。 http://www.pythonweb.jp/tutorial/dictionary/index6.html基本 del a["xxx"] でキー"xxx"を持つ要素が消える。

2010-04-07

ログアウトしても scp による転送が終了しないようにする方法

データ処理 unix linux

ログアウトしても scp によるファイル転送が終了しないようにする方法。これはすばらしいです。 http://d.hatena.ne.jp/yohei-a/20100212/1265950974 （1）nohup scp user@xxx.ac.jp xxx xxx &はつけないのがポイント (2)パスワードを聞かれるので入力。 (3)…

2010-02-25

深さ優先探索DFS

データ処理

深さ優先探索 (1) 出発ノードを決める。 (2) 隣接しているノードを選び、そのノードに進む。一度到着したノードはそのことを記録しておく。 (3) (2)を進むノードがなくなるまで続ける。 (4) 進めるノードがなくなった場合、一つの根のノードに戻り、(2)-(3)…

2010-01-20

Rでカーネル密度推定

R データ処理

基本はdensity関数を使えばよい。細かい調整が必要な場合下のように実装できる。矩形カーネル #基本はこれでＯＫ． plot(density(data)) #カーネル関数 k<-function(x){ 0.5*(abs(x)<=1) } #刻み幅 h=0.1 #密度関数 f<-function(x,h,data){ X<-0 for(i in …

2010-01-07

ダブルコーテーションの中のカンマを取り除く2。

awk データ処理

ダブルコーテーションの中のカンマを取り除く。その２。前のsedのものだと,一つしか消せないというご指摘を受けたので、改定。 awkを使いすっきりさせた。 $ cat tmp 1,2,3,"abc,efg",5 1,2,3,"abc,efg",5 1,2,3,"abc,efg",5 1,2,3,"abc,efg",5 1,2,3,"ab…

2010-01-07

ダブルコーテーションの中のカンマを取り除く。

データ処理 sed

ダブルコーテーションの中のカンマを取り除く。 $ cat tmp 1,2,3,"abc,efg",5 1,2,3,"abc,efg",5 1,2,3,"abc,efg",5 1,2,3,"abc,efg",5 $ sed "s/\"$.*$,$.*$\"/\"\1\2\"/g" tmp 1,2,3,"abcefg",5 1,2,3,"abcefg",5 1,2,3,"abcefg",5 1,2,3,"abcefg",5 …

2009-12-19

　rubyでカタカナをひらがなに変換

ruby データ処理

jocodeが必要。 require 'jcode' str="アイウエオ" str2= str.tr("ァ-ン","ぁ-ん") puts str2 require 'jcode' a=File.open(ARGV[0]);a.each{|str| str=str.gsub (/lya/,"ャ") str=str.gsub (/lyu/,"ュ") str=str.gsub (/lyo/,"ョ") str=str.gsub (/lwa/,"ヮ…

2009-12-19

カタカナをアルファベットに変換２(修正版)

ruby データ処理

修正版：次のルールでカタカナをアルファベットに変換カタカナの「ニ」と漢字の「二」の違いに注意。また、アルファベット3文字を優先的に置換を行う。katakana.kana ャ,lya ュ,lyu ョ,lyo ヮ,lwa ッ,ltu ヴ,va ヵ,lka ヶ,lke ア,_a イ,_i ウ,_u エ,_e オ…

2009-11-07

リスト表示されたネットワークのノードのランダム置換。（２行ファイルの文字列の置換）

phyton データ処理

pythonで２行のランダムに文字列置き換える。これは、リスト表示されたネットワークのランダム置換に使用できる。 import random import sys import csv a1=[] a2=[] for row in csv.reader(file(sys.argv[1])): col1,col2=row a1.append(col1.strip("\n")) …

2009-11-07

　pythonで２列のcsvファイルの内容を連想配列に

phyton データ処理

pythonで２列のcsvファイルの内容を連想配列に次のcsvファイル連想配列に代入。 a,1 b,2 c,3 結果、連想配列は ch['a']=1 ch['b']=2 ch['c']=3 となる。コード import random import sys import csv #filename=sys.argv[1] a1=[] a2=[] for row in csv.reade…

2009-11-07

　pythonでデータのランダムシャッフル２

phyton データ処理

pythonでデータのランダムシャッフル２。連想配列に記録。 import random import sys import csv #filename=sys.argv[1] a1=[] a2=[] for row in csv.reader(file(sys.argv[1])): col1,col2=row a1.append(col1.strip("\n")) a2.append(col2.strip("\n")) a…

2009-11-07

　pythonの連想配列

phyton データ処理

pythonでの連想配列pythonでは辞書型という。 #中かっこで定義 a={} # key:value の形式で定義 b={'one':1,'two':2,'three':3} print b['one'],b['two'] # keyを外から与える。 d='four' b[d]=4 print b[d] 参考 http://docs.python.org/library/stdtypes.ht…

2009-11-07

python の便利なレファレンス

phyton データ処理 python

便利http://www.shido.info/py/python2.htmlzip(a,b)はa,bまとめて、イテレート（ループ）できる。>|python| for i,j in zip(a,b): print i,j|

2009-11-07

　pythonでcsvファイル読み取りランダムシャッフル

phyton データ処理

pythonでcsvデータを読み込み一行にしてランダムシャッフル。 import random import sys import csv #filename=sys.argv[1] a1=[] a2=[] for row in csv.reader(file(sys.argv[1])): col1,col2=row a1.append(col1) a2.append(col2) a=a1+a2 a=list(set(a))…

2009-11-07

■

phyton データ処理

pythonでuniq風。ただし、順番を保存しないので、注意。 a=list(set(a))

2009-11-07

　pythonでデータのランダムシャッフル

phyton データ処理

pythonでcsvファイルを読み込む。一つめのコマンド引数でファイルを指定 python test.py [filename] awk -F, '{print $1,$2}' [filename] とおなじ。test.py import random import sys import csv for row in csv.reader(file(sys.argv[1])): col1,col2=row…

2009-11-07

　pythonでデータのランダムシャッフル

phyton データ処理

pythonでデータのランダムシャッフル。入力ファイル 1 2 3 4 5 出力ファイル 1,3 2,4 3,2 4,1 5,5 コード： import random import sys file=sys.argv[1] #print file a=[] #ファイル読み込み for line in open(file,'r'): a.append(line.strip("\n")) #配列…

2009-10-21

カタカナをアルファベットに変換

sed データ処理 ruby awk

次のルールでカタカナをアルファベットに変換カタカナの「ニ」と漢字の「二」の違いに注意。katakana.kana ア,_a イ,_i ウ,_u エ,_e オ,_o カ,ka キ,ki ク,ku ケ,ke コ,ko サ,sa シ,si ス,su セ,se ソ,so タ,ta チ,ti ツ,tu テ,te ト,to ナ,na ニ,ni ヌ,nu…

2009-09-09

Rでポアソン分布の適合度検定

R データ処理

Rでポアソン分布の適合度検定 chisq.test(as.vector(table(b)),dpois(union(min(b),b),lambda=mean(b))) で大丈夫か？union(min(b),b)は与えられる数の重複する部分を切っているだけ。

2009-09-05

rubyによるネットワーク形式のファイルの併合(マージ)

ruby データ処理

２つのファイル（データファイルとネットワークファイルを）を一列目をキーに併合する。ネットワークファイルはリスト表現されている。イメージとしては、file1.csv 1, 44, a 2, 55, bb 3, 54, cd 4, 543, df 5, 53, ef file2.csv 1, 4 1, 5 2, 4 2, 3 …

2009-08-22

　stringクラスの便利なメソッド(rubyをsed風に使う) :tr_s

ruby データ処理

rubyの検出関数tr_sについて。sed的な置換ができる。置換 tr_s例）ダブルコーテーションの削除 str="\"abcdefg\"" puts tr_s(",","")

2009-08-22

　stringクラスの便利なメソッド（特定のパターンを検出、配列に格納） :scan

ruby データ処理

rubyの検出関数scanについて。検出 scan例）ダブルコーテーション囲まれた、数字データと日付データ[1996-2-12]形式の検出。検出された順に配列に格納される。fdaf="123" fdkkak="1996-2-11" fdafad="42"ならば、 a=["123","1996-2-11","42"] と格納される…

2009-08-11

Bsh：whlieループでファイルを読み込む

unix cygwin データ処理データ解析

bshでは、whileループで一行づつファイルを読み込みながら処理できる。書式while read LINE do処理 [例：echo $LINE]done 実際の実装: while read LINE do str=`echo $LINE | awk '{print $1}'` str2=`echo $LINE | awk '{print $2}'` kigyoumei=`grep $st…