gemini API を wsl2で使う

linux python

gemini API を wsl2で使う APIのキーの取得 google ai からAPIキーをもらってくる。準備 Python を 3.11 にする。pipも更新する。Python 8 系が入っていたので。ライブラリのインストール pip3 install google-generativeai コード safty-settingはヘイト…

2024-10-18

Wikipediaのダンプデータからタイトルを指定して記事を取り出す。

Python

本記事の参考ぺージ Wikipediaのダンプからページを取り出す #Python - Qiita ダンプデータについて Wikpediaのダンプ記事データにはindexとデータ本体の２種類がある。 indexを活用するとbz2ファイルを解凍せずに高速に記事にアクセスできる indexデータ: j…

2018-10-29

pythonのpandasでEXELファイルのCSV化

python

https://note.nkmk.me/python-pandas-read-excel/ https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

2018-10-29

[R]pythonのpandasでEXELファイルのCSV化

python

https://note.nkmk.me/python-pandas-read-excel/ https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

2018-10-29

pythonのpandasでEXELファイルのCSV化

python

https://note.nkmk.me/python-pandas-read-excel/ https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

2018-10-29

pythonのpandasでEXELファイルのCSV化

python

https://note.nkmk.me/python-pandas-read-excel/ https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

2018-10-26

Windows8 のcygwinにpandas をいれる

python cygwin

まず、setup.exeで python3-pip や python2-pipをインストールしておく pip で最初は失敗したが、rebaseallでできるようになった。 pip3 install --upgrade pip python3 -m pip install pandas

2018-02-01

pythonでEXCELファイルを操作()

python

pythonでEXCELファイルを操作 http://www.lisz-works.com/entry/openpyxl-basic を参考にインストール pip install openpyxl 新しいファイルを開いてセルA1にhelloと書いて閉じる import openpyxl as px #openFile wb=px.Workbook() #Making sheet ws=wb.cr…

2017-10-09

google trend データの収集

python データ解析

（１）python を導入参考：https://qiita.com/yuta_h3/items/2988c4d0811bf8c344c0 git clone git://github.com/yyuu/pyenv.git ~/.pyenv ~/.bash_profile に以下を書きこむ export PYENV_ROOT="${HOME}/.pyenv" if [ -d "${PYENV_ROOT}" ]; then export PA…

2016-05-12

pandas pythonでデータをグループわけして記述統計を調べて外部ファイルでソートして出力するワンライナー

python pandas

pandas pythonでデータをグループわけして記述統計を調べて外部ファイルでソートして出力するワンライナー並び順の指定なし入力 python -c "import pandas as pd;df2=pd.read_csv('a3.txt',names=['st','fee']);print df2.groupby('st').describe().unstac…

2016-05-11

２つのファイルを併合するワンライナー（pandas利用）

ワンライーナデータ解析 python

２つのファイルを併合するワンライナー（pandas利用） python -c "import pandas as pd;df=pd.read_csv('a1.txt',names=['id','st']);df2=pd.read_csv('a2.txt',names=['st','count']);print pd.merge(df,df2,on='st');" 入力 $ cat a1.txt 1,タヌキ 2,キツ…

2016-03-30

pythonのpandasでデータ解析、カテゴリーごとに和をとる. tapply

python pandas

groupbyを使う. ２列目を４列目で場合ごとに平均 ll0=df2,4.groupby(4).mean()$ #そのほか ll1=df6,4.groupby(4).mean()$ ll1=df6,4.groupby(4).median()$ ll1=df6,4.groupby(4).describe()$ 参考： pandasにsqlでよくやる処理をやらせてみる http://www.mws…

2016-03-25

pandasで複数ファイルの３列目の同じ値のものをカウントしてマージ

python pandas データ解析

pandasで３列目の同じ値のものをカウントしてマージ $ cat count_station.py import pandas as pd import glob l1=glob.glob('./uniq_data*') (l1) #print l1 start=True for i in l1: i.strip() try: df=pd.read_csv(i,header=None) q1=df[4].value_counts(…

2016-03-10

pythonのpandasで離散化、ビニング、ビンに区切り集計

python pandas データ解析

離散化、ビンに切って、ビニングして、カテゴリごとに集計 xはデータフレーム x[0]で１列目をとりだしている． qcutはデータ数をあわせる分割, cutは均等割り． x[0]として、pd.Seres化することに注意 x0だと、DataFrame。 cats=pd.qcut(x[0],30) print cats…

2016-03-09

pandasでInfとnanをで埋める．

pandas python データ解析

pandasでInfとnanを平均で埋める． In [416]: b Out[416]: a c 0 1.000000 3 1 2.000000 4 2 3.000000 NaN 3 inf 5 In [415]: b.replace(np.inf,np.nan).fillna(b.replace(np.inf,np.nan).mean()) Out[415]: a c 0 1 3 1 2 4 2 3 4 3 2 5

2016-02-28

sympyで数列の和を計算

python

インストール pip install sympy例： sympyで数列の和を計算して，因数分解コード calc.py from sympy import * i,N=symbols('i N',integer=True) a=summation(i**2,(i,1,N)) print a b=factor(a) print b 実行 $ python calc.py 出力 N**3/3 + N**2/2 + N/…

2016-01-27

BeautifulSoupでhtmlをパーズ

python

（１）とりあえずのリンク抽出 http://www.crummy.com/software/BeautifulSoup/bs4/doc/ from bs4 import BeautifulSoup soup=BeautifulSoup(open("index.html")) #title print(soup.title.string) v=(soup.find_all('a')) for i in v: print(i['href']) （…

2015-07-30

pythonのscikit-lern で疎行列の標準化

python

プログラム参考： http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.normalize.html $ cat normal_test.py from scipy.sparse import lil_matrix, csr_matrix from sklearn.preprocessing import normalize a=lil_matrix((20000,20…

2015-07-10

scikit-learnのcygwin、windows8への導入

cygwin 機械学習 python

scikit-learnのcygwin、windows8への導入昔は難しかったみたいだけど、今は簡単になったのかも。 (1)cygwinのsetup.exe等でnumpy,python,easy_install、gcc, gcc-fortran など必要そうなものをいれておく． (2) easy_install pip (3) pip install scipy (4)…

2015-05-14

mecabをpythonから使う

mecab python

curl -O https://mecab.googlecode.com/files/mecab-python-0.98.tar.gz gzip -d mecab-python-0.98.tar.gz tar -xvf mecab-python-0.98.tar.gz

2010-11-28

有向きコンフィグレーションモデル

python

有向きコンフィグレーションモデル import networkx as nx import random as ran #in1=[3,3,3,3,3] #out1=[3,3,3,3,3] def f(x): return int(ran.random()**(-1.0/3.0)) in1=map(f,range(10000)); out1=[] out1[:]=in1[:]; G=nx.directed_configuration_mode…

2010-09-16

無向グラフからループの取り出し

python network

無向グラフからループの取り出し import networkx as nx G=nx.read_edgelist("test.net",create_using=nx.Graph()) j=nx.cycle_basis(G,'1') print j test.net 1 2 2 3 3 1 1 5 5 4 4 1 1 6

2010-09-13

python で有向ネットワークの三角形の取り出し。

python network

python で有向ネットワークの三角形の取り出し。test.net 1 2 2 3 3 1 1 5 5 1 import networkx as nx G=nx.read_edgelist("test.net",create_using=nx.DiGraph()); for i in G.nodes(): outs=G.successors(i); ins=G.predecessors(i); for j in outs: for k…

2010-04-16

pythonの辞書型（連想配列の）イテレータのまとめ。

python データ整理

pythonの辞書型（連想配列、ハッシュ型）イテレータのまとめ。 a[キー]=バリュー。キーでイテレート a={} a["a"]=1; a["c"]=2; for i in a.keys(): print i; 値（バリュー）でイテレート a={} a["a"]=1; a["c"]=2; for i in a.values(): print i; 値（バリ…

2010-04-16

pythonの辞書型（連想配列の）削除。

データ処理 python

pythonの辞書型（連想配列の）要素の削除の色々。 http://www.pythonweb.jp/tutorial/dictionary/index6.html基本 del a["xxx"] でキー"xxx"を持つ要素が消える。

2009-11-12

123

python

j=sorted(range(len(a)),lambda x,y:a[x]-a[y]) map(lambda x:b[x],j) map(lambda x:b[x],sorted(range(len(a)),lambda x,y:a[x]-a[y])) map(lambda x:b[x],filter(lambda x:a[x]==5,range(len(a))))

2009-11-09

pythonで計算を速くする

python

http://psyco.sourceforge.net/ http://tanopy.blog79.fc2.com/blog-entry-3.html

2009-11-07

pythonで一列目の共通するもの数を数える。

python

pythonで一列目の共通するもの数を数える。いわゆる uniq -c とおなじ。 import random import sys import csv a1={} for row in csv.reader(file(sys.argv[1]),delimiter=" "): col1,col2=row col1=col1.strip("\n"); if (col1 in a1): a1[col1]=a1[col1]+1…

2009-11-07

python の便利なレファレンス

phyton データ処理 python

便利http://www.shido.info/py/python2.htmlzip(a,b)はa,bまとめて、イテレート（ループ）できる。>|python| for i,j in zip(a,b): print i,j|

2009-10-17

pythonからRを使う。環境準備編。Rpy2[未完成]

R python

pythonからRを使う。環境準備。 rpy2を利用する。 cygwin上で利用する。 Rpy2を http://rpy.sourceforge.net/index.html Rpy2を http://pypi.python.org/pypi/rpy2/ からrpy2-2.0.7.tar.gz をダウンロード。展開： gzip -d rpy2-2.0.7.tar.gz tar -xvf rpy2-…