pandasで3列目の同じ値のものをカウントしてマージ
$ cat count_station.py import pandas as pd import glob l1=glob.glob('./uniq_data*') (l1) #print l1 start=True for i in l1: i.strip() try: df=pd.read_csv(i,header=None) q1=df[4].value_counts() #print q1.keys() #print q1 #print type(q1) df2=pd.DataFrame([q1.keys(),q1]).T df2.columns=["station",i] print df2 #exit() if start==True: df3=df2; start=False else: df3=pd.merge(df3,df2,on="station",how="outer") finally: print "test" print df3 df3.to_csv("station_count.dat",index=False)