搜索

首页  >  问答  >  正文

python 读取csv文件中某一段月份中的数据?

这是问题:Find out how much time and over how many separate days did R.Lennon work on administering the Jira Server between August and September.

csv里是这样的

我才开始学习timeseries部分,大概逻辑有了,但是不知道怎么用代码表达。请大神帮忙提一点建议,谢谢!

迷茫迷茫2824 天前1023

全部回复(2)我来回复

  • 怪我咯

    怪我咯2017-04-18 10:18:45

    使用re.split拆分Date字段

    import csv,re
    
    with open('xxx.csv','rb') as rf:
        reader = csv.reader(rf)
        with open('xxx_new.csv','wb') as wf:
            writer = csv.writer(wf)
            headers = reader.next()
            writer.writerow(headers)
            for row in reader:
                t = re.split('\W+',row[1])  
                # row[1]为Date字段,被拆为['1', '11', '2016', '14', '17']
                if int(t[1]) == 11:  # 假设你想要11月数据
                    writer.writerow(row)

    回复
    0
  • 阿神

    阿神2017-04-18 10:18:45

    你说timeseries,是用pandas么?
    如果是pandas,其实还是蛮简单的。假设datefrmae的名字是df
    首先确保Date那列转换为DatetimeIndex,这个可以用df['newdate']=pd.DatetimeIndex(df['date'])完成
    然后就是筛选了df[df['newdate'].dt.month==9]就能筛选出所有9月的数据了,

    回复
    0
  • 取消回复