table=pd.read_table(path+&#39;kuaishou.txt&#39;,sep=&#39;t&#39;,chunksize=1000000)
for df in table:
    对df处理
    #如df.drop(columns=[&#39;page&#39;,&#39;video_id&#39;],axis=1,inplace=True)
    #print(type(df),df.shape)打印看一下信息

我这里又对文件进行了划分，分成若干个子文件分别处理（没错，to_csv也同样有chunksize参数）

2、指定iterator=True

iterator=True同样返回的是TextFileReader对象

reader = pd.read_table(&#39;tmp.sv&#39;, sep=&#39;t&#39;, iterator=True)
df=reader.get_chunk(10000)
#通过get_chunk(size)，返回一个size行的块
#接着同样可以对df处理

直接看看pandas文档在这一方面的内容吧。

声明：本文转载于：csdn，如有侵犯，请联系admin@php.cn删除

上一条：带你理解golang mysql数据库连接池下一条：一个golang常见库cobra

查看更多

golang怎么高效处理大文件

使用Pandas分块处理大文件

1、指定chunksize分块读取文件

2、指定iterator=True

相关文章

最新文章

￥198