Rumah >pembangunan bahagian belakang >Tutorial Python >如何高效地获取文件行数

如何高效地获取文件行数

anonymityasal: 2019-05-25 10:46:022850semak imbas

简单的做法：

需要在python中获取大文件（数十万行）的行数。

def file_len(fname):
    with open(fname) as f:
        for i, l in enumerate(f):
            pass    return i + 1

有效的方法（缓冲区读取策略）：

首先看下运行的结果：

mapcount : 0.471799945831
simplecount : 0.634400033951
bufcount : 0.468800067902
opcount : 0.602999973297

因此，对于Windows/Python2.6来说，缓冲区读取策略似乎是最快的。

以下是代码：

from __future__ import with_statement
import time
import mmap
import random
from collections import defaultdict
def mapcount(filename):
    f = open(filename, "r+")
    buf = mmap.mmap(f.fileno(), 0)
    lines = 0
    readline = buf.readline
    while readline():
        lines += 1
    return lines
def simplecount(filename):
    lines = 0
    for line in open(filename):
        lines += 1
    return lines
def bufcount(filename):
    f = open(filename)                  
    lines = 0
    buf_size = 1024 * 1024
    read_f = f.read # loop optimization
    buf = read_f(buf_size)
    while buf:
        lines += buf.count(&#39;\n&#39;)
        buf = read_f(buf_size)
    return lines
def opcount(fname):
    with open(fname) as f:
        for i, l in enumerate(f):
            pass
    return i + 1
counts = defaultdict(list)
for i in range(5):
    for func in [mapcount, simplecount, bufcount, opcount]:
        start_time = time.time()
        assert func("big_file.txt") == 1209138
        counts[func].append(time.time() - start_time)
for key, vals in counts.items():
    print key.__name__, ":", sum(vals) / float(len(vals))

Atas ialah kandungan terperinci 如何高效地获取文件行数. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python windows

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：在PYTHON中如何从标准输入读取内容stdinArtikel seterusnya：如何填充0到数字字符串中保证统一长度

Artikel berkaitan

Lihat lagi