历代文学网 历代文学
收录来自古今中外 20 多个朝代,近 60个 国家的作者超 3万 人,诗词曲赋、文言文等作品数近 60万 个,名句超 10万 条,著作超 2万 部。

Python实战-从菜鸟到大牛的进阶之路 作者:极客学院 近现代)

章节目录树

5 python 计算文件的行数和读取某一行内容的实现方法

上一章 下一章

二、读取文件某一行的内容(测试过 1 G 大小的文件,效率还可以)

import linecachecount = linecache.getline(filename,linenum)  

三、用 linecache 读取文件内容(测试过 1 G 大小的文件,效率还可以)

count = len(open(filepath,'rU').readlines)  

str 为列表形式,每一行为列表中的一个元素

最简单的办法是把文件读入一个大的列表中,然后统计列表的长度.如果文件的路径是以参数的形式filepath传递的,那么只用一行代码就可以完成我们的需求了:

str = linecache.getlines(filename)  

一、计算文件的行数

如果是非常大的文件,上面的方法可能很慢,甚至失效.此时,可以使用循环来处理:

count = 0thefile = open(thefilepath, 'rb')while True:    buffer = thefile.read(8192*1024)    if not buffer:break    count += buffer.count('\n')thefile.close( )  

另外一种处理大文件比较快的方法是统计文件中换行符的个数 '\n '(或者包含 '\n' 的字串,如在 windows 系统中):

参数 'rb' 是必须的,否则在 windows 系统上,上面的代码会非常慢.

linecache 是专门支持读取大文件,而且支持行式读取的函数库。 linecache 预先把文件读入缓存起来,后面如果你访问该文件的话就不再从硬盘读取

count = -1for count, line in enumerate(open(thefilepath, 'rU')):    passcount += 1  

上一章 下一章