Python说明文件:https://docs.python.org/2/library/functions.html#open

open(name[, mode[, buffering]])

上面的文档说:“可选的缓冲数指定文件所需的缓冲区大小:0表示未缓冲,1表示行缓冲,任何其他正值表示使用(大约)该大小(以字节为单位)的缓冲区。负缓冲表示使用系统默认值。如果省略,则使用系统默认值。”。

当我使用

filedata = open(file.txt,"r",0)

要么

filedata = open(file.txt,"r",1)

要么

filedata = open(file.txt,"r",2)

要么

filedata = open(file.txt,"r",-1)

要么

filedata = open(file.txt,"r")

输出没有变化。上面显示的每一行以相同的速度打印。

输出:

豆先生是15部25-

罗宾·德里斯科尔(Robin Driscoll)撰写并由罗文·阿特金森(Rowan Atkinson)主演的分钟录像

标题字符。罗宾还写了不同的剧集

Driscoll和Richard Curtis,以及Ben Elton的一位。的十三

节目是1990年1月1日在ITV播出的,

直到

1995年10月31日,“晚安豆先生”。

豆先生”于1995年12月15日播出,还有一集“头发

通过

伦敦的Bean先生”,直到2006年才播出

尼克。

那么open()函数中的buffering数如何有用?什么

最好使用哪个缓冲数?

考方案

启用缓冲意味着您不直接与操作系统的文件表示或文件系统API交互。取而代之的是,将大量数据从原始OS文件流读取到缓冲区中,直到被消耗为止,这时将有更多数据被提取到缓冲区中。就获得的对象而言,您将获得一个BufferedIOBase对象,该对象包装了底层RawIOBase(代表原始文件流)。

这有什么好处?与原始流进行良好的接口可能会导致较高的延迟,因为操作系统必须摆弄诸如硬盘之类的物理对象,并且在所有情况下这都是不可接受的。假设您想每5毫秒从文件中读取三个字母,并且文件位于硬壳旧硬盘甚至网络文件系统上。与其尝试每5毫秒从原始文件流中读取数据,不如将文件中的一堆字节载到内存中的缓冲区中,然后随意使用它。

选择什么大小的缓冲区将取决于您如何使用数据。对于上面的示例,缓冲区大小为1个字符将是非常糟糕的,3个字符将是可以的,并且3个字符的任何大倍数都不会对用户造成明显的延迟将是理想的。