python的文件处理函数是open()

以下主要是关于这个函数的一些学习笔记

1、文件处理离不开编码

要注意的是文件打开时的编码和文件保存时的编码的统一,这样才能保证你打开的文件不会存在乱码

总结:创建文件、打开读取文件、写文件保存文件时的编码必须统一,否则可能存在乱码问题

 

2、操作文件时要有始有终

意思就是当你打开文件的时候,要记得关闭文件操作。否则会浪费系统的资源。

 

3、open函数(重点)

(1)、open的语法

open('文件路径','操作模式','编码')

例子:



new_file = open('newfile.txt','w',encoding='utf-8')  
#这里是以utf8编码,以写的模式打开文件newfile.txt,new_file为在系统中获得的文件句柄,只有获得了文件句柄才能操作文件
data = 'my test data'
new_file.write(data)
new_file.close()



(2)、open函数的文件操作模式

r模式:只读模式,是open函数的默认模式,如果不是特殊指定,默认以r模式打开。

w模式:只写模式,指定了此种模式的话文件只能写,不能读。

注意:如果只有w模式的话,打开文件的时候会清空文件内容重新开始写操作。如果文件不存在就创建

x模式:只写模式,只能写不能读,和w模式的区别就在,如果文件存在就报错,不存在会创建新文件

a模式:追加模式,指定此模式的话文件是以最佳的模式在文件最末尾开始写操作。

 

r+模式:读写模式,此模式下文件既可以读又可以写。

w+模式:写读模式,此模式下可以写也可以读,

注意的是,指定这种模式的话也会清空文件从新开始写。如果文件不存在就创建。

x+模式:写读模式

注意:和w+的区别就是,如果文件存在就报错,如果不存在就重新创建

a+模式:写读追加模式:

 

rb模式:以二进制的模式进行读文件操作

wb模式:以二进制的模式进行写操作

xb模式:以二进制的模式进行写操作

ab模式:以二进制的模式进行追加写操作

注意1:如果你写的代码存在跨平台的话,就要以二进制的模式进行读写操作。

注意2:如果要以二进制的模式进行读写操作,内容需要进行编码转换才便于直观的读写。

例子:



new_file = open('newfile1.txt','wb')
data = '这里我要写内容了,test data\n'
new_file.write(data.encode('utf-8'))
new_file.close()



(3)、文件内置方法flush

这里要清楚的一个概念是,文件的数据操作,都是在内存进行的,如果没有flush或者close的话,是不会落地到文件的。

例子:



import time
with open('newfile.txt','r+') as f:
    list = ['aaaaa\n','bbbbbb\n','ccccc\n','ddddd\n']
    for i in list:
        f.write(i)
        f.flush()
        time.sleep(2)



以上例子就可以看出效果每写一行,你在打开的文件刷新一下就能看到数据落地到文件。  

 

(4)、TextIOWrapper的相关方法



def close(self):  #保存和关闭文件
        """Flush and close this stream.

        :rtype: None
        """
        pass

    def fileno(self): # 返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作。
        """Return the underlying file descriptor (an integer) of the stream if
        it exists.

        :rtype: int
        """
        return 0

    def flush(self): # 将内存的数据刷新到文件里
        """Flush the write buffers of the stream if applicable.

        :rtype: None
        """
        pass

    def isatty(self): # 如果文件连接到一个终端设备返回 True,否则返回 False。
        """Return True if the stream is interactive (i.e., connected to a
        terminal/tty device).

        :rtype: bool
        """
        return False

    def readable(self): # 判断文件当前状态是否刻度
        """Return True if the stream can be read from.

        :rtype: bool
        """
        return False

    def readline(self, limit=-1): # 读取整行,包括‘\n’字符
        """Read and return one line from the stream.

        :type limit: numbers.Integral
        :rtype: unicode
        """
        pass

    def readlines(self, hint=-1): # 读取所有行,并以列表的形式返回
        """Read and return a list of lines from the stream.

        :type hint: numbers.Integral
        :rtype: list[unicode]
        """
        return []

    def seek(self, offset, whence=io.SEEK_SET): #获取当前光标所在的位置
        """Change the stream position to the given byte offset.

        :type offset: numbers.Integral
        :type whence: numbers.Integral
        :rtype: None
        """
        pass

    def seekable(self): # 是否可获取文件当前的位置
        """Return True if the stream supports random access.

        :rtype: bool
        """
        return False

    def tell(self): # 返回文件当前位置
        """Return the current stream position.

        :rtype: int
        """
        return 0

    def truncate(self, size=None): #截取文件,截取的字节通过死泽指定。默认为当前的文件位置
        """Resize the stream to the given size in bytes (or the current
        position if size is not specified).

        :type size: numbers.Integral | None
        :rtype: None
        """
        pass

    def writable(self): #文件当前状态是否可写
        """Return True if the stream supports writing.

        :rtype: bool
        """
        return False

    def writelines(self, lines): # 向文件写入一个序列字符串列表,如果需要换行则要加入每一行的换行符。
        """Write a list of lines to the stream.

        :type lines: collections.Iterable[unicode]
        :rtype: None
        """
        pass



 下面有关一个seek获取文件最后一行的操作例子:



with open('newfile.txt','rb+') as f:
    #for i in f:      #这里的for循环是可以拿掉的,如果文件很大最好加上这个for循环
        offs = -10    #设置一个偏移量
        while True:
            f.seek(offs,2)  # 通过偏移量从文件的末尾往前读文件,
            data = f.readlines() #将读到的文件以列表的形式返回
            if len(data) > 1: #大于1代表已经读取到了最后一行和倒数第二行的某几个字节,这样取列表最后一个元素就是文件的最后一行
                print("文件的最后一行:%s" %(data[-1].decode('utf-8')))
                break
            offs *= 2 #如果等于1 那就有可能偏移量太小而导致最后一行读不全。



  

4、让系统帮我们自动关闭文件句柄

这里就要用到with open('文件路径','操作模式') as f:

例子:

with open('newfile1.txt','rb+') as f:
    data = f.read()
    print(data.decode('utf-8'))