Home >Backend Development >Python Tutorial >Detailed introduction to file operations based on python files

Detailed introduction to file operations based on python files

高洛峰
高洛峰Original
2017-03-28 16:58:091639browse

    在之前学习了python的列表、元组、集合等知识,接下来将python的文件相关的知识做一总结和分析。

一 open函数

 在我们用word、excel、vim对文件操作时,肯定要先打开文件,同样在编程里面也是需要将文件打开,然后再对文件操作,操作完对文件进行关闭。文件打开使用open()函数,同时创建一个相关的对象

、基本语法:

open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)
参数介绍:
file:表示文件名,可以使用绝对路径和相对路径,还有可以根据mode方式决定文件的追加或者覆盖
mode:表示打开文件的模式
buffering:设置缓存模式。0表示不缓存,1表示缓存;如果大于1则表示缓冲区的大小,以字节为单位。
encoding:表示打开文件的编码格式
errors:参数errors是用来指明编码和解码错误时怎么样处理。不能在二进制的模式下使用。
1)当指明为’strict’时,编码出错则抛出异常ValueError。
2)当指明为’ignore’时,忽略错误。
3)当指明为’replace’时,使用某字符进行替代模式,比如使用’?’来替换出错的。
4)其它相应还有surrogateescape/xmlcharrefreplacs/backslashreplace。
 
newline:
参数newline是用来控制文本模式之下,一行的结束字符。可以是None,’’,\n,\r,\r\n等。
当在读取模式下,如果新行符为None,那么就作为通用换行符模式工作,意思就是说当遇到\n,
\r或\r\n都可以作为换行标识,并且统一转换为\n作为文本输入的换行符。当设置为空’’时,
也是通用换行符模式工作,但不作转换为\n,输入什么样的,就保持原样全输入。当设置为其它相应
字符时,就会判断到相应的字符作为换行符,并保持原样输入到文本。
当在输出模式时,如果新行符为None,那么所有输出文本都是采用\n作为换行符。如果设置为’’
或者\n时,不作任何的替换动作。如果是其它字符,会在字符后面添加\n作为换行符。
 
closefd:是用来当给一个文件句柄传进来时,而当退出文件使用时,而不对文件句柄进行关闭。如果传
递一个文件名进来,这个参数无效,必定为True方式。

关于上面提到的mode模式种类比较多,我们做以下相关介绍和总结,

Detailed introduction to file operations based on python files

二进制在我们处理图像等信息时使用比较多,而其他部分在我们操作字符串等内容比较多。

简单的示例:

示例文件内容:
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
可你却总是笑我 一无所有
为何你总笑个没够 为何我总要追求
难道在你面前 我永远是一无所有
 
Process finished with exit code 0
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding='utf-8')
readline=a_File.read()
print(readline)
结果:
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
可你却总是笑我 一无所有
为何你总笑个没够 为何我总要追求
难道在你面前 我永远是一无所有
 
上面使用的r模式打开,我们采取尝试写入文件,写入内容为字符串openstack\nMYSQLDBA
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding='utf-8')
readline=a_File.read()
print(readline)
a_File.write("openstack\nMYSQLDBA")
a_File.close()
结果:文件不可写
Traceback (most recent call last):
  File "D:/project/myapp/hello.py", line 6, in <module>
    a_File.write("openstack\nMYSQLDBA")
io.UnsupportedOperation: not writable
我们再尝试用二进制方式打开文件查看内容:
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","rb") #去掉了编码格式
readline=a_File.read() 
print(readline)
#a_File.write("openstack\nMYSQLDBA")
a_File.close()
结果:
b&#39;\xe6\x88\x91\xe6\x9b\xbe\xe7\xbb\x8f\xe9\x97\xae\xe4\xb8\xaa\xe4\xb8\x8d\xe4\xbc\x91 \xe4\xbd\xa0\xe4\xbd\x95\xe
  
 其他内容繁多,因此不再演示其他的mode模式

在研究完我们如何将文件打开后,我们就要考虑如何处理打开的文件,主要涉及到文件对象的一些方法。

Detailed introduction to file operations based on python files

 下面根据不同的方法做简单介绍以及相关示例

读操作:读的有file.read()  filereadline()  filereadlies()等三种方法

1、file.read()方法

里面的参数是size,表示从文件中读取size大小字节,当默认为空或者为负值时表示读取所有的字节,

示例:

#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
 
print("测试结果1".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
 
print(a_File.read(-1))
结果:
###############################################测试结果1################################################
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
 
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
 
print("测试结果2".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.read())
结果:
###############################################测试结果2################################################
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑我 一无所有
噢 你何时跟我走
噢 你何时跟我走
脚下的地在走 身边的水在流
 
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
print("测试结果3".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.read(3))
结果:
###############################################测试结果3################################################
我曾经
 
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
print("测试结果4".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.read(15))
结果:
###############################################测试结果4################################################
我曾经问个不休 你何时跟我走

可以发现read方法是受字节数量控制的,字节数量的控制影响其输出

2、readline()方法

    读取整行包括”\n”换行,参数也是[size]控制,其和read()的区别就是当readline()某行中的字符不够时,只读取改行,而read()会读取其他行的内容。

示例(两者的区别)

#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
print("测试结果1".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.read(50))
 
print("测试结果2".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
 
print(a_File.readline(100))
结果:
###############################################测试结果1################################################
我曾经问个不休 你何时跟我走
可你却总是笑我 一无所有
我要给你我的追求 还有我的自由
可你却总是笑
###############################################测试结果2################################################
我 一无所有

readline()方法默认值和负值的相关示例

#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
print("测试结果1".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.readline())
print("测试结果2".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.readline(-1))
print("测试结果3".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.readline(4))
print("测试结果4".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.readline(10))
 
结果:
###############################################测试结果1################################################
我曾经问个不休 你何时跟我走
 
###############################################测试结果2################################################
可你却总是笑我 一无所有
 
###############################################测试结果3################################################
我要给你
###############################################测试结果4################################################
我的追求 还有我的自

3、readlines()取文件里的所有行并返回列表,若sizeint>0返回总行约为sizeint字节的行,实际读取的值可能比sizeint较大,因为需要缓冲区。则读取指定长度的字节, 并且将这些字节按行分割。

例如:

#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
print("测试结果1".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.readlines(14))
 
###############################################测试结果1################################################
[&#39;我曾经问个不休 你何时跟我走\n&#39;]
 
#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile.txt","r",encoding=&#39;utf-8&#39;)
#readline=a_File.read(1)
print("测试结果1".center(100,&#39;#&#39;)) #为了更好的展现测试结果分割
print(a_File.readlines(14))
[&#39;我曾经问个不休 你何时跟我走\n&#39;, &#39;可你却总是笑我 一无所有\n&#39;]
 
当我们设置sizeint值大于行中的字符时才能显示其他行的内容

4、file.close()

    关闭文件 关闭文件后不能再进行读写操作文件对象的close()方法刷新未写入的信息,并关闭该文件的对象,在这之后没有数据内容可以执行写入。

    Python自动关闭,当文件的引用对象被重新分配给另外一个文件。它是使用close()方法来关闭文件是一个很好的做法。

#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile2.txt","w+")
#readline=a_File.read(1)
a_File.write("winnerlookopenatck")
a_File.close()
将文件写入
写入内容:
winnerlookopenatck

5、flie.write()

write()方法写入字符串到任何一个打开的文件。要注意的是Python字符串可以具有二进制数据,而不仅仅是文字。

write()方法不要将换行字符(' ')添加到字符串的结尾。在文件关闭前或缓冲区刷新前,字符串内容存储在缓冲区中,这时你在文件中是看不到写入的内容。

例如:

#!/usr/bin/env python
#_*_coding:utf-8_*_
a_File=open("D:\\pythonfile2.txt","w+")
#readline=a_File.read(1)
a_File.write("winnerlookopenatck")
a_File.close()

6、file.writelines()

file.writelines()方法用于向文件中写入一序列的字符串。这一序列字符串可以是由迭代对象产生的,如一个字符串列表。换行需要制定换行符 \n。

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]#定义列表
 
a_File=open("D:\\pythonfile2.txt","w+")
#readline=a_File.read(1)
a_File.writelines(sed)
a_File.close()
结果:
openstack: 1
docker 2
mysqlDBA 3
KVM 4

7、file.flush()

flush() 方法是用来刷新缓冲区的,即将缓冲区中的数据立刻写入文件,同时清空缓冲区,不需要是被动的等待输出缓冲区写入。

一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。没有返回值

例如

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]
 
a_File=open("D:\\pythonfile2.txt","w+")
#readline=a_File.read(1)
a_File.writelines(sed)
a_File.flush()
a_File.close()

8、file.next()

       next() 方法在文件使用迭代器时会使用到,在循环中,next()方法会在每次循环中调用,该方法返回文件的下一行,如果到达结尾(EOF),则触发 StopIteration

示例:

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]
 
aFile=open("D:\\pythonfile2.txt","w+")
for index  in  range(3):
    line = next(aFile)
    print("第%d行-%s" % (index,line))

9、file.tell()

 file.tell()方法返回文件的当前位置,即文件指针当前位置。

语法:

fileObject.tell(offset[, whence])

  

返回值当前文件指针

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]
 
aFile=open("D:\\pythonfile.txt","r",encoding="utf-8")
 
print(aFile.readline(30))
print(aFile.tell())
 
我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾
86
 
#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]
 
aFile=open("D:\\pythonfile.txt","r",encoding="utf-8")
 
print(aFile.readline())
print(aFile.tell())
 
我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走我曾经问个不休 你何时跟我走
 
162

10、file.isatty()

       file.isatty()方法检测文件是否连接到一个终端设备,如果是返回 True,否则返回 False

用法:

fileObject.isatty()

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]

aFile=open("D:\\pythonfile.txt","r",encoding="utf-8")
print(aFile.isatty()) 
False

11、file.seek()

seek() 方法用于移动文件读取指针到指定位置,没有返回值

seek() 方法语法如下:

fileObject.seek(offset[, whence])

offset -- 开始的偏移量,也就是代表需要移动偏移的字节数

whence:可选,默认值为 0。给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]
 
aFile=open("D:\\pythonfile.txt","r",encoding="utf-8")
print(aFile.readline(10))
print(aFile.readline(10))
aFile.seek(0,0)#设置起始位置为0 
print(aFile.readline(10))
结果:
我曾经问个不休 你何
时跟我走我曾经问个不
我曾经问个不休 你何
 
总结打印完第一行后,下次打印从上次的位置接上,而重新设置其位置后在开始位置打印

12、file.fileno()

方法返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作。返回值为一个文件描述符:

#!/usr/bin/env python
#_*_coding:utf-8_*_
sed=["openstack: 1\n","docker 2\n","mysqlDBA 3\n","KVM 4\n"]
 
aFile=open("D:\\pythonfile.txt","r",encoding="utf-8")
print(aFile.fileno())
 
结果:
3

13、file.truncate()

truncate() 方法用于截断文件,如果指定了可选参数 size,则表示截断文件为 size 个字符。 如果没有指定 size,则从当前位置起截断;截断之后 size 后面的所有字符被删除

truncate() 方法语法如下:

fileObject.truncate( [ size ])
参数

The above is the detailed content of Detailed introduction to file operations based on python files. For more information, please follow other related articles on the PHP Chinese website!

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn