파이썬 튜토리얼

Python에서 파일 작업 가져오기

coldplay.xixi

Nov 09, 2020 pm 05:36 PM

python파일 작업

Python 동영상 튜토리얼 칼럼에서는 관련 파일 작업을 소개합니다.

Python에서 파일 작업 가져오기

어떤 언어도 파일의 동작과 분리될 수 없는데, 파이썬 언어는 어떻게 파일을 동작하고 관리하는지 알아보세요.

인코딩 방법

인코딩 방법의 역사는 대략 ASCII ->gb2312->unicode->utf 입니다. - 8, 이 기간 동안의 자세한 내용은 BaiduASCII ->gb2312->unicode->utf-8，期间具体详细信息可以百度

来个编码解码的小例子先，记住中文可以进行GBK和utf-8编码，在GBk一个中文字符对应两个字节，在utf-8一个中文字符对应三个字节，中文不能进行ASCII编码。

>>> '刘润森'.encode('GBK')
b'\xc1\xf5\xc8\xf3\xc9\xad'
>>> '刘润森'.encode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
>>> 'Runsen'.encode('ascii')
b'Runsen'
>>> "刘润森".encode('utf-8')
b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae'
>>> '刘润森'.encode('GBK').decode('GBK')
'刘润森'
>>> '刘润森'.encode('GBK').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte复制代码</module></stdin>

如果编码解码格式不一致可能会出现乱码，encode表示编码，decode表示解码。

文件操作的API

下面是Python文件操作的具体的API。

方法	含义
open	打开
read	读取
write	写入
close	关闭
readline	单行读取
readlines	多行读取
seek	文件指针操作
tell	读取当前指针位置

打开文件

Python的open()函数打开一个文件时，有若干个参数可用。然而，最常用的参数只有前两个。

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

를 참조하세요. 인코딩 및 디코딩의 작은 예를 들어 보겠습니다. 중국어는 GBK 및 utf로 인코딩할 수 있다는 점을 기억하세요. -8. GBk utf-8에서 한자는 3바이트에 해당합니다. /code> 인코딩되었습니다.

f=open('test.txt',encoding='utf-8')   #打开文件
data=f.read()  #读取文件
print(data)
f.close() #关闭文件         
复制代码

인코딩 형식과 디코딩 형식이 일치하지 않으면 잘못된 문자가 나타날 수 있습니다. 인코딩은 인코딩을 의미하고 디코딩은 디코딩을 의미합니다.

파일 작업 API

다음은 Python 파일 작업 전용 API입니다.

open(file, mode='r', buffering=-1, 인코딩=None, 오류=None, newline=None, closefd=True, opener=None)

关注《Python之王》公众号
作者：Runsen复制代码

mode

방법		의미
open
열기
	읽기		읽기
write		write		close
닫기
	readline		한 줄 읽기
readlines		여러 줄 읽기		seek
파일 포인터 작업
	tell		현재 포인터 위치 읽기
파일 열기	Python의 `open()` 함수에는 파일을 열 때 사용할 수 있는 여러 매개변수가 있습니다. 그러나 처음 두 매개변수만 가장 일반적으로 사용됩니다.
참고, 첫 번째 필수사항이고 나머지는 선택사항입니다. mode 매개변수를 추가하지 않으면 파일이 Python에서 읽기 전용 모드로 열립니다.	인코딩: 작성할 필요가 없습니다. 매개변수가 작성되지 않은 경우 기본 코드북은 운영 체제의 기본 코드북입니다. Windows의 기본값은 gbk, Linux의 기본값은 utf-8, mac의 기본값은 utf-8입니다.

🎜🎜🎜mode🎜🎜meaning🎜🎜🎜🎜🎜🎜r🎜🎜텍스트 모드, 읽기 🎜🎜🎜🎜rb🎜🎜바이너리 모드, 읽기🎜🎜 🎜🎜w🎜🎜텍스트 모드, Enter 쓰기 🎜 🎜🎜🎜wb🎜🎜바이너리 모드, 쓰기 🎜🎜🎜🎜a🎜🎜 텍스트 모드, 추가 🎜🎜🎜🎜ab🎜🎜바이너리 모드, 추가 🎜🎜🎜🎜+🎜🎜 읽기 및 쓰기 가능🎜 🎜🎜🎜

读取文件

代码中用到的文件文件操作的1.txt 文件内容如下：

关注《Python之王》公众号
作者：Runsen复制代码

readline(),使用该方法时,需要指定打开文件的模式为r或者r+;

readlines(),读取全部行.返回一个列表，列表中的每个元素是原文件的每一行。如果文件很大，占内存，容易崩盘。

# 打开文件进行读取
f = open("1.txt","r",encoding='utf-8')
# 根据大小读取文件内容
print('输出来自 read() 方法\n',f.read(2048))
# 关闭文件
f.close()
# 打开文件进行读写
f = open("1.txt","r+",encoding='utf-8')
# 读取第2个字和第2行行的文件内容
print('输出来自 readline() 方法\n',f.readline(2))
print('输出来自 readlines() 方法\n',f.readlines(2))
# 关闭文件
f.close()
# 打开文件进行读取和附加
f = open("1.txt","r",encoding='utf-8')
# 打开文件进行读取和附加
print('输出来自 readlines() 方法\n',f.readlines())
# 关闭文件
f.close()

# 输出如下
输出来自 read() 方法
 关注《Python之王》公众号
作者：Runsen
输出来自 readline() 方法
 关注
输出来自 readlines() 方法
 ['《Python之王》公众号\n']
输出来自 readlines() 方法
 ['关注《Python之王》公众号\n', '作者：Runsen']复制代码

写入文件

下面只介绍清除写 w和追加写 a

案例：将关注《Python之王》公众号写入 test.txt 文件中

# mode=w 没有文件就创建，有就清除内容，小心使用
with open('test.txt', 'w', encoding='utf-8') as fb:
      fb.write('关注《Python之王》公众号\n')  
复制代码

下面再将作者：Runsen写入test.txt 文件中

with open('test.txt', 'w', encoding='utf-8') as fb:
      fb.write('作者：Runsen\n')  
复制代码

运行后会发现之前写的关注《Python之王》公众号内容修改为作者：Runsen，因为 w模式会清除原文件内容，所以小心使用。只要使用了w,就要一次性写完。

追加写 a

案例：将静夜思这首诗追加到 test.txt 文件中

# mode=a 追加到文件的最后
with open('test.txt', 'a', encoding='utf-8') as fb:
      fb.write('关注《Python之王》公众号\n')  
with open('test.txt', 'a'encoding='utf-8') as fb:
      fb.write('作者：Runsen\n')      
复制代码

指针操作

事物或资源都是以文件的形式存在，比如消息、共享内存、连接等，句柄可以理解为指向这些文件的指针。

句柄（handle）是一个来自编译原理的术语，指的是一个句子中最先被规约的部分，所以带有一个「句」字。

句柄的作用就是定位，两个APi还是tell和seek。

tell返回文件对象在文件中的当前位置，seek将文件对象移动到指定的位置，传入的参数是offset ，表示移动的偏移量。

下面通过示例对上述函数作进一步了解，如下所示：

with open('test.txt', 'rb+') as f:
    f.write(b'Runsen')
    # 文件对象位置
    print(f.tell())
    # 移动到文件的第四个字节
    f.seek(3)
    # 读取一个字节，文件对象向后移动一位
    print(f.read(1))
    print(f.tell())
    # whence 为可选参数，值为 0 表示从文件开头起算（默认值）、值为 1 表示使用当前文件位置、值为 2 表示使用文件末尾作为参考点
    # 移动到倒数第二个字节
    f.seek(-2, 2)
    print(f.tell())
    print(f.read(1))
    
#输出如下
6
b's'
4
50
b'\r' 
复制代码

上下文管理

我们会进行这样的操作：打开文件，读写，关闭文件。程序员经常会忘记关闭文件。上下文管理器可以在不需要文件的时候，自动关闭文件,使用with open即可。

# with context manager
with open("new.txt", "w") as f:
    print(f.closed)
    f.write("Hello World!")
print(f.closed)

#输出如下
False
True复制代码

如何批量读取多个文件

下面，批量读取某文件夹下的txt文件

file_list = ['1.txt', '2.txt', '3.txt','4.txt']
for path in file_list:
    with open(path, encoding='utf-8') as f:
        for line in f:
            print(line)复制代码

下面将批量读取文件夹下的txt文件的内容，合并内容到一个新文件5.txt中，具体实现的代码如下。

import os
#获取目标文件夹的路径
filedir = os.getcwd()+'\\'+'\\txt'
#获取当前文件夹中的文件名称列表
filenames = []
for i in os.listdir(filedir):
    if i.split(".")[-1] == 'txt':
        filenames.append(i)
#打开当前目录下的5.txt文件，如果没有则创建
f = open('5.txt','w')
#先遍历文件名
for filename in filenames:
    filepath = filedir+'\\'+filename
    #遍历单个文件，读取行数
    for line in open(filepath,encoding='utf-8'):
        f.writelines(line)
        f.write('\n')
#关闭文件
f.close()复制代码

其实在Window中只需要cd 至目标文件夹，即你需要将所有想要合并的txt文件添加至目标文件夹中，执行如下DOS命令 type *.txt > C:\目标路径\合并后的文件名.txt

练习

题目：创建文件data.txt,文件共100000行，每行存放一个1～100之间的整数，题目来源：牛客

import random

f = open(‘data.txt’,‘w+’)
for i in range(100000):
  f.write(str(random.randint(1,100)) + ‘\n’)
  f.seek(0)
  print(f.read())
  f.close()复制代码

题目：生成100个MAC地址并写入文件中，MAC地址前6位（16进制）为01-AF-3B，题目来源：牛客

import random
import string

def create_mac():
  MAC='01-AF-3B'
  hex_num =string.hexdigits #0123456789abcdefABCDEF
  for i in range(3):
    n = random.sample(hex_num,2)
    sn = '-' + ''.join(n).upper()
    MAC += sn
  return MAC

def main():
  with open('mac.txt','w') as f:
    for i in range(100):
      mac = create_mac()
      print(mac)
      f.write(mac+'\n')

main()复制代码

相关免费学习推荐：python视频教程

위 내용은 Python에서 파일 작업 가져오기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 juejin에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

Python 학습 : 2 시간의 일일 연구가 충분합니까?Apr 18, 2025 am 12:22 AM

하루에 2 시간 동안 파이썬을 배우는 것으로 충분합니까? 목표와 학습 방법에 따라 다릅니다. 1) 명확한 학습 계획을 개발, 2) 적절한 학습 자원 및 방법을 선택하고 3) 실습 연습 및 검토 및 통합 연습 및 검토 및 통합,이 기간 동안 Python의 기본 지식과 고급 기능을 점차적으로 마스터 할 수 있습니다.

웹 개발을위한 파이썬 : 주요 응용 프로그램Apr 18, 2025 am 12:20 AM

웹 개발에서 Python의 주요 응용 프로그램에는 Django 및 Flask 프레임 워크 사용, API 개발, 데이터 분석 및 시각화, 머신 러닝 및 AI 및 성능 최적화가 포함됩니다. 1. Django 및 Flask 프레임 워크 : Django는 복잡한 응용 분야의 빠른 개발에 적합하며 플라스크는 소형 또는 고도로 맞춤형 프로젝트에 적합합니다. 2. API 개발 : Flask 또는 DjangorestFramework를 사용하여 RESTFULAPI를 구축하십시오. 3. 데이터 분석 및 시각화 : Python을 사용하여 데이터를 처리하고 웹 인터페이스를 통해 표시합니다. 4. 머신 러닝 및 AI : 파이썬은 지능형 웹 애플리케이션을 구축하는 데 사용됩니다. 5. 성능 최적화 : 비동기 프로그래밍, 캐싱 및 코드를 통해 최적화

Python vs. C : 성능과 효율성 탐색Apr 18, 2025 am 12:20 AM

Python은 개발 효율에서 C보다 낫지 만 C는 실행 성능이 높습니다. 1. Python의 간결한 구문 및 풍부한 라이브러리는 개발 효율성을 향상시킵니다. 2.C의 컴파일 유형 특성 및 하드웨어 제어는 실행 성능을 향상시킵니다. 선택할 때는 프로젝트 요구에 따라 개발 속도 및 실행 효율성을 평가해야합니다.

Python in Action : 실제 예제Apr 18, 2025 am 12:18 AM

Python의 실제 응용 프로그램에는 데이터 분석, 웹 개발, 인공 지능 및 자동화가 포함됩니다. 1) 데이터 분석에서 Python은 Pandas 및 Matplotlib를 사용하여 데이터를 처리하고 시각화합니다. 2) 웹 개발에서 Django 및 Flask 프레임 워크는 웹 응용 프로그램 생성을 단순화합니다. 3) 인공 지능 분야에서 Tensorflow와 Pytorch는 모델을 구축하고 훈련시키는 데 사용됩니다. 4) 자동화 측면에서 파이썬 스크립트는 파일 복사와 같은 작업에 사용할 수 있습니다.

Python의 주요 용도 : 포괄적 인 개요Apr 18, 2025 am 12:18 AM

Python은 데이터 과학, 웹 개발 및 자동화 스크립팅 필드에 널리 사용됩니다. 1) 데이터 과학에서 Python은 Numpy 및 Pandas와 같은 라이브러리를 통해 데이터 처리 및 분석을 단순화합니다. 2) 웹 개발에서 Django 및 Flask 프레임 워크를 통해 개발자는 응용 프로그램을 신속하게 구축 할 수 있습니다. 3) 자동 스크립트에서 Python의 단순성과 표준 라이브러리가 이상적입니다.

파이썬의 주요 목적 : 유연성과 사용 편의성Apr 17, 2025 am 12:14 AM

Python의 유연성은 다중 파리가 지원 및 동적 유형 시스템에 반영되며, 사용 편의성은 간단한 구문 및 풍부한 표준 라이브러리에서 나옵니다. 유연성 : 객체 지향, 기능 및 절차 프로그래밍을 지원하며 동적 유형 시스템은 개발 효율성을 향상시킵니다. 2. 사용 편의성 : 문법은 자연 언어에 가깝고 표준 라이브러리는 광범위한 기능을 다루며 개발 프로세스를 단순화합니다.

파이썬 : 다목적 프로그래밍의 힘Apr 17, 2025 am 12:09 AM

Python은 초보자부터 고급 개발자에 이르기까지 모든 요구에 적합한 단순성과 힘에 호의적입니다. 다목적 성은 다음과 같이 반영됩니다. 1) 배우고 사용하기 쉽고 간단한 구문; 2) Numpy, Pandas 등과 같은 풍부한 라이브러리 및 프레임 워크; 3) 다양한 운영 체제에서 실행할 수있는 크로스 플랫폼 지원; 4) 작업 효율성을 향상시키기위한 스크립팅 및 자동화 작업에 적합합니다.

하루 2 시간 안에 파이썬 학습 : 실용 가이드Apr 17, 2025 am 12:05 AM

예, 하루에 2 시간 후에 파이썬을 배우십시오. 1. 합리적인 학습 계획 개발, 2. 올바른 학습 자원을 선택하십시오. 3. 실습을 통해 학습 된 지식을 통합하십시오. 이 단계는 짧은 시간 안에 Python을 마스터하는 데 도움이 될 수 있습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.