ホームページ >バックエンド開発 >Python チュートリアル >Python でのファイル操作の取得
どの言語もファイルの操作と切り離せないものですが、Python 言語ではどのようにファイルを操作および管理するのでしょうか。
エンコード方式の歴史は大まかに ASCII
->gb2312
->unicode
-> ; utf-8
、この期間の詳細情報については、Baidu
でエンコードとデコードの小さな例を参照してください。GBK# には中国語が使用できることを覚えておいてください。 ## および
utf-8 エンコーディング、
GBk では 1 つの中国語文字が 2 バイトに対応し、
utf-8 では 1 つの中国語文字が 3 バイトに対応し、中国語は使用できません
ASCIIcoding で処理されます。
>>> '刘润森'.encode('GBK') b'\xc1\xf5\xc8\xf3\xc9\xad' >>> '刘润森'.encode('ascii') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128) >>> 'Runsen'.encode('ascii') b'Runsen' >>> "刘润森".encode('utf-8') b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae' >>> '刘润森'.encode('GBK').decode('GBK') '刘润森' >>> '刘润森'.encode('GBK').decode('utf-8') UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte复制代码エンコードとデコードの形式が一致していない場合、文字化けが発生することがあります。encodeはエンコード、decodeはデコードを意味します。 ファイル操作 API以下は、Python ファイル操作に特化した API です。
意味 | |
---|---|
open | |
read | |
write | |
閉じる | |
単一行読み取り | |
複数-line reading | |
ファイル ポインタ操作 | |
現在のポインタ位置の読み取り |
関数には、ファイルを開くときに使用できるパラメータがいくつかあります。ただし、最も一般的に使用されるのは最初の 2 つのパラメータだけです。
最初の項目は必須で、残りはオプションであることに注意してください。 mode パラメーターを追加しない場合、ファイルは Python の読み取り専用モードで開かれます。
エンコーディング: 記述する必要はありません。パラメータが記述されていない場合、デフォルトのコードブックはオペレーティング システムのデフォルトのコードブックになります。 Windows のデフォルトは gbk、Linux のデフォルトは utf-8、Mac のデフォルトは utf-8 です。
f=open('test.txt',encoding='utf-8') #打开文件 data=f.read() #读取文件 print(data) f.close() #关闭文件 复制代码
モード
意味 | |
---|---|
テキスト モード、読み取り | |
バイナリ モード、読み取り | |
テキスト モード、 | #wb |
##a | ## と記述します。 #テキスト モード、 append|
ab | バイナリ モード、append |
読み取り可能および書き込み可能 | |
以上がPython でのファイル操作の取得の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。