Pythonでデータを読み取る方法

(*-*)浩
(*-*)浩オリジナル
2019-06-24 11:02:477468ブラウズ

データを読み取ることで作業が容易になります。Python でデータを読み取る一般的な方法はたくさんあります。では、Python はどのようにデータを読み取るのでしょうか?

Pythonでデータを読み取る方法

パンダの read_csv モジュールを使用して、データを直接読み取ります。 (推奨される学習: Python ビデオ チュートリアル )

data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)

上記のコードでは、read_csv の最初の部分はデータ セットが保存されているパスです。次のヘッダーは非常に重要ですヘッダーが欠落しているとよく思いますが、欠落したデータ行が DataFrame の列インデックスになるため、総データ量が 1 減ります。

もっと伝統的な方法として、open で直接ファイルを開いて、ファイル内の情報を取り出してみるという方法もあります。抽出した変数を処理するだけです。

f= open('/home/nw/Desktop/dataset/iris.txt','rb')
 
dataset = pickle.load(f)
#这种方法适用于自己存取自己的数据,有时候在读取别人的数据的时候是不行的,因为别人存数据的方式不一定是用pickle.dump的方
##式存数据的。
 
f = open('/home/nw/Desktop/dataset/iris.txt')
 
'''
注意这里的open后面最好不要加上其他的读取方式,不需要‘rb’之类的读取方式。因为在后续的数据处理中可能还需要将二进制的数
据转换成自己想要的个数。 
'''
 
lines = f.readlines()
 
'''
 
现在lines中已经包含了所有的数据信息,我们想要得到的数据格式都可以基于lines做处理。如我读出的iris数据格式是一个列表的形
式,使用len(lines)得到列表中元素的个数是151,打印出lines,可以看到lines中每个元素都是一个字符串,并且每个字符串后面都
有'\n'的换行字符,最后一行是空行,所以最后一行是多余,并且要去掉每行中的'\n'
 
'''
 
arr = []
 
for i in range(len(lines)):
 
    if lines[i] != '\n':
 
        arr.append(lines[i])
 
for i in range(len(arr)):
 
    arr[i] = arr[i].strip('\n')#将每行的'\n'脱去

Python 関連の技術記事の詳細については、Python チュートリアル 列にアクセスして学習してください。

以上がPythonでデータを読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。