Pandas は、Python ユーザーに包括的なデータ分析ツールのセットを提供します。一般的な課題の 1 つは、さまざまなソースからデータを DataFrame にインポートすることです。特に文字列は、テストやその他の目的で表形式のデータを保存するのに便利な方法です。
次のようなセミコロンで区切られたデータを含む文字列がある場合、
TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """
StringIO を利用して、これを Pandas DataFrame に変換します。StringIO は、文字列用のファイルのようなバッファーを提供します。次のコードは、これを実現する方法を示しています。
import pandas as pd from io import StringIO TESTDATA = StringIO("""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """) df = pd.read_csv(TESTDATA, sep=";")
このコードは、pd.read_csv() 関数を使用して、セミコロンを区切り文字として扱い、TESTDATA 文字列を CSV ファイルとして解析します。結果として得られる df という名前の DataFrame には、文字列の構造化データが含まれます。
StringIO を利用すると、文字列をファイル オブジェクトであるかのように簡単に操作でき、さまざまなソースから Pandas にデータをインポートすることが簡単になります。分析と操作のための DataFrame。
以上がPython でセミコロンで区切られた文字列から Pandas DataFrame を作成するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。