Python データ アナリスト。現在、ビッグデータ分析が非常に人気があります。開発の観点から見ると、Python データ アナリストは非常に有望です。しかし、どんな企業でもビッグデータ分析ができるわけではありません。ビッグデータを行う際には、ビッグデータのソースが包括的かどうか、何を分析するか、誰が使用するかなど、考慮すべき問題がいくつかあります。もちろん、ビッグデータを扱える会社に出会えれば、それでもかなりの給料がもらえるでしょう。 Python データ アナリストになるには、いくつかのことを学ばなければなりません。そうでない場合は、アナリストになれない場合は、プログラマーになって、他の人が分析結果を達成できるよう支援するだけかもしれません。
#第一に、統計的な知識です。 (推奨学習: Python ビデオ チュートリアル )
これは、多くのビッグ データ アナリストの欠点です。もちろん、ここで話しているのは単なる単純な統計ではありません。代わりに、時間、空間、データ自体による平均、中央値、標準偏差、分散、確率、仮説検定などが含まれます。理工系の高度な数学の知識とほぼ同じか、それ以上の知識が必要です。モデリングができる必要があります。そうでないと、分析した結果が現実からかけ離れている場合、おそらく数日で荷物をまとめて出発することになります。もちろん、普通のビッグ データ アナリストになるには高度な数学の深い知識は必要ありませんが、優れたビッグ データ アナリストになるには、やはり学び続ける必要があります。
2 番目: 多くの人は考えていませんが、EXCEL に慣れたほうがよいでしょう。
高度な知識はもちろん必要ありませんが、sum、count、sumifなどよく使う関数もマスターすることがポイントです。 、countif、find、if、左/右、時間変換、ピボット テーブル、さまざまなグラフ作成方法など。データ量がそれほど多くない場合、Excel で多くの問題を解決できます。たとえば、盗まれたデータの一部をフィルタリングしたり、並べ替えたり、条件を満たすデータを選択したりできます。
3 番目: 分析的思考を練習します。
例えば、構造化思考、マインドマップ、百度マインドマップ、マッキンゼー流分析、スマート、5W2H、SWOTなどを知っておくと良いでしょう。深く完全にマスターする必要はありませんが、何かを知っておく必要があります。
4 番目: データベースの知識。
ビッグ データ ビッグ データとは、データが大量にあり、Excel では処理できない場合にデータベースを使用する必要があることを意味します。 Oracle、mysql、sqlserver などのリレーショナル データベースの場合は、SQL ステートメント、フィルタリング、並べ替え、要約などの使用方法を学ぶ必要があります。また、Cassandra、Mongodb、CouchDB、Redis、Riak、Membase、Neo4j、HBase などの非リレーショナル データベースについても学習し、Hbase、Mongodb、redis、等
5 番目: ビジネス学習。
実際、ビッグ データ アナリストにとっては、データを理解することよりもビジネスを理解することの方が重要です。データ分析は業界のビジネスの発展に非常に重要な役割を果たしますが、ビジネスを理解していなければ、分析結果が他の人が望むものではない可能性があります。
#6 番目: 開発ツールと環境。
例: Linux OS、Hadoop (HDFS の保存、Yarn のコンピューティング)、Spark、またはその他のミドルウェア。現在、多くの開発ツール、Python やその他の言語ツールが使用されています。 つまり、シニアまたはディレクターレベルのビッグデータアナリストになることは、非常に頭を使うことになります。学び理解したいものが単なるデータである場合、ビジネスと統計の知識を学ぶことが不可欠です。実務的なビッグデータ アナリストであれば、特定の部分しか習得できない可能性があります。ビッグデータ開発エンジニアの場合、基本的には開発環境や開発言語、各種チャートの応用を習得する必要がありますが、これでも十分です。結局のところ、企業にはチームワークが必要であり、1人でも一部を理解すれば分析製品を思いつくことができます。何かを決めて、それを実行してください!頑張れば頑張るほど楽になり、頑張れば頑張るほど良い結果が得られます。 Python 関連の技術記事の詳細については、Python チュートリアル 列にアクセスして学習してください。
以上がPython データアナリストが学ぶべきことの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。