ビッグデータといえば、誰もがその概念を聞いたことがあると思いますが、それが具体的に何なのか、どのように定義するのかについて標準的なものはありません。なぜなら、私たちの印象では、多くの企業がビッグデータ企業と呼ばれており、ビジネスの形式は何百もありますが、理解するのは簡単ではないので、私はビッグデータを文字通りに理解する必要があることを提案します。ビクター・メイヤー・シェーンバーグとケネス・キュキエによって書かれた「ビッグデータの時代」では、彼らは4つの側面について言及していますビッグデータの特徴:
第一に、量が比較的多く、データ量がPBレベル以上に達しないと取得できないことです。いわゆるビッグデータ。 (推奨学習: Python ビデオ チュートリアル )
1PB は 1024TB に相当し、1TB は 1024G に相当し、1PB は 1024*1024 G のデータに相当します。
2 つ目は非常に価値があります。
全国の 20 ~ 35 人の若者全員の 1PB 以上のオンライン データがあれば、当然商業的価値が生まれます。たとえば、このデータを分析することで、どのような趣味があるかがわかります。の人材を育成し、製品等の開発方向性を指導します。
全国数百万人の患者データがあれば、そのデータを分析することで病気の発生を予測できる、それがビッグデータの価値です。
3つ目は多様性です。
データが 1 つだけある場合、データには価値がありません。たとえば、個人データが 1 つしかない場合、または 1 人のユーザーがデータを送信する場合、これらのデータはビッグ データとは言えませんビッグデータと呼ばれるものですが、多様性も必要です。
例えば、現在のインターネットユーザーの中には、年齢、学歴、趣味、性格など、人それぞれに異なる特徴があり、これがビッグデータの多様性であり、もちろんそれが全国に拡大すれば、データの多様性 データはさらに多様化し、あらゆる地域、あらゆる時代においてさまざまなデータの多様性が存在することになります。
4 番目は速いです。
アルゴリズムによるデータの論理的な処理速度は非常に速く、1秒ルールによりさまざまな種類のデータから価値の高い情報を迅速に取得できます。これは従来のデータマイニング技術と同様です。違う。
Python 関連の技術記事の詳細については、Python チュートリアル 列にアクセスして学習してください。
以上がビッグデータはどのレベルのデータの処理に適していますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。