ビッグデータとは、特定の時間範囲内で従来のソフトウェア ツールでは取得、管理、処理できないデータの集合を指します。より強力な意思決定力、洞察の発見、プロセスの最適化を実現するには、新しい処理モデルが必要です。大規模かつ急速に成長し、多様化する情報資産。ビッグデータの特徴: 1. 膨大なデータ量、2. 多様なデータ形式と幅広いデータソースがビッグデータ形式の多様性を決定づける、3. 高速性、つまり急速なデータ増加と高速処理、4. 低価値密度 ; 5. 高い商品価値。
このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。
ビッグデータとは
ビッグデータ (ビッグデータ) とは、IT 業界用語で、企業内で従来のソフトウェアを使用できないことを指します。特定の時間範囲 ツールによって収集、管理、処理されるデータのコレクションは、大規模かつ急速に成長する多様な情報資産であり、より強力な意思決定力、洞察発見、およびプロセス最適化機能を備えた新しい処理モデルが必要です。
ビクター・マイヤー・シェーンベルクとケネス・キュキアが著した「ビッグデータ時代」では、ビッグデータとは、ランダム分析(サンプリング調査)などの近道ではなく、すべてのデータの分析と処理を指します。ビッグデータの 5V 特性 (IBM が提案): Volume (容量)、Velocity (高速)、Variety (多様性)、Value (値密度の低さ)、および Veracity (信頼性)。
##特徴
1. データ量が膨大である
インターネットとともに 業界の発展に伴い、日常業務においてユーザーのネットワーク行動に関する大量のデータが生成され、蓄積されています。たとえば、ソーシャル電子商取引プラットフォームでは毎日の注文、さまざまなショートビデオ、フォーラムやコミュニティで公開される投稿、コメント、ショートビデオ、毎日送信される電子メール、アップロードされる写真、ビデオ、音楽など、生成されるデータの規模は膨大です。それは非常に膨大であり、そのデータ量はすでにPBレベルに達しています。このような大規模なデータを処理、分析、集計するには十分な容量が必要となるため、そのデータ量が膨大であることがビッグデータの特徴の一つです。 2. 多様なデータ形式幅広いデータ ソースがビッグ データ形式の多様性を決定します。どのような形式のデータでも役立ちますが、現在最も広く使用されているのは、淘宝網、NetEase Cloud Music、Toutiao などのレコメンデーション システムです。これらのプラットフォームはユーザーのログ データを分析し、ユーザーが好むものをさらに推奨します。ログデータは明確に構造化されたデータですが、画像、音声、動画など構造が明確でないデータも存在します。これらのデータは因果関係が弱く、手動による注釈が必要です。 3. 高速ビッグデータの高速とは、データの急速な増加と高速処理を指します。毎日、あらゆる階層からのデータが急激に増加しています。多くのシナリオでは、データは時間に左右されます。たとえば、検索エンジンはユーザーが必要とするデータを数秒以内に表示する必要があります。企業やシステムが急速に増大するデータに直面した場合、データを高速に処理し、迅速に対応する必要があります。 4. 低い値密度ビッグ データの低い値密度は、大規模なデータ ソースの中に真に価値のあるデータがほとんどなく、データの多くが間違っている可能性があることを意味します。不完全で使用できません。一般に、データ全体に占める貴重なデータの密度は非常に低く、データを洗練することは砂の上をサーフィンするようなものです。 5. 高い商業価値従来のスモールデータと比較して、ビッグデータの最大の価値は、関連性のないさまざまな種類の大量のデータから将来の傾向や傾向を掘り出すことです。貴重なデータを分析し、機械学習手法や人工知能手法、データマイニング手法などを用いた詳細な分析を通じて新たな法則や新たな知見を発見し、農業、金融、医療などのさまざまな分野に応用し、最終的には社会ガバナンスを改善し、生産効率を改善し、科学研究の有効性を促進し、その商業的価値を実現します。 推奨: 「プログラミング ビデオ
」以上がビッグデータとは何ですか?ビッグデータの特徴は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。