ビッグ データの 4V の特徴は次のとおりです: 1. 量; 情報技術の急速な発展に伴い、データは爆発的に増加し始めます。 2. 速度。 3. 多様性; 主に複数のデータ ソース、複数のデータ タイプ、およびデータ間の強い相関関係に反映されます; 4. 価値。
#この記事の動作環境: Windows10 システム、Thinkpad t480 コンピューター。
ビッグデータ (ビッグデータ) とは、IT 業界用語であり、従来のソフトウェア ツールでは一定の時間範囲内で取得、管理、処理することができないデータの集合を指します。強力な機能、洞察力、プロセス最適化機能を備えた、大規模かつ急成長を続ける多様な情報資産。
4v ビッグ データの特性
Victor Mayer-Schonberg と Kenneth Skye 著「ビッグ データの時代」におけるビッグ データの特性ビッグデータの 4V 特性は、量、速度、多様性、および価値です。
(1) 規模
情報技術の急速な発展に伴い、データは爆発的に増加し始めています。ビッグデータのデータは、ギガバイトやテラバイトではなく、PB (1,000 テラバイト)、EB (100 万テラバイト)、または ZB (10 億テラバイト) で測定されます。
(2) 多様性
多様性は主に、複数のデータ ソース、複数のデータ タイプ、データ間の強い相関性という 3 つの側面に反映されます。
① データのソースは数多くあります。企業が直面する従来のデータは主にトランザクション データでしたが、インターネットとモノのインターネットの発展により、ソーシャル ネットワーキング サイトやセンサーなどの複数のソースからデータがもたらされるようになりました。
データはさまざまなアプリケーション システムやさまざまなデバイスから取得されるため、ビッグ データ形式の多様性が決まります。金融システムデータ、情報管理システムデータ、医療システムデータなど、データ間の因果関係が強い特徴を持つ構造化データと、医療システムデータなどの非構造化データに大別されます。動画、写真、音声などはデータ間の因果関係が弱いという特徴があり、3つ目はHTML文書や電子メール、Webページなどの半構造化データはデータ間の因果関係が弱いという特徴があります。
②データの種類は数多くありますが、主に非構造化データです。従来の企業では、データはテーブルに保存されます。ビッグデータのデータの 70% ~ 85% は、写真、音声、ビデオ、ウェブログ、リンク情報などの非構造化データおよび半構造化データです。
③データは相関性が高く、頻繁に相互作用します。たとえば、観光客が旅行中にアップロードした写真やログは、観光客の位置や旅程などの情報と密接に関連しています。
(3) 高速
これは、従来のデータ マイニングとは異なるビッグ データの最も重要な機能です。ビッグデータとマッシブデータの重要な違いは、データ規模がビッグデータの方が大きいことと、データ処理の応答速度に対する要求がビッグデータの方が厳しいことの2つの点です。バッチ分析ではなくリアルタイム分析により、データの入力、処理、破棄がほとんど遅延なく即座に実行されます。データの増加率と処理速度は、ビッグデータの高速性を示す重要な指標です。
(4) 価値
企業は大量のデータを保有していますが、価値を発揮できるのはそのごく一部です。ビッグデータの背後に隠された価値は膨大です。ビッグデータに含まれる価値のあるデータの割合は非常に小さいため、ビッグデータの真の価値は、さまざまな種類の無関係な大量のデータに反映されます。将来の傾向やパターンの予測と分析のための貴重なデータをマイニングし、機械学習手法、人工知能手法、データマイニング手法を通じて詳細な分析を行い、農業、金融、医療などのさまざまな分野に応用します。より大きな価値を生み出すために。
さらに関連記事を読みたい場合は、PHP 中国語 Web サイト にアクセスしてください。 !
以上がビッグデータの 4V 特性とは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。