ホームページ  >  記事  >  ビッグデータの多様性により、データは 3 つのデータ構造に分類されます。

ビッグデータの多様性により、データは 3 つのデータ構造に分類されます。

青灯夜游
青灯夜游オリジナル
2021-01-30 14:49:3230242ブラウズ

ビッグデータの多様性により、データは 1. 構造化データ (2 次元のテーブル構造によって論理的に表現され実装されたデータ) 2. 非構造化データ (2. 非構造化データ) の 3 つのデータ構造に分類されます。データ構造が不規則または不完全で、事前定義されたデータ モデルがなく、データベース内の 2 次元論理テーブルで表現するには不便です; 3. 半構造化データ。

ビッグデータの多様性により、データは 3 つのデータ構造に分類されます。

このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。

ビッグデータの多様性により、データは構造化データ、非構造化データ、半構造化データの 3 つのデータ構造に分割されます。

構造化データ

構造化データは行データとも呼ばれ、2次元の表構造で論理的に表現され実装されたデータです。データベース。データ形式と長さの仕様を厳密に遵守し、主にリレーショナル データベースを通じて保存および管理します。

構造化データのマークアップは、Web サイトが検索結果により適切に表示される方法です。構造化データのマークアップ後、Web サイトは検索結果にリッチな Web スニペットを適切に表示できます。

検索エンジンはすべて、ユーザーにより良いオンライン エクスペリエンスを提供するために、標準の構造化データ マークアップをサポートしています。 Web ページ内のマイクロデータ タグは、検索エンジンが Web ページ上の情報を理解するのに役立ち、検索エンジンがカテゴリを識別して関連性を判断しやすくなります。

同時に、構造化マイクロデータにより、検索エンジンはより充実した検索結果の概要表示、つまりユーザーが特定のクエリに役立つ詳細情報を提供できるようになり、ユーザーは検索で製品に関する重要な情報を直接確認できるようになります。結果。 。たとえば、製品の価格、名前、在庫状況 (製品の在庫があるかどうか)、レビュー担当者の評価やコメントなどはすべて、検索結果の概要で直接確認できます。

これらのリッチ スニペットは、Web サイトが検索コンテンツに関連しているかどうかをユーザーが理解するのに役立ち、ページのクリック数を増やすことができます。

たとえば、検索結果には、より多くの星による評価、レビューの数、価格、その他の要素が表示され、間違いなく Web サイトの専門性が高まり、Web サイトに対する顧客の信頼が向上します。ウェブサイトのクリックスルー率とコンバージョン率。

非構造化データ

構造化データの反対は、2 次元データベース テーブルで表すのに適さない非構造化データです。

非構造化データは、データ構造が不規則または不完全で、事前定義されたデータ モデルがなく、データベース内の 2 次元論理テーブルで表現するのが不便なデータです。

オフィス文書のあらゆる形式、XML、HTML、各種レポート、画像と音声、ビデオ情報などが含まれます。非構造化データをサポートするデータベースは、複数値フィールド、単一フィールド、および可変長フィールドのメカニズムを使用してデータ項目を作成および管理し、全文検索やさまざまなマルチメディア情報処理分野で広く使用されています

半構造データ

半構造化データ (半構造化データ)。情報システムを設計する際にはデータの保存が必ず関係しますが、通常はシステム情報を指定されたリレーショナルデータベースに保存します。データを業務ごとに分類し、対応するテーブルを設計し、対応する情報を対応するテーブルに保存します。たとえば、ビジネス システムを構築し、従業員の基本情報 (役職番号、名前、性別、生年月日など) を保存する必要がある場合、対応するスタッフ テーブルを作成します。

しかし、システム内のすべての情報をテーブル内のフィールドに対応させることができるわけではありません。

半構造化データ モデルは、データベース システム内で独自の位置を占めます:

(1) データベース統合に適したデータ モデル、つまり、含まれるデータを記述するのに適したデータ モデルです。異なるスキーマの類似したデータを含む 2 つ以上のデータベース。

(2) Web上で情報を共有するためのマークアップサービスの基本モデルです。

半構造化データの構造パターンはデータ自体に付加または混合されており、データ自体が対応する構造パターンを記述します。具体的には、半構造化データには次のような特徴があります。

(1) データ構造は自己記述的です。構造とデータが融合し、研究やアプリケーションにおいて「メタデータ」と「一般データ」を区別する必要がなくなりました(この 2 つは 1 つになります)。

(2) データ構造記述の複雑さ。この構造は、既存のさまざまな記述枠組みに組み込むことが難しく、実際のアプリケーションで明確に理解して把握することが困難です。

(3) データ構造記述の動的性質。データの変更は通常、構造モデルの変更につながり、構造モデル全体は動的な構造になります。

E-R モデル、リレーショナル モデル、オブジェクト モデルなどの従来のデータ モデルは、上記の特性とは真逆であるため、構造化データ モデルになり得ます。構造化データと比較して、半構造化データの構成はより複雑で不確実であるため、柔軟性が高く、より幅広いアプリケーションのニーズに適応できます。

さらに関連記事を読みたい場合は、PHP 中国語 Web サイト にアクセスしてください。 !

以上がビッグデータの多様性により、データは 3 つのデータ構造に分類されます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。