ビッグデータの非感作とはどういう意味ですか
ビッグデータのデータの感作を弱めることは、データブリーチング、データ非公開化、またはデータ変形とも呼ばれます。機密性の低いプライベートデータの信頼性の高い保護を実現するために、機密性の解除ルールを介して特定の機密情報を変換することで、機密性を解除された実際のデータセットを開発、テスト、その他の非運用環境およびアウトソーシング環境で安全に使用できるようにします。
プライバシー データの感度を下げる技術
通常、ビッグ データ プラットフォームでは、データは構造化された形式で保存され、各テーブルはデータの各行は多くの行で構成され、データの各行は多くの列で構成されます。列のデータ属性に応じて、データ列は通常次のタイプに分類できます。
個人を正確に特定できる列は、ID 番号、住所、名前などの識別可能な列と呼ばれます。
単一の列では個人を特定できませんが、郵便番号、誕生日、性別など、複数の情報列を使用して個人を識別できる可能性があります。これらの列は、半識別列と呼ばれます。米国の研究論文では、郵便番号、誕生日、性別の情報のみを使用してアメリカ人の 87% を識別できると述べています[3]。
取引金額、病気、収入などのユーザーの機密情報が含まれる列。
ユーザー機密情報を含まないその他の列。
いわゆるプライバシーデータの漏洩回避とは、データを利用する人(データアナリストやBIエンジニアなど)が、特定のデータ列を特定の個人の情報として識別できないようにすることを指します。データ非感作テクノロジは、識別列の削除、準識別列の変換などによってデータの感作を解除します。これにより、データ ユーザーは、#2 (変換後) 準識別列、#3 の機密情報列、#4 が確実に保護されるようになります。他のカラムでのデータ分析の基礎となるため、データに基づいてユーザーを逆に特定できないことがある程度保証されており、データのセキュリティの確保とデータの価値の最大化のバランスが取れています。
プライバシー データ漏洩のタイプ
プライバシー データ漏洩は多くのタイプに分類でき、タイプに応じて、通常、さまざまなプライバシー データ漏洩リスク モデルを使用して測定および測定できます。プライバシーデータ漏洩のリスクと、さまざまなデータ非感作アルゴリズムに対応するデータの非感作を防止します。一般的に、プライバシー データの漏洩には次のような種類があります。
個人情報の漏洩。データ利用者が何らかの手段を用いて、データテーブル内のデータが特定の個人のものであることを確認することを個人情報漏洩と呼びます。個人情報の漏洩が最も深刻なのは、個人情報の漏洩が発生すると、データ ユーザーが特定の個人に関する機密情報を取得する可能性があるためです。
属性漏洩。データ利用者がアクセスしたデータテーブルに基づいて個人に関する新しい属性情報を知ることを属性漏洩と呼びます。個人情報の漏洩は確かに属性の漏洩につながりますが、属性の漏洩は独立して発生する可能性もあります。
メンバー関係が漏洩しました。データ利用者が、ある個人のデータがデータテーブルに存在することを確認できることを、メンバーシップの開示と呼びます。会員情報漏洩のリスクは比較的小さく、個人情報漏洩や属性漏洩は間違いなく会員情報漏洩を意味しますが、単独で会員情報漏洩が発生する場合もあります。
プライバシー データ漏洩のリスク モデル
データをデータ アナリストに公開すると、プライバシー データ漏洩のリスクも生じます。データ分析とマイニングの可能性を最大限に高めながら、プライバシー データ漏洩のリスクを一定の範囲内に制限することが、データ非感作技術の最終的な目標です。現在、プライバシー データの非感作化の分野では、データの潜在的なプライバシー データ漏洩リスクをさまざまな角度から測定するために使用できるいくつかの異なるモデルがあります。
推奨チュートリアル: 「PHP チュートリアル 」
以上がビッグデータの非感作化とは何を意味しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。