検索
ホームページよくある問題ビッグデータの非感作化とは何を意味しますか?

ビッグデータの非感作化とは何を意味しますか?

ビッグデータの非感作とはどういう意味ですか

ビッグデータのデータの感作を弱めることは、データブリーチング、データ非公開化、またはデータ変形とも呼ばれます。機密性の低いプライベートデータの信頼性の高い保護を実現するために、機密性の解除ルールを介して特定の機密情報を変換することで、機密性を解除された実際のデータセットを開発、テスト、その他の非運用環境およびアウトソーシング環境で安全に使用できるようにします。

プライバシー データの感度を下げる技術

通常、ビッグ データ プラットフォームでは、データは構造化された形式で保存され、各テーブルはデータの各行は多くの行で構成され、データの各行は多くの列で構成されます。列のデータ属性に応じて、データ列は通常次のタイプに分類できます。

個人を正確に特定できる列は、ID 番号、住所、名前などの識別可能な列と呼ばれます。

単一の列では個人を特定できませんが、郵便番号、誕生日、性別など、複数の情報列を使用して個人を識別できる可能性があります。これらの列は、半識別列と呼ばれます。米国の研究論文では、郵便番号、誕生日、性別の情報のみを使用してアメリカ人の 87% を識別できると述べています[3]。

取引金額、病気、収入などのユーザーの機密情報が含まれる列。

ユーザー機密情報を含まないその他の列。

いわゆるプライバシーデータの漏洩回避とは、データを利用する人(データアナリストやBIエンジニアなど)が、特定のデータ列を特定の個人の情報として識別できないようにすることを指します。データ非感作テクノロジは、識別列の削除、準識別列の変換などによってデータの感作を解除します。これにより、データ ユーザーは、#2 (変換後) 準識別列、#3 の機密情報列、#4 が確実に保護されるようになります。他のカラムでのデータ分析の基礎となるため、データに基づいてユーザーを逆に特定できないことがある程度保証されており、データのセキュリティの確保とデータの価値の最大化のバランスが取れています。

プライバシー データ漏洩のタイプ

プライバシー データ漏洩は多くのタイプに分類でき、タイプに応じて、通常、さまざまなプライバシー データ漏洩リスク モデルを使用して測定および測定できます。プライバシーデータ漏洩のリスクと、さまざまなデータ非感作アルゴリズムに対応するデータの非感作を防止します。一般的に、プライバシー データの漏洩には次のような種類があります。

個人情報の漏洩。データ利用者が何らかの手段を用いて、データテーブル内のデータが特定の個人のものであることを確認することを個人情報漏洩と呼びます。個人情報の漏洩が最も深刻なのは、個人情報の漏洩が発生すると、データ ユーザーが特定の個人に関する機密情報を取得する可能性があるためです。

属性漏洩。データ利用者がアクセスしたデータテーブルに基づいて個人に関する新しい属性情報を知ることを属性漏洩と呼びます。個人情報の漏洩は確かに属性の漏洩につながりますが、属性の漏洩は独立して発生する可能性もあります。

メンバー関係が漏洩しました。データ利用者が、ある個人のデータがデータテーブルに存在することを確認できることを、メンバーシップの開示と呼びます。会員情報漏洩のリスクは比較的小さく、個人情報漏洩や属性漏洩は間違いなく会員情報漏洩を意味しますが、単独で会員情報漏洩が発生する場合もあります。

プライバシー データ漏洩のリスク モデル

データをデータ アナリストに公開すると、プライバシー データ漏洩のリスクも生じます。データ分析とマイニングの可能性を最大限に高めながら、プライバシー データ漏洩のリスクを一定の範囲内に制限することが、データ非感作技術の最終的な目標です。現在、プライバシー データの非感作化の分野では、データの潜在的なプライバシー データ漏洩リスクをさまざまな角度から測定するために使用できるいくつかの異なるモデルがあります。

推奨チュートリアル: 「PHP チュートリアル

以上がビッグデータの非感作化とは何を意味しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
在 Microsoft Excel 中如何创建数据透视表在 Microsoft Excel 中如何创建数据透视表Apr 22, 2023 pm 12:10 PM

当您拥有大量数据时,分析数据通常会变得越来越困难。但真的必须如此吗?MicrosoftExcel提供了一个令人惊叹的内置功能,称为数据透视表,可用于轻松分析庞大的数据块。它们可用于通过创建您自己的自定义报告来有效地汇总您的数据。它们可用于自动计算列的总和,可以对其应用过滤器,可以对其中的数据进行排序等。可以对数据透视表执行的操作以及如何使用数据透视表为了缓解您的日常excel障碍是无止境的。继续阅读,了解如何轻松创建数据透视表并了解如何有效组织它。希望你喜欢阅读这篇文章。第1节:什么是数据透视

如何阻止 Apple 在 iPhone 上收集诊断和使用数据如何阻止 Apple 在 iPhone 上收集诊断和使用数据Apr 16, 2023 pm 09:25 PM

苹果以其对用户隐私的承诺而闻名。当您购买iPhone或Mac时,您知道您正在投资一家承诺保护您的数据的公司的产品。这在我们这个时代非常重要——因为我们越来越多地将更多的个人信息存储在这些设备上。我们使用的大多数设备都会收集使用数据以改进相应的产品和服务。例如,当应用程序在您的手机上崩溃时,可以通知开发人员以帮助他们查明此错误的原因。虽然这些数据通常是匿名的,但一些用户不喜欢让公司收集他们的日志。此外,通过共享这些诊断信息,您的设备会将它们上传到公司的服务器。这可能会耗尽您的(有限)数据计划和部分

如何用零替换 Excel 数据透视表中的空白单元格如何用零替换 Excel 数据透视表中的空白单元格Apr 15, 2023 am 11:52 AM

了COLUMNS部分下的字段Item、ROWS部分下的字段Date和VALUES部分下的Profit字段。注意:如果您需要有关数据透视表如何工作以及如何有效地创建数据透视表的更多信息,请参阅我们的文章如何在MicrosoftExcel中创建数据透视表。因此,根据我的选择,我的数据透视表生成如下面的屏幕截图所示,使其成为我想要的完美摘要报告。但是,如果您查看数据透视表,您会发现我的数据透视表中有一些空白单元格。现在,让我们在接下来的步骤中将它们替换为零。第6步:要用零替换空白单元格,首先右键单击数

AI 算法在大数据治理中的应用AI 算法在大数据治理中的应用Apr 12, 2023 pm 01:37 PM

本文主要分享 Datacake 在大数据治理中,AI 算法的应用经验。本次分享分为五大部分:第一部分阐明大数据与 AI 的关系,大数据不仅可以服务于 AI,也可以使用 AI 来优化自身服务,两者是互相支撑、依赖的关系;第二部分介绍利用 AI 模型综合评估大数据任务健康度的应用实践,为后续开展数据治理提供量化依据;第三部分介绍利用 AI 模型智能推荐 Spark 任务运行参数配置的应用实践,实现了提高云资源利用率的目标;第四部分介绍在 SQL 查询场景中,由模型智能推荐任务执行引擎的实践;第五部分

大数据在生活中的应用有哪些大数据在生活中的应用有哪些Sep 22, 2021 am 10:48 AM

大数据在生活中的应用有:1、农业互联网;2、金融业互联网;3、电子商务;4、医疗器械行业;5、零售业大数据;6、生物科技等。

如何在 Microsoft Excel 图表中添加和自定义数据标签?如何在 Microsoft Excel 图表中添加和自定义数据标签?May 07, 2023 pm 04:22 PM

Microsoft Excel有许多至今令人们惊叹的功能。人们每天都会学到一些新东西。今天,我们将了解如何在Excel图表中添加和自定义数据标签。Excel图表包含大量数据,一眼看懂图表可能具有挑战性。使用数据标签是指出重要信息的好方法。数据标签可以用作柱形图或条形图的一部分。当您创建饼图时,它甚至可以用作标注。添加数据标签为了展示如何添加数据标签,我们将以饼图为例。虽然大多数人使用图例来显示饼图中的内容,但数据标签的效率要高得多。要添加数据标签,请创建饼图。打开它,然后单击显示图表设计

腾讯广告模型基于"太极"的训练成本优化实践腾讯广告模型基于"太极"的训练成本优化实践Apr 14, 2023 pm 06:46 PM

近年来,大数据加大模型成为了AI领域建模的标准范式。在广告场景,大模型由于使用了更多的模型参数,利用更多的训练数据,模型具备了更强的记忆能力和泛化能力,为广告效果向上提升打开了更大的空间。但是大模型在训练过程中所需要的资源也是成倍的增长,存储以及计算上的压力对机器学习平台都是巨大的挑战。腾讯太极机器学习平台持续探索降本增效方案,在广告离线训练场景利用混合部署资源大大降低了资源成本,每天为腾讯广告提供50W核心廉价混合部署资源,帮助腾讯广告离线模型训练资源成本降低30%,同时通过一系列优化手段使得

如何使用 Go 语言进行大数据分析?如何使用 Go 语言进行大数据分析?Jun 11, 2023 am 11:11 AM

随着数据规模逐渐增大,大数据分析变得越来越重要。而Go语言作为一门快速、轻量级的编程语言,也成为了越来越多数据科学家和工程师的选择。本文将介绍如何使用Go语言进行大数据分析。数据采集在开始大数据分析之前,我们需要先采集数据。Go语言有很多包可以用于数据采集,例如“net/http”、“io/ioutil”等。通过这些包,我们可以从网站、API、日志

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール