>일반적인 문제 >빅데이터 둔감화란 무엇을 의미하나요?

빅데이터 둔감화란 무엇을 의미하나요?

Guanhui
Guanhui원래의
2020-05-30 17:39:577952검색

빅데이터 둔감화란 무엇을 의미하나요?

빅 데이터 둔감화의 의미

데이터 표백, 데이터 박탈 또는 데이터 변형이라고도 하는 빅데이터 데이터 둔감화는 둔감화 규칙을 통해 특정 민감한 정보를 변형하는 것을 의미합니다. 민감하지 않은 실제 데이터 세트를 개발, 테스트, 기타 비프로덕션 및 아웃소싱 환경에서 안전하게 사용할 수 있습니다.

개인정보 민감화 기술

보통 빅데이터 플랫폼에서는 데이터가 구조화된 형식으로 저장되며, 각 테이블은 여러 행으로 구성되고, 데이터의 각 행은 여러 열로 구성됩니다. 컬럼의 데이터 속성에 따라 데이터 컬럼은 일반적으로 다음과 같은 유형으로 나눌 수 있습니다.

사람의 위치를 ​​정확하게 찾을 수 있는 컬럼을 주민번호, 주소, 이름 등 식별 가능한 컬럼이라고 합니다.

단일 열은 개인을 찾을 수 없지만 여러 정보 열을 사용하여 잠재적으로 사람을 식별할 수 있습니다. 이러한 열을 우편번호, 생일, 성별과 같은 준식별 열이라고 합니다. 미국의 한 연구 논문에 따르면 우편번호, 생일, 성별 정보만으로 미국인의 87%를 식별할 수 있다고 합니다[3].

거래 금액, 질병, 소득 등 민감한 사용자 정보가 포함된 열입니다.

사용자의 민감한 정보를 포함하지 않는 기타 열입니다.

소위 개인 정보 유출 방지란 데이터를 이용하는 사람(데이터 분석가, BI 엔지니어 등)이 특정 행의 데이터를 특정 개인의 정보로 식별하는 것을 방지하는 것을 의미합니다. 데이터 둔감화 기술은 식별 열 제거, 준식별 열 변환 등 데이터를 둔감화하여 데이터 사용자가 #2(변환 후) 반 식별 열, #3 민감 정보 열, #4 On을 보장할 수 있도록 합니다. 다른 컬럼의 데이터 분석을 기반으로 데이터를 기반으로 사용자를 역식별할 수 없도록 어느 정도 보장하여 데이터 보안 보장과 데이터 가치 극대화 간의 균형을 유지합니다.

개인 정보 유출 유형

개인 정보 유출은 여러 유형으로 나눌 수 있으며, 일반적으로 다양한 개인 정보 유출 위험 모델을 사용하여 개인 정보 유출 방지 위험을 측정할 수 있으며, 다양한 데이터에 대응합니다. 누출 민감화 알고리즘은 데이터의 민감도를 낮추는 데 사용됩니다. 일반적으로 개인 정보 유출 유형은 다음과 같습니다.

개인 신원 유출. 데이터 이용자가 어떤 수단을 통해서든 데이터 테이블의 데이터가 특정인의 것임을 확인하는 경우를 개인 신원 유출이라고 합니다. 개인 신원 유출이 가장 심각한 이유는 개인 신원 유출이 발생하면 데이터 사용자가 특정 개인에 대한 민감한 정보를 얻을 수 있기 때문입니다.

속성 유출, 데이터 사용자가 자신이 접근하는 데이터 테이블을 기반으로 개인에 대한 새로운 속성 정보를 알게 되는 것을 속성 유출이라고 합니다. 개인 신원 유출은 당연히 속성 유출로 이어지지만, 속성 유출은 독립적으로 발생할 수도 있습니다.

회원정보가 유출되었습니다. 데이터 이용자가 데이터 테이블에 개인의 데이터가 존재함을 확인할 수 있는 경우를 회원공개라 한다. 회원관계 유출의 위험은 상대적으로 적습니다. 개인정보 유출 및 속성 유출은 당연히 회원관계 유출을 의미하지만, 회원관계 유출은 독립적으로 발생할 수도 있습니다.

개인 정보 유출 위험 모델

데이터 분석가에게 데이터를 공개하면 개인 정보 유출 위험도 발생합니다. 데이터 분석 및 마이닝의 잠재력을 극대화하면서 개인정보 데이터 유출 위험을 특정 범위 내로 제한하는 것이 데이터 둔감화 기술의 궁극적인 목표입니다. 현재 개인 정보 보호 둔감화 분야에는 데이터의 개인 정보 유출 위험을 다양한 각도에서 측정하는 데 사용할 수 있는 여러 가지 모델이 있습니다.

추천 튜토리얼: "PHP 튜토리얼"

위 내용은 빅데이터 둔감화란 무엇을 의미하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.