빅데이터 둔감화란 무엇인가요?
데이터 표백, 데이터 박탈 또는 데이터 변형으로도 알려진 빅 데이터 둔감화는 민감한 개인 데이터를 안정적으로 보호하여 개발 및 테스트에 사용할 수 있도록 둔감화 규칙을 통해 특정 민감한 정보를 변형하는 것을 의미합니다. 기타 비프로덕션 및 아웃소싱 환경에서 민감도가 낮아진 실제 데이터 세트를 안전하게 사용하세요.
개인 정보 민감화 기술
일반적으로 빅 데이터 플랫폼에서 데이터는 구조화된 형식으로 저장됩니다. 각 테이블은 여러 행으로 구성되고, 데이터의 각 행은 여러 열로 구성됩니다. 컬럼의 데이터 속성에 따라 데이터 컬럼은 일반적으로 다음과 같은 유형으로 나눌 수 있습니다.
사람의 위치를 정확하게 찾을 수 있는 컬럼을 주민번호, 주소, 이름 등 식별 가능한 컬럼이라고 합니다.
단일 열은 개인을 찾을 수 없지만 여러 정보 열을 사용하여 잠재적으로 사람을 식별할 수 있습니다. 이러한 열을 우편번호, 생일, 성별과 같은 준식별 열이라고 합니다. 미국 연구 논문에 따르면 우편번호, 생일, 성별 정보만으로 미국인의 87%를 식별할 수 있다고 합니다.
거래 금액, 질병, 소득 등 사용자의 민감한 정보가 포함된 열입니다.
사용자의 민감한 정보를 포함하지 않는 기타 열입니다.
개인정보 유출 유형
개인정보 유출은 여러 유형으로 나눌 수 있으며, 유형에 따라 일반적으로 다양한 개인정보 유출 위험 모델을 사용하여 개인정보 유출 방지 위험을 측정할 수 있습니다. 다름 데이터 둔감화 알고리즘은 데이터를 둔감하게 합니다. 일반적으로 개인 정보 유출 유형은 다음과 같습니다.
개인 신원 유출. 데이터 이용자가 어떤 수단을 통해서든 데이터 테이블의 데이터가 특정인의 것임을 확인하는 경우를 개인 신원 유출이라고 합니다. 개인 신원 유출이 가장 심각한 이유는 개인 신원 유출이 발생하면 데이터 사용자가 특정 개인에 대한 민감한 정보를 얻을 수 있기 때문입니다.
속성 유출, 데이터 사용자가 자신이 접근하는 데이터 테이블을 기반으로 개인에 대한 새로운 속성 정보를 알게 되는 것을 속성 유출이라고 합니다. 개인 신원 유출은 당연히 속성 유출로 이어지지만, 속성 유출은 독립적으로 발생할 수도 있습니다.
회원정보가 유출되었습니다. 데이터 사용자가 데이터 테이블에 개인의 데이터가 존재하는 것을 확인할 수 있는 경우를 회원누수라고 합니다. 회원관계 유출의 위험은 상대적으로 적습니다. 개인정보 유출 및 속성 유출은 당연히 회원관계 유출을 의미하지만, 회원관계 유출은 독립적으로 발생할 수도 있습니다.
추천 튜토리얼: "PHP"
위 내용은 빅데이터 둔감화란 무엇인가요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!