>기술 주변기기 >일체 포함 >AI 설계가 데이터 개인정보 보호를 우선시해야 하는 이유

AI 설계가 데이터 개인정보 보호를 우선시해야 하는 이유

WBOY
WBOY앞으로
2023-04-12 21:13:121734검색
  • 인공 지능은 의료, 기술 및 기타 분야의 발전에 필수적이지만 데이터 개인 정보 보호가 어떻게 규제될지에 대한 우려가 있습니다.
  • 데이터 개인정보 보호는 기술 발전에 대한 대중의 신뢰를 얻는 데 매우 중요합니다.

데이터 개인 정보 보호는 소비자 데이터를 기반으로 하는 인공 지능(AI) 모델과 관련되는 경우가 많습니다. 사용자는 민감한 정보가 포함될 수 있는 데이터를 캡처하고 사용하는 자동화된 기술을 당연히 경계합니다. AI

모델은 중요한 결과를 제공하기 위해 데이터 품질에 의존하기 때문에 모델의 지속적인 존재는 개인 정보 보호가 디자인의 필수적인 부분인지에 달려 있습니다.

올바른 개인 정보 보호 및 데이터 관리 관행은 고객의 두려움과 우려를 완화하는 방법일 뿐만 아니라 회사의 핵심 조직 가치, 비즈니스 프로세스 및 보안 관리와 많은 관련이 있습니다. 개인정보 보호 문제는 광범위하게 연구되고 공개되었으며, 개인정보 보호 인식 조사 데이터에 따르면 개인정보 보호가 소비자에게 중요한 문제인 것으로 나타났습니다.

이러한 문제를 맥락에 맞게 해결하는 것이 중요하며, 소비자 지향 AI를 사용하는 회사의 경우 AI와 일반적으로 관련된 개인 정보 보호 문제를 해결하는 데 도움이 될 수 있는 여러 가지 방법과 기술이 있습니다.

일부 제품과 서비스에는 데이터가 필요하지만 다른 사람의 개인 정보를 침해할 필요는 없습니다.

인공 지능을 사용하는 비즈니스는 이미 개인 정보 보호와 관련하여 대중의 의심에 직면해 있습니다. 유럽소비자기구(European Consumer Organization)의 2020년 설문조사에 따르면 유럽인의 45~60%가 AI

가 개인 데이터의 오용을 더 많이 초래할 것이라는 데 동의합니다.

AI

알고리즘을 배우고 개선하기 위해 대규모 데이터 세트에 의존하는 인기 있는 온라인 서비스와 제품이 많이 있습니다. 이러한 데이터 세트의 일부 데이터는 개인 정보 보호에 가장 민감한 사용자에게도 개인 정보로 간주될 수 있습니다. 웹, 소셜 미디어 페이지, 휴대폰 및 기타 장치의 데이터 스트림으로 인해 기업이 기계 학습 시스템을 교육하는 데 사용하는 정보의 양이 늘어납니다. 일부 기업의 개인 데이터 남용 및 잘못된 관리로 인해 개인 정보 보호는 전 세계적으로 공공 정책 문제로 대두되고 있습니다.

우리가 수집하는 민감한 데이터의 대부분은 AI 지원 프로세스를 개선하기 위한 것입니다. 분석된 데이터의 대부분은 기계 학습 채택에 의해 주도됩니다. 이러한 데이터 세트를 기반으로 실시간으로 결정을 내리려면 복잡한 알고리즘이 필요하기 때문입니다. 검색 알고리즘, 음성 도우미, 추천 엔진은 실제 사용자 데이터를 기반으로 대규모 데이터 세트를 활용하는

AI 솔루션 중 일부에 불과합니다.

대량 데이터베이스에는 광범위한 데이터가 포함될 수 있으며, 가장 시급한 문제 중 하나는 이 데이터가 개인 식별이 가능하고 민감할 수 있다는 것입니다. 실제로 결정을 내리기 위해 알고리즘을 가르치는 것은 데이터가 누구와 관련되어 있는지 아는 것에 의존하지 않습니다. 따라서 이러한 제품을 개발하는 회사는 소스 데이터에서 사용자를 식별할 수 있는 몇 가지 방법을 사용하여 데이터 세트를 사유화하고 리버스 엔지니어링 및 식별을 피하기 위해 알고리즘에서 극단적인 경우를 제거하는 방법을 개발하는 데 중점을 두어야 합니다.

데이터 개인 정보 보호와 인공 지능의 관계는 매우 미묘합니다. 일부 알고리즘에는 필연적으로 개인 데이터가 필요할 수 있지만 이를 보다 안전하고 방해가 되지 않는 방식으로 사용할 수 있는 방법이 있습니다. 다음 방법은 개인 데이터를 다루는 회사가 솔루션의 일부가 될 수 있는 방법 중 일부일 뿐입니다.

개인 정보 보호를 염두에 둔 AI 설계

저희는 악의적인 행위자가 AI

모델의 취약점을 발견하고 모델의 출력에서 ​​잠재적으로 중요한 정보를 식별하는 리버스 엔지니어링 문제에 대해 논의했습니다. 리버스 엔지니어링은 이러한 과제에 직면하여 데이터베이스와 학습 데이터를 변경하고 개선하는 것이 AI 사용에 중요한 이유입니다.

예를 들어, 기계 학습 프로세스(적대 학습)에서 충돌하는 데이터 세트를 결합하는 것은 AI

알고리즘 출력의 결함과 편견을 구별하는 좋은 옵션입니다. 실제 개인 데이터를 사용하지 않는 합성 데이터 세트를 사용하는 옵션도 있지만 그 효과에 대해서는 여전히 의문이 있습니다.

헬스케어는 특히 민감한 개인 데이터를 다룰 때 인공 지능 및 데이터 개인정보 보호 거버넌스 분야의 선구자입니다. 또한 의료 절차든 데이터 처리든 동의에 관한 많은 작업을 수행합니다. 위험이 크고 법에 의해 시행됩니다.

AI 제품 및 알고리즘의 전반적인 설계에서 익명화 및 집계를 통해 사용자로부터 데이터를 분리하는 것은 사용자 데이터를 사용하여 AI 모델을 교육하는 모든 기업의 핵심입니다.

AI 기업의 개인정보 보호를 강화하기 위해 고려해야 할 사항은 많습니다.

  • 핵심 개인 정보 보호: 개발자의 레이더에 개인 정보 보호 기능을 적용하고 보안을 효과적으로 강화할 수 있는 방법을 찾습니다.
  • 데이터 세트를 익명화하고 집계하여 모든 개인 식별자와 고유 데이터 포인트를 제거합니다.
  • 회사에서 특정 데이터 세트에 액세스할 수 있는 사람을 엄격하게 제어하고 이 데이터에 액세스하는 방법을 지속적으로 감사합니다. 이는 과거 일부 데이터 침해의 원인이 되었기 때문입니다.
  • 더 많은 데이터가 항상 최선의 솔루션은 아닙니다. 최소한의 데이터로 알고리즘을 테스트하여 사용 사례를 실현하기 위해 수집하고 처리해야 하는 최소한의 데이터 양을 이해하세요.
  • 사용자 요청 시 개인 데이터를 제거하는 간단한 방법을 제공해야 합니다. 사용자 데이터를 의사 익명화만 하는 회사는 최신 데이터를 사용하여 모델을 지속적으로 재교육해야 합니다.
  • 알고리즘 교육, 감사, 품질 보증 등을 위해 완전히 익명 처리되고 되돌릴 수 없는 식별자를 갖춘 집계 및 합성 데이터세트와 같은 강력한 비식별화 전략을 활용하세요.
  • 제3자로부터 중요한 정보를 획득하고 사용하는 방법을 재고하여 사용자 자율성과 개인 정보를 보호하십시오. 데이터 소스를 면밀히 조사하고 사용자의 명시적이고 사전 동의가 있는 데이터 소스만 사용하십시오.
  • 위험 고려: 공격으로 인해 AI 시스템 출력에서 ​​사용자 개인 정보가 손상될 수 있습니까?

데이터 개인 정보 보호와 AI의 미래는 무엇입니까?

AI 시스템에는 대량의 데이터가 필요합니다. AI 알고리즘 훈련 개인 데이터가 없으면 일부 최고의 온라인 서비스와 제품이 작동할 수 없습니다. 그러나 알고리즘 자체와 전반적인 데이터 관리를 포함하여 데이터 획득, 관리 및 사용을 개선할 수 있는 방법은 많습니다. 개인정보를 존중하는 AI에는 개인정보를 존중하는 기업이 필요합니다.

이 기사의 저자: Einaras von Gravrock, CUJO AI의 CEO이자 창립자

위 내용은 AI 설계가 데이터 개인정보 보호를 우선시해야 하는 이유의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제