合成データジェネレーターで AI バイアスの問題を回避する方法-AI-php.cn

ホームページ

テクノロジー周辺機器

合成データジェネレーターで AI バイアスの問題を回避する方法

王林

Apr 26, 2023 pm 02:40 PM

AIデータジェネレーター

合成データジェネレーターで AI バイアスの問題を回避する方法

AI バイアスは、個人にさまざまな影響を与える可能性がある深刻な問題です。

人工知能が進歩するにつれて、データサイエンスソリューションを取り巻く疑問や倫理的ジレンマが表面化し始めています。人間は意思決定プロセスから自らを遠ざけているため、これらのアルゴリズムによる判断が偏見や差別的でないことを保証したいと考えています。人工知能は常に監視されなければなりません。人工知能は大量のデータを処理できる予測分析に基づくデジタルシステムであるため、この偏りの可能性が人工知能によって引き起こされているとは言えません。問題ははるかに早い段階で、監視されていないデータがシステムに「供給」されることで始まります。

歴史を通じて、人類は常に偏見と差別を抱えてきました。私たちの行動はすぐには変わらないようです。人間とは異なり、問題の影響を受けないと思われるシステムやアルゴリズムにはバイアスが存在します。

人工知能バイアスとは何ですか?

AI バイアスは、データの取得方法により、関心のあるグループを正しく表さないサンプルが生成される場合に、データ関連分野で発生します。これは、特定の人種、信条、肌の色、性別の人々がデータサンプル内で過小評価されていることを示唆しています。これにより、システムが差別的な結論を下す可能性があります。また、データサイエンスコンサルティングとは何なのか、なぜそれが重要なのかという疑問も生じます。

AI におけるバイアスとは、AI システムが意図的に特定のグループの人々を優遇するように作成されていることを意味するものではありません。人工知能の目標は、個人が指示ではなく例を通じて自分の欲求を表現できるようにすることです。つまり、AI に偏りがあるとすれば、それはデータに偏りがあるからだけである可能性があります! 人工知能の意思決定は現実世界で動作する理想化されたプロセスであり、人間の欠陥を隠すことはできません。ガイド付き学習を組み込むことも有益です。

なぜそうなるのですか?

人工知能のバイアスの問題は、データにアルゴリズムによる適切な結論を導き出すのに役立つ先入観に基づく人間の選択が含まれている可能性があるために発生します。 AI バイアスの実例はいくつかあります。人種差別的な人々や有名なドラァグクイーンは、Google のヘイトスピーチ検出システムによって差別されました。 10 年間、アマゾンの人事アルゴリズムには主に男性従業員に関するデータが入力され、その結果、女性候補者がアマゾンでの仕事に適格であると評価される可能性が高くなりました。

マサチューセッツ工科大学 (MIT) のデータサイエンティストによると、顔認識アルゴリズムは、少数派、特に少数派の女性の顔を分析する際にエラー率が高くなります。これは、トレーニング中にアルゴリズムに主に白人男性の顔が与えられたためである可能性があります。

Amazon のアルゴリズムは、米国内の 1 億 1,200 万人のプライムユーザーだけでなく、サイトに頻繁にアクセスし、他の商品を頻繁に使用するさらに数千万人の個人からのデータに基づいてトレーニングされているため、同社は消費者の購買行動を予測できます。。 Google の広告ビジネスは、毎日行われる数十億のインターネット検索と市場に流通している 25 億台の Android スマートフォンからのデータを基にした予測アルゴリズムに基づいています。これらのインターネット巨人は巨大なデータ独占を確立しており、人工知能の分野ではほぼ克服できない優位性を持っています。

合成データは AI バイアスへの対処にどのように役立ちますか?

理想的な社会では、肌の色、性別、宗教、性的指向に関係なく、誰も偏見を持たず、誰もが平等な機会を得ることができます。しかし、それは現実の世界にも存在しており、特定の分野で多数派と異なる人々は仕事を見つけたり教育を受けたりするのがより困難であり、多くの統計で過小評価されています。 AI システムの目標によっては、そのような人々はスキルが低く、これらのデータセットに含まれる可能性が低く、良いスコアを達成するのに適していないという誤った推論につながる可能性があります。

一方、AI データは、偏りのない AI の方向への大きな一歩となる可能性があります。考慮すべき概念は次のとおりです。

実際のデータを見て、どこにバイアスがあるかを確認します。次に、データは実世界のデータと観察可能なバイアスを使用して合成されます。理想的な仮想データジェネレーターを作成したい場合は、偏ったデータを公平とみなされるデータに変換しようとする公平性の定義を含める必要があります。

AI で生成されたデータは、あまり変化がないデータセットや、不偏のデータセットを形成するほど大きくないデータセットのギャップを埋める可能性があります。サンプルサイズが大きい場合でも、一部の人が除外されたり、他の人に比べて過小評価されたりする可能性があります。この問題は合成データを使用して解決する必要があります。

データマイニングは、不偏データを生成するよりもコストが高くなる可能性があります。実際のデータ収集には、測定、インタビュー、大量のサンプルが必要で、いずれにしても多大な労力が必要です。 AI によって生成されるデータは安価であり、データサイエンスと機械学習アルゴリズムの使用のみが必要です。

ここ数年、多くの営利合成データ会社の幹部や、Synthea の創設者である MitreCorp. は、自社のサービスに対する関心が急増していることに気づいています。しかし、人生を変える意思決定を行うためにアルゴリズムがより広く使用されるようになるにつれて、顔認識、犯罪予測、医療上の意思決定など、影響の大きい他の分野において、アルゴリズムが人種差別、性差別、有害な偏見を悪化させることが判明しています。研究者らは、アルゴリズムで生成されたデータに基づいてアルゴリズムをトレーニングすると、AI システムが多くの状況で有害なバイアスを永続させる可能性が高まると述べています。

以上が合成データジェネレーターで AI バイアスの問題を回避する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

AIのプロンプトを微調整する方法は、職場で競争力のあるエッジを求めますApr 17, 2025 am 11:23 AM

あなたは急いで締め切りに間に合い、ChatGptを使用してマーケティングメールを作成することにしました。 AIプロンプトを「プロの100ワードマーケティングメールを書く」と入力します。結果は、トーンやストルックを欠いている一般的な専門用語で満たされたドキュメントです

SQLのランク関数Apr 17, 2025 am 11:20 AM

導入何千もの取引と多数の貢献要因から会社のトップセールス代表を特定する必要があると想像してください。従来の方法は面倒になります。 SQLのランキング関数は、コント用の効率的なソリューションを提供します

潜在的なメディケイド削減は、母体の医療を脅かしますApr 17, 2025 am 11:18 AM

下院と上院は、週末にわたって予算の枠組みに同意しました。このフレームワークでは、不釣り合いに富裕層や資金に渡される減税の支払いを支払うために支出削減を求めています。

スノーフレークのCEOは、AI ROIがデータを正しくすることから始めると言いますApr 17, 2025 am 11:13 AM

「AIはビッグバンではないはずです」とSnowflakeのCEOは座り込みで私に言った。「それは、あらゆる段階で価値を示す一連の小さなプロジェクトであるべきです。」しかし、Ramaswamyが指摘したように、それは注意のように聞こえるかもしれませんが、実際には戦略です。インターで

毎日Deezerにアップロードされた20,000個のAI生成された曲Apr 17, 2025 am 11:11 AM

「AI生成されたコンテンツは、Deezerのようなストリーミングプラットフォームを洪水にし続けており、それが遅くなる兆候は見当たりません」と、ディーザーの最高イノベーション責任者であるAurelien Heraultは声明で述べています。洪水の兆候はありませんが、ディーザーは持っています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

WebStorm Mac版

便利なJavaScript開発ツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、