Google、AI生成画像に透かし機能を追加するSynthIDツールを発表-AI-php.cn

ホームページ

テクノロジー周辺機器

Google、AI生成画像に透かし機能を追加するSynthIDツールを発表

王林

Sep 10, 2023 am 10:49 AM

道具ai

生成型人工知能の急速な発展に伴い、人々は AI によって生成されたコンテンツによってもたらされる潜在的なリスクにますます注目を集めています。たとえば、人々は意図的または非意図的に、AI によって生成された偽情報を広める可能性があります。特に画像生成の分野では、AI によって生成された画像と実際の画像を区別することが特に重要になっています。

透かしを追加することで AI によって生成されたコンテンツを区別しようとする研究がいくつかあります。 ICML 2023 の優れた論文「大規模言語モデルの透かし」では、テキスト生成の課題に対処するためにモデルの出力に透かしを追加する方法を提案しています

Google DeepMind が新しい言語モデルの開始を発表SynthID ツール。AI で生成された画像を識別するために、生成された画像に透かしを追加するために使用されます。現在、SynthID のベータ版はオンラインです。 Google CEO の Sundar Pichai 氏と Google DeepMind CEO の両方が Twitter で SynthID ツールの導入を転送しました

Google、AI生成画像に透かし機能を追加するSynthIDツールを発表

現在、SynthID は Google の Wensheng Diagram に使用できます。 Imagen モデルによって生成された画像には透かしが追加されますが、透かしの存在は目にはほとんど見えません。以下の図に示すように、画像に透かしが入っていても入っていなくても見た目に違いはありません。

Google、AI生成画像に透かし機能を追加するSynthIDツールを発表

#SynthID をスキャンできます。画像が Imagen

SynthID によって生成されたかどうかを評価するための画像は、保存後にフィルターの追加、色の変更、JPEG などのさまざまな非可逆圧縮スキームを使用した場合でも画質に影響しません。およびその他の変更を加えても、ウォーターマークは引き続き検出できます。

Google、AI生成画像に透かし機能を追加するSynthIDツールを発表

SynthID では、ウォーターマークと識別にそれぞれ 2 つのディープラーニングモデルが使用されています。 2 つのモデルは複数の画像セットで共同トレーニングされ、さまざまな目的に合わせて最適化されています。

現在、一部のユーザーは Google の Vertex AI プラットフォームツール (ベータ版) で SynthID を使用して操作できます。 Imagen

SynthID は、ウォーターマークが極端な画像処理に対して完全に耐性があることを保証するものではありませんが、人々が AI によって生成されたコンテンツを責任を持って使用できるようにする有望な技術的方法を提供することは注目に値します。。研究チームは、将来、オーディオ、ビデオ、テキストなどの他のモダリティ向けにも同様のツールがリリースされる可能性があると述べています。

以上がGoogle、AI生成画像に透かし機能を追加するSynthIDツールを発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

踊りましょう：私たちの人間のニューラルネットを微調整するための構造化された動きApr 27, 2025 am 11:09 AM

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク（C. elegansのものと同様）を広く研究してきました。ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにしますApr 27, 2025 am 11:08 AM

GoogleのGemini Advanced：Horizonの新しいサブスクリプションティア現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。ただし、Android Authorityのレポートは、今後の変更を示唆しています。最新のGoogle p

データ分析の加速がAIの隠されたボトルネックをどのように解決しているかApr 27, 2025 am 11:07 AM

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます：データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます！Apr 27, 2025 am 09:47 AM

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

建物のエージェントにGoogle ADKを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:42 AM

Googleのエージェント開発キット（ADK）のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

効果的な問題解決のためにLLMを介したSLMの使用 - 分析VidhyaApr 27, 2025 am 09:27 AM

まとめ： Small Language Model（SLM）は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル（LLM）よりも優れています。特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能（AI）および最近では生成AIも例外ではありません

コンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:26 AM

コンピュータービジョンのためのGoogleGeminiの力を活用：包括的なガイド大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。このガイドの利用方法については、

Gemini 2.0 Flash vs O4-Mini：GoogleはOpenaiよりもうまくやることができますか？Apr 27, 2025 am 09:20 AM

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。