我們將進一步進行研究工作,以生成式人工智慧技術為基礎,深入探討其應用和產業發展現狀,總結優秀成果並推廣,促進產業高品質發展。 2023 年2 月,中國資訊通信研究院(以下簡稱「中國信通院」)依託人工智慧關鍵技術和應用評測工業和資訊化部重點實驗室AI 工程化推進委員會生成式AI 工作小組,正式啟動了生成式AI 技術和應用案例徵集工作。 5 月31 日下午,杭州通用人工智慧論壇大模型技術應用分論壇現場,首輪生成式AI 技術和應用優秀案例評選結果正式發布,網易智企旗下網易易盾成功入選優秀案例,並獲中國信通院頒發證書。
一、內容風控仍是網路安全重中之重
近年來,隨著網路的快速發展,網路數據呈現井噴式成長。多種表現形式的內容,例如文字、圖像、語音和視頻,已成為人們日常生活和工作中必不可少的一部分。內容形式多元化、內容創作門檻大幅降低為我們的生活帶來了極大的便利和效率,但由此引發的內容風控問題卻日益凸顯,數位內容安全已成為網路安全的重中之重。
二、傳統內容風控面臨新挑戰
數位內容風險管控具有廣泛涉及範圍和類型、精細的粒度、經常遭受對抗以及多樣化的需求和標準等特徵。過去,數位內容的風險控制通常是採用「後置 定制 感知」的方式進行識別和防護。
· 後置是指在有害類型或資料出現後,再針對性的進行解決,時效性上往 往是後置,沒有太明確的風險提前感知與防範能力。
· 定制是指有害資訊類型與範圍廣泛,由於缺乏可靠的通用能力,需要對不同的有害類型進行不斷地模型定制訓練,且每次定制都需從頭構建專業領域能力,時間長、成本高。
· 感知是指對有害訊息的識別往往是針對性感知,只針對目標的有害類型,沒有很好地利用場景內容訊息,即過往內容風控是感知層面識別,而非認知層面推理。
·同時,對於有害類型的定義往往存在許多主觀、邊界、細節上的差異,頻繁 地根據標準的多樣更替適配模型,無法真正做到差異化分級分層精準防護。
因此,如何提前感知與預防可能的安全風險、如何針對新出現的危害類型快速構建安全防護能力、如何全面綜合場景信息進行深入認知推理、如何差異化分級分層精準防護,已經成為數位內容安全重要的挑戰與困難。
三、AIGC 為內容風控帶來新思路
AIGC目前的發展使得提供更通用、前置、快速反應的數位內容風控能力成為可能。 AIGC注入了“世界知識”,從而擁有更廣泛的通用能力、創造能力、數據感知和知識融合能力。具體來說:
· 基於其通用能力,在此基礎之上進一步客製化領域安全能力,內容風控的時間週期與成本將大幅縮減;
· 基於其創造能力,內容風控將提前感知與預防未知風險,將”後置”轉變為”前置”,減少了未知有害類型的隱患;
· 基於其豐富的資訊注入與融合能力,充分利用並整合場景、背景、知識等有害類型以外的綜合訊息,將提升內容風控的場景理解與知識遷移能力,進行更深層認知邏輯推理與綜合防治;
· 基於其提示上下文學習範式以及思維推理過程,內容風控將在不更新模型的基礎上更加便捷的適應不同的標準,差異化分級分層精準防控。
四、網易易盾:生成式 AI 技術賦能內容風控
基於上述思路,網易易盾利用生成式AI 技術,研發了基於AIGC 生成對抗防控、小樣本有害資訊辨識、細粒度自適應辨識、綜合資訊邏輯推理等方案,以最強的矛打造最強的盾。具體如下:
(1)基於AIGC生成對抗防治方案
為了實現安全風險提前感知與預防,基於 AIGC 創造能力,網易易盾研發了基於 AIGC 生成對抗防控方案,將原有的「發現 布控」改進為「發現 生成 布控」。該方案將產生當前模型無法覆蓋或識別效果不佳的有害類型與樣本,並以當前主流的安全風險類型為基礎,進一步透過 AIGC 方法模擬安全風險變化趨勢,實現安全風險提前感知。進一步的布控方法包括結合 AIGC 生成樣本進行聯合訓練迭代防控模型、建構 AIGC 生成對抗庫定點防控等。
(2)基於AIGC小樣本有害資訊辨識方案
為了實現數位風控能力高效快速構建,基於 AIGC 的通用能力進一步的研發專業領域能力,我們研發了基於 AIGC 小樣本有害資訊辨識方案。將原有的從頭開始建構「通用能力 領域能力」方案改善為「AIGC 通用能力 通用能力補償 領域能力」建構的步驟。透過小樣本通用能力補償模組設計,以少量樣本的代價彌補了 AIGC 通用能力在專業場景應用的差距,同時直接連結到領域能力建構模組。使用「AIGC通用能力 通用能力補償」的方法,比起從頭開始建立通用能力,更快速、更有效率、成本更低。
(3)基於 AIGC 細粒度自適應識別方案
為了實現差異化分級分層精準防控,基於AIGC 提示上下文學習範式以及思維推理能力,我們研發了基於AIGC 細粒度自適應識別方案,將AIGC 的提示學習的思想應用到有害內容理解解決方案中,並且透過探索將多模態提示與推理輸入與不同標準對齊,使得透過不同的提示與推理輸入來繪製不同的標準。例如性感這個類型,以往很難再做更細粒度的拆解,或者拆解成本很高,現在可以更細粒度的拆解為比如沙灘場景的性感與夜店場景的性感,從而將類型標準細化為場景與樣本,較好的適應不同主觀、不同邊界的標準,更細緻地達到分級分層精準防控。
(4)基於 AIGC 綜合資訊邏輯推理解決方案
為了實現認知邏輯推理與綜合防控,基於 AIGC 的資訊注入與融合以及邏輯推理能力,我們研發了基於 AIGC 綜合資訊邏輯推理解決方案。改進原有的只針對有害資訊的感知識別,使其能夠綜合包括有害資訊在內的全部資訊進行認知推理。 AIGC的視覺語言模型被用於獲取除有害資訊以外的綜合訊息,並用於綜合推理。將原有的基於「領域能力的有害資訊擷取 決策」的方案改進為基於「領域能力有害資訊擷取 基於 AIGC 的通用知識擷取 基於視覺語言模型的資訊融合與綜合邏輯決策」的方案。
五、生成式 AI 為內容風控帶來顯著效益
在數位內容風控場景,網易易盾研發並融合生成式AI 能力,實現領域安全能力高效快速建構、安全風險提前感知與預防、認知推理與綜合防控、差異化分級分層精準防控。相關解決方案的推出,幫助易盾從能力、數據、資訊三個層面全面耦合了AIGC 能力,並在客戶實際應用的數位內容風控場景下,取得效果、成本、時效性、多樣性、適應性、穩定性等方面的顯著效益。
以上是權威榜單 | 網易易盾入選中國信通院生成式 AI 技術與應用優秀案例的詳細內容。更多資訊請關注PHP中文網其他相關文章!