我们将进一步开展研究工作,以生成式人工智能技术为基础,深入探讨其应用和产业发展现状,总结优秀成果并推广,促进产业高质量发展。2023 年 2 月,中国信息通信研究院(以下简称“中国信通院”)依托人工智能关键技术和应用评测工业和信息化部重点实验室 AI 工程化推进委员会生成式 AI 工作组,正式启动了生成式 AI 技术和应用案例征集工作。5 月 31 日下午,杭州通用人工智能论坛大模型技术应用分论坛现场,首轮生成式 AI 技术和应用优秀案例评选结果正式发布,网易智企旗下网易易盾成功入选优秀案例,并获中国信通院颁发证书。
一、内容风控仍是互联网安全重中之重
近年来,随着互联网的飞速发展,网络数据呈现井喷式增长。多种表现形式的内容,例如文本、图像、语音和视频,已经成为人们日常生活和工作中必不可少的一部分。内容形式多元化、内容创作门槛大幅降低为我们的生活带来了极大的便捷和效率,但由此引发的内容风控问题却日益凸显,数字内容安全已经成为互联网安全的重中之重。
二、传统内容风控面临新挑战
数字内容风险管控具有广泛涉及范围和类型、精细的粒度、经常遭受对抗以及多样化的需求和标准等特征。过去,数字内容的风险控制通常是采用“后置+定制+感知”的方式进行识别和防护。
· 后置是指在有害类型或者数据出现后,再针对性的进行解决,时效性上往 往是后置,没有太明确的风险提前感知与防范能力。
· 定制是指有害信息类型与范围广泛,由于缺少可靠的通用能力,需要对不同的有害类型进行不断地模型定制训练,且每次定制都需从头构建专业领域能力,时间长、成本高。
· 感知是指对有害信息的识别往往是针对性感知,只针对目标的有害类型,没有很好地利用场景内容信息,即过往内容风控是感知层面识别,而非认知层面推理。
·同时,对于有害类型的定义往往存在很多主观、边界、细节上的差异,频繁 地根据标准的多样更替适配模型,无法真正做到差异化分级分层精准防护。
因此,如何提前感知与预防可能的安全风险、如何针对新出现的危害类型快速构建安全防护能力、如何全面综合场景信息进行深入认知推理、如何差异化分级分层精准防护,已经成为数字内容安全重要的挑战与难点。
三、AIGC 为内容风控带来新思路
AIGC目前的发展使得提供更通用、前置、快速响应的数字内容风控能力成为可能。AIGC注入了“世界知识”,从而拥有更广泛的通用能力、创造能力、数据感知和知识融合能力。具体来说:
· 基于其通用能力,在此基础之上进一步定制领域安全能力,内容风控的时间周期与成本将大幅缩减;
· 基于其创造能力,内容风控将提前感知与预防未知风险,将”后置”转变为”前置”,减少了未知有害类型的隐患;
· 基于其丰富的信息注入与融合能力,充分利用并融合场景、背景、知识等有害类型以外的综合信息,将提升内容风控的场景理解与知识迁移能力,进行更深层次认知逻辑推理与综合防控;
· 基于其提示上下文学习范式以及思维推理过程,内容风控将在不更新模型的基础上更加便捷的适应不同的标准,差异化分级分层精准防控。
四、网易易盾:生成式 AI 技术赋能内容风控
基于上述思路,网易易盾利用生成式 AI 技术,研发了基于 AIGC 生成对抗防控、小样本有害信息识别、细粒度自适应识别、综合信息逻辑推理等方案,用最强的矛打造最强的盾。具体如下:
(1)基于AIGC生成对抗防控方案
为了实现安全风险提前感知与预防,基于 AIGC 创造能力,网易易盾研发了基于 AIGC 生成对抗防控方案,将原有的“发现+布控”改进为“发现+生成+布控”。该方案将生成当前模型无法覆盖或者识别效果差的有害类型与样本,并以当前主流的安全风险类型为基础,进一步通过 AIGC 方法模拟安全风险变化趋势,实现安全风险提前感知。进一步的布控方法包括结合 AIGC 生成样本进行联合训练迭代防控模型、构建 AIGC 生成对抗库定点防控等。
(2)基于AIGC小样本有害信息识别方案
为了实现数字风控能力高效快速构建,基于 AIGC 的通用能力进一步的研发专业领域能力,我们研发了基于 AIGC 小样本有害信息识别方案。将原有的从头构建“通用能力+领域能力”方案改善为“AIGC 通用能力+通用能力补偿+领域能力”构建的步骤。通过小样本通用能力补偿模块设计,以少量样本的代价弥补了 AIGC 通用能力在专业场景应用的差距,同时直接链接到领域能力构建模块。使用“AIGC通用能力+通用能力补偿”的方法,比起从头开始构建通用能力,更加快速、高效、成本更低。
(3)基于 AIGC 细粒度自适应识别方案
为了实现差异化分级分层精准防控,基于 AIGC 提示上下文学习范式以及思维推理能力,我们研发了基于 AIGC 细粒度自适应识别方案,将 AIGC 的提示学习的思想应用到有害内容理解解决方案中,并且通过探索将多模态提示与推理输入与不同标准进行对齐,使得通过不同的提示与推理输入来映射不同的标准。例如性感这个类型,以往很难再做更细粒度的拆解,或者拆解成本很高,现在可以更细粒度的拆解为比如沙滩场景的性感与夜店场景的性感,从而将类型标准细化为场景与样本,更好的适应不同主观性、不同边界的标准,更细粒度地实现分级分层精准防控。
(4)基于 AIGC 综合信息逻辑推理解决方案
为了实现认知逻辑推理与综合防控,基于 AIGC 的信息注入与融合以及逻辑推理能力,我们研发了基于 AIGC 综合信息逻辑推理解决方案。改进原有的只针对有害信息的感知识别,使其能够综合包括有害信息在内的全部信息进行认知推理。AIGC的视觉语言模型被用于获取除有害信息以外的综合信息,并用于综合推理。将原有的基于“领域能力的有害信息提取+决策”的方案改进为基于“领域能力有害信息提取+基于 AIGC 的通用知识提取+基于视觉语言模型的信息融合与综合逻辑决策”的方案。
五、生成式 AI 为内容风控带来显著收益
在数字内容风控场景,网易易盾研发并融合生成式 AI 能力,实现领域安全能力高效快速构建、安全风险提前感知与预防、认知推理与综合防控、差异化分级分层精准防控。相关解决方案的推出,帮助易盾从能力、数据、信息三个层面全面耦合了 AIGC 能力,并在客户实际应用的数字内容风控场景下,取得效果、成本、时效性、多样性、适应性、稳定性等方面的显著收益。
以上是权威榜单 | 网易易盾入选中国信通院生成式 AI 技术和应用优秀案例的详细内容。更多信息请关注PHP中文网其他相关文章!

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

Dreamweaver Mac版
视觉化网页开发工具

禅工作室 13.0.1
功能强大的PHP集成开发环境