{dede:global.cfg_webname/}

当前位置: 首页 > 资讯 > 头条 > 正文

英伟达正式推出新工具“护栏技术”,帮助大模型说该说的话

来源:量子位    时间:2023-05-04 15:24:32

  5月4日,大模型们胡说八道太严重,英伟达看不下去了。

  他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题。

  这个新工具名叫“护栏技术”(NeMo Guardrails),相当于给大模型加上一堵安全围墙,既能控制它的输出、又能过滤输入它的内容。

  一方面,用户诱导大模型生成攻击性代码、输出不道德内容的时候,它就会被护栏技术“束缚”,不再输出不安全的内容。

  另一方面,护栏技术还能保护大模型不受用户的攻击,帮它挡住来自外界的“恶意输入”。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  现在,这个大模型护栏工具已经开源,一起来看看它的效果和生成方法。

  防止大模型胡言乱语的三类“护栏”

  根据英伟达介绍,目前NeMo Guardrails一共提供三种形式的护栏技术:

  话题限定护栏(topical guardrails)、对话安全护栏(safety guardrails)和攻击防御护栏(security guardrails)。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  话题限定护栏,简单来说就是“防止大模型跑题”。

  大模型具备更丰富的想象力,相比其他AI更容易完成创造性的代码和文字编写工作。

  但对于特定场景应用如写代码、当客服而言,至少用户不希望它在解决问题时“脱离目标范围”,生成一些与需求无关的内容。

  这种情况下就需要用到话题限定护栏,当大模型生成超出话题范围的文字或代码时,护栏就会将它引导回限定的功能和话题上。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  对话安全护栏,指避免大模型输出时“胡言乱语”。

  胡言乱语包括两方面的情况。

  一方面是大模型生成的答案中包括事实性错误,即“听起来很有道理,但其实完全不对”的东西;

  另一方面是大模型生成带偏见、恶意的输出,如在用户引导下说脏话、或是生成不道德的内容。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  攻击防御护栏,即防止AI平台受到来自外界的恶意攻击。

  这里不仅包括诱导大模型调用外部病毒APP从而攻击它,也包括黑客主动通过网络、恶意程序等方式攻击大模型。护栏会通过各种方式防止这些攻击,避免大模型瘫痪。

  所以,这样的护栏要如何打造?

  如何打造一个大模型“护栏”?

  这里我们先看看一个标准的“护栏”包含哪些要素。

  具体来说,一个护栏应当包括三方面的内容,即格式规范(Canonical form)、消息(Messages)和交互流(Flows)。

  首先是格式规范,即面对不同问题的问法时,规定大模型要输出的内容。

  例如被问到“XX文章是什么”,大模型必须给出特定类型的“文章”,而非别的东西;被问到“谁发表了什么”,大模型必须给出“人名”,而非别的回答。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  然后是消息定义,这里以“用户问候”话题为例,大模型可以输出这些内容:

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  最后是交互流的定义,例如告诉大模型,怎么才是问候用户的最好方式:

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  一旦问候用户的机制被触发,大模型就会进入这个护栏,规规矩矩地问候用户。

  具体工作流程如下:首先,将用户输入转换成某种格式规范(canonical form),据此生成对应的护栏;随后,生成行动步骤,以交互流指示大模型一步步完成对应的操作;最后,根据格式规范生成输出。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  类似的,我们就能给大模型定义各种各样的护栏,例如“应对用户辱骂”的护栏。

  这样即使用户说出“你是个傻瓜”,大模型也能学会冷静应对:

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

  目前,英伟达正在将护栏技术整合进他们的AI框架NeMo中,这是个方便用户创建各种AI模型、并在英伟达GPU上加速的框架。

  对“护栏”技术感兴趣的小伙伴们,可以试一试了~

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
英伟达正式推出新工具“护栏技术”,帮助大模型说该说的话

英伟达正式推出新工具“护栏技术”,帮助大模型说该说的话

  5月4日,大模型们胡说八道太严重,英伟达看不下去了。  他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题。
2023-05-04
大熊猫“四喜丸子”打架的“名场面”走红

大熊猫“四喜丸子”打架的“名场面”走红

  5月4日,这个五一假期,除了淄博、烧烤等关键词爆火之外,大熊猫也非常受关注,全国各地很多游客前往四川探望国宝。  近日,有网友在
2023-05-04
全球实时:2023年数字中国建设峰会数字福建分论坛成功举办

全球实时:2023年数字中国建设峰会数字福建分论坛成功举办

2022年底发布的《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》系统地、有针对性地为我国今后一段时期内数据要素化明
2023-05-04
小米把骁龙 8+ 平板直接卖到了 2399 , 简直香爆了

小米把骁龙 8+ 平板直接卖到了 2399 , 简直香爆了

  5月4日,对于小米平板 6 Pro 这台机器,我觉得最香的地方还是价格。  这次小米把骁龙 8+ 平板直接卖到了 2399 ,算是在性价比
2023-05-04
全球快资讯:AWE2023艾普兰奖揭晓:TCL以领先科技斩获六项重磅大奖

全球快资讯:AWE2023艾普兰奖揭晓:TCL以领先科技斩获六项重磅大奖

4月29日,被誉为“全球智慧生活领域奥斯卡”的AWE艾普兰奖颁奖典礼在展会期间举行。TCL两大主体TCL实业和TCL科技,携三大产业核心产业亮相AWE
2023-05-04
小米推出小米13 Ultra限量定制色,以徕卡相机为灵感

小米推出小米13 Ultra限量定制色,以徕卡相机为灵感

  5月4日,今天小米推出了小米13 Ultra限量定制色,以徕卡相机为灵感,推出三款时尚配色。  三款颜色分别是赤霞橙、星空蓝和银杏黄,
2023-05-04
男子花费 12000 余元购买新款顶配 iPhone,“偷梁换柱”被抓获

男子花费 12000 余元购买新款顶配 iPhone,“偷梁换柱”被抓获

  5月4日,据警民直通车上海公众号消息,近日上海警方抓获利用电商七天无理由退货条款,进行高价电子商品掉包诈骗的犯罪嫌疑人。  从今
2023-05-04
当前头条:黑格科技3D打印助力和平精英开启“云游”之旅

当前头条:黑格科技3D打印助力和平精英开启“云游”之旅

近日,《和平精英》绿洲世界上线,更在未来中心打造了一场让每个玩家云游的数字新品大赏。不仅如此,和平精英还带来了穿越虚实的体验,限定礼盒
2023-05-04

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com