AI 打败 AI:谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统
(资料图片)
8 月 2 日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。
IT之家经过查询得知,AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。
谷歌 Deep Mind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。
▲ 图源谷歌研究团队
据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%。
目前相关技术文档已经发布在 ArXiv 中,有兴趣的小伙伴们可以前往了解,不过 AI-Guardian 的开发者也同时指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用,考虑到别的模型也会随之跟进,因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。
关键词:
您可能也感兴趣:
为您推荐
暑期21天运动之旅 小区里一道特别的风景
城发环境股东户数增加2.85%,户均持股33.36万元
比亚迪7月销量解读:宋家族、汉家族、海鸥大涨
排行
最近更新
- AI 打败 AI:谷歌研究团队利用 GPT-4 击败 AI-Guardian 审核系统
- 战友谈牺牲消防员冯振:肉夹馍没有吃上,他却永远走了
- 曝三星S24系列跟进苹果小米窄边框设计 配6.65英寸屏
- 暴雨转战东北!吉林黑龙江将成强降雨中心 需警惕局地龙卷风
- 加密行业新“大瓜”:这人通过卖代币买了一颗555克拉黑钻
- 【五经普】关于单位清查,你想知道的都在这儿
- 中国银行业百强榜单出炉!
- 万安科技(002590)8月3日主力资金净卖出1.00亿元
- 好想你(002582)8月3日主力资金净买入150.24万元
- 巡回审判+网络直播!这场刑事案件值得一看……
- 国家减灾委、应急管理部针对河北严重洪涝灾害将国家救灾应急...
- 超强台风“卡努”向浙闽一带沿海靠近 海洋灾害Ⅱ级应急响应拉响
- 亚威股份(002559)8月3日主力资金净卖出2541.16万元
- 赛微电子:拟设控股子公司 在深圳投建MEMS项目
- 上证i播报:美股三大指数低开
- 出于安全考虑 肯尼亚暂停加密货币项目Worldcoin在当地的活动
- 考研失败人的后悔清单,码住了下一个上岸的就是你!
- ST远程(002692)8月3日主力资金净买入24.75万元
- 大雨暴雨即将抵达安徽
- 聊艺术教育、网络文学、全民科普……10位政协委员与您“云端...
- 强军之路 | “青”出于“蓝”,超燃宣传片致敬文职人员
- 战洪峰 防洪灾 保安全 保稳定:南开区降雨量最大 快速排净积水
- 135,159,179……之前投亲靠友的群众为何选择来到这个安置点?
- 海思科(002653)8月3日主力资金净卖出140.45万元
- 你猜,全国有多少个人叫“建军”?
- 探馆成都大运会丨这座美术馆藏满了大熊猫
- 黑龙江牡丹江市城区采取防汛应急措施:停课停工,市民非必要...
- 智能数据清洗:AI如何净化海量信息
- 助力大湾区高质量发展 港澳委员有话说
- 钜泉科技(688391.SH):向激励对象授予2.32万股限制性股票