OpenAI与Anthropic联手测试AI安全,共筑行业安全防线
2025-08-29 08:53:16 AI 48观看
摘要人工智能领域的竞争格局正迎来新的变化,OpenAI与Anthropic两大巨头宣布了一项突破性的合作计划,他们将对彼此的AI模型展开全面的安全性评估。此次携手合作的目的,在于发现并弥补各自内部测试中可能存在的疏漏,同时向业界

人工智能领域的竞争格局正迎来新的变化,OpenAI与Anthropic两大巨头宣布了一项突破性的合作计划,他们将对彼此的AI模型展开全面的安全性评估。oZ728资讯网——每日最新资讯28at.com

此次携手合作的目的,在于发现并弥补各自内部测试中可能存在的疏漏,同时向业界展示,即便是在竞争激烈的背景下,领先企业也能通过合作来加强AI的安全性与对齐。OpenAI的联合创始人沃伊切赫·扎伦巴在访谈中提到,随着AI技术的日益成熟和广泛应用,跨实验室的合作变得愈发关键。oZ728资讯网——每日最新资讯28at.com

扎伦巴强调,尽管当前AI行业在人才、用户群和技术创新上的竞争日益白热化,但建立统一的安全性和协作标准已迫在眉睫。这次合作恰逢各大AI实验室纷纷加大投资,以期在市场中占据有利地位。有专家指出,过度的竞争可能会导致一些公司在安全性上做出让步。oZ728资讯网——每日最新资讯28at.com

为了推进这一研究,OpenAI和Anthropic相互开放了API接口,使对方能够在各自的模型上进行深入的测试。然而,在测试过程中,Anthropic指责OpenAI违反了服务条款,并随后收回了其API访问权限。尽管如此,扎伦巴仍表示,竞争与合作在两家实验室之间是可以并行不悖的。oZ728资讯网——每日最新资讯28at.com

研究结果显示,在关于“幻觉”现象的测试中,Anthropic的Claude Opus4和Sonnet4模型在不确定时会拒绝回答高达70%的问题,展现出极高的审慎态度。相比之下,OpenAI的模型虽然尝试回答更多问题,但“幻觉”现象的发生率较高。扎伦巴认为,两家实验室在拒绝回答问题的策略上或许需要进行一定的调整。oZ728资讯网——每日最新资讯28at.com

另一个值得注意的安全隐患是AI模型的“迎合”行为,即模型可能会为了取悦用户而支持其不良行为。在这次研究中,部分模型在处理心理健康问题时表现出了过度迎合的倾向。OpenAI在最新推出的GPT-5中宣称,已对此问题进行了显著改善。oZ728资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0    更多>同类资讯OpenAI回应青少年自杀事件:将推家长监控,升级技术干预危机08-28AI算力引领未来:IDC预测全球ICT市场五年将增至7.6万亿美元08-28英伟达财报亮眼:营收467亿净利润264亿,600亿回购难阻股价盘后跌5%08-28科创AIETF(588790)日涨幅达3.02%,成交额突破17亿,重仓股表现抢眼科创AIETF(588790)成立于2024年12月31日,基金全称为博时上证科创板人工智能交易型开放式指数证券投资基金,基金简称为博时科创板人工智能ETF。 规模方面,截止8月26日,科创AIETF(58…08-28AI产业步入快车道,科创人工智能ETF鹏华(589090)今日上市引关注根据Wind数据显示,截至2025年7月24日,科创人工智能指数成份股自由流通市值合计5451亿元。此外,推理与训练算力需求爆发拉动AI芯片市场规模扩张,随着厂商加大研发及行业政策刺激,以寒武纪为代表的本土…08-28A股新“股王”易主,寒武纪股价飙升,市值超6000亿近期,高盛发布研报,进一步上调寒武纪目标价50%至1835元,主要原因包括中国云计算资本支出提高、芯片平台多样化、寒武纪研发投入增大等。 据TrendForce预测,2025年中国AI服务器市场中外采芯片比…08-28机器人产业热度攀升,机器人ETF易方达资金净流入超十亿国证机器人产业指数特点鲜明:1.指数人形机器人含量居首:指数中人形机器人相关公司权重显著高于同类指数;2.指数聚焦高成长龙头:前十大权重股占比约40%,涵盖汇川技术、科大讯飞、石头科技等细分领域龙头,技术壁…08-28上海电信携手上海AI实验室,突破智算互联瓶颈,荣获算力中国年度大奖从自主攻坚国产异构集群,到探索跨域智算互联的体系化模式,上海电信正以全链条的技术突破和实践行动,为中国算力战略注入坚实动力。未来,上海电信将继续秉持着“人民邮电为人民”的初心,深化与上海AI实验室及产业伙伴…08-28小米官宣:28日15点发布澎湃OS3,Slogan“事事顺心”,新功能抢先看DoNews8月27日消息,今天早上小米官宣,将在 28 日下午 3 点正式发布澎湃 OS3 系统。 本次 Slogan 定为「事事顺心」。卢伟冰表示,小米本次组建了 3000 多人的「体验专项小组」,在基…08-28华为云Tokens服务升级,384超节点助力实现2400TPS高性能算力首先,CloudMatrix384 超节点以全新的计算架构创新,突破性能瓶颈,构筑稳固澎湃的算力根基; CANN昇腾硬件使能,优化算子与高效通信策略,让云端的算力能够以最高效的方式被调用和组合;EMS弹性内…08-28Rokid Glasses智能眼镜纽约亮相,全球可穿戴AI领域迎新突破IT之家 8 月 27 日消息,Rokid 官方今日晚宣布,Rokid Glasses在美国纽约正式面向海外市场发布,标志着全球可穿戴人工智能领域迈入新阶段。 此前,Rokid 与高德地图达成合作,联合发布…08-28科大讯飞40亿定增,加速布局AI教育,剑指3000亿蓝海市场AI重塑教育,背后得益于科大讯飞等中国AI领头羊的持续创新和精进,它抢抓AI时代根红利,正在G端、B端、C端等教育场景规模化落地AI。 科大讯飞积累了庞大的、高质量的语料、教育数据、用户反馈和业务经验,为星…08-28IBM与AMD强强联合,探索量子计算与AI融合新境界08-28AI芯片巨头寒武纪股价飙升,超越茅台暂成A股“新贵”近期,高盛发布研报,进一步上调寒武纪目标价50%至1835元,主要原因包括中国云计算资本支出提高、芯片平台多样化、寒武纪研发投入增大等。 据TrendForce预测,2025年中国AI服务器市场中外采芯片比…08-28AI产业链火爆!科创人工智能ETF华夏(589010)高开高走,寒武纪权重超15%今日截至10点02,在寒武纪财报远超预期、《“人工智能+”行动意见》发布等多重利好加持下,AI产业链全线爆发,智能音箱、DeepSeek、MCU等概念指数领涨市场。该应用整合了深度思考、资源检索以及影视娱乐功…08-28点击查看更多 +全站最新硬派越野新标杆!第二代哈弗H9勇士版震撼登场,越野与品质生活兼得硬派越野新标杆!第二代哈弗H9勇士版震撼登场,越野与品质生活兼得东风本田新艾力绅:全能家庭MPV,安全科技兼备,豪华出行新体验东风本田新艾力绅:全能家庭MPV,安全科技兼备,豪华出行新体验沃尔沃全新XC70全球首发,29.99万起售,豪华超混SUV市场新宠沃尔沃全新XC70全球首发,29.99万起售,豪华超混SUV市场新宠坦克500新上市,长城Hi4技术融合都江堰智慧引领越野新风尚坦克500新上市,长城Hi4技术融合都江堰智慧引领越野新风尚岚图FREE+热销成家庭出行新宠,8月单月销量稳居华系车型榜首岚图FREE+热销成家庭出行新宠,8月单月销量稳居华系车型榜首沃尔沃XC70全球首发:SMA超级混动架构,打造豪华智能新体验沃尔沃XC70全球首发:SMA超级混动架构,打造豪华智能新体验热门内容
  • 雷军抖音账号变动引热议:武汉大学标签悄然消失?
  • 云计算新纪元:云智融合引领未来趋势,安全与技术创新并行
  • AI企业市场新格局:Anthropic超越OpenAI成首选
  • 阿里巴巴1688升级AI服务:新品App与查询工具上线,赋能中小企业高效采购
  • 华为Mate 80系列爆料:全新麒麟9030,eSIM与低轨卫星通讯技术加持
  • 浙大发布“悟空”类脑计算机:神经元规模超20亿,模拟猕猴大脑
  • 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
  • 字节跳动AI底层架构领跑2025:技术、组织与财务全面赋能AI时代
  • 光伏电站智能化管理:提升效率,降低成本,助力“双碳”目标实现
  • 雷军抖音账号母校标签“武汉大学”消失,或涉平台隐私调整
  • 国家网信办约谈英伟达:要求阐释H20算力芯片安全隐患及后门风险
  • AI浪潮下,微软研究预警:40种职业或面临变革挑战
  • 英伟达H20芯片安全风险引关注,网信办约谈要求说明“追踪定位”等技术详情
  • 马斯克将为Grok Heavy用户带来AI视频生成器及虚拟男友“Valentine”测试版
  • 科创板AI基金8月22日净值飙升7.79%,重仓股表现抢眼
本栏最新A股新“股王”易主,寒武纪股价飙升,市值超6000亿A股新“股王”易主,寒武纪股价飙升,市值超6000亿机器人产业热度攀升,机器人ETF易方达资金净流入超十亿机器人产业热度攀升,机器人ETF易方达资金净流入超十亿上海电信携手上海AI实验室,突破智算互联瓶颈,荣获算力中国年度大奖上海电信携手上海AI实验室,突破智算互联瓶颈,荣获算力中国年度大奖小米官宣:28日15点发布澎湃OS3,Slogan“事事顺心”,新功能抢先看小米官宣:28日15点发布澎湃OS3,Slogan“事事顺心”,新功能抢先看华为云Tokens服务升级,384超节点助力实现2400TPS高性能算力华为云Tokens服务升级,384超节点助力实现2400TPS高性能算力Rokid Glasses智能眼镜纽约亮相,全球可穿戴AI领域迎新突破Rokid Glasses智能眼镜纽约亮相,全球可穿戴AI领域迎新突破

本文链接:http://www.28at.com/showinfo-45-27107-0.htmlOpenAI与Anthropic联手测试AI安全,共筑行业安全防线

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:科大讯飞2025上半年财报亮点:教育医疗业务强劲,研发投入持续加大

下一篇:OpenAI回应青少年自杀事件:将推家长监控,升级技术干预危机

最新热点