OpenAI称其最新的GPT-40模型风险级别为‘中等’

OpenAI发布了gpt - 40系统卡,这是一份研究文件,概述了该初创公司在发布最新型号之前进行的安全措施和风险评估。 gpt - 40于今年5...

OpenAI发布了gpt - 40系统卡,这是一份研究文件,概述了该初创公司在发布最新型号之前进行的安全措施和风险评估。

gpt - 40于今年5月公开发布。在首次亮相之前,OpenAI使用了一组外部红队,或安全专家试图找到系统中的弱点,以发现模型中的关键风险(这是相当标准的做法)。他们研究了gpt - 40可能会产生未经授权的声音克隆、色情和暴力内容、或复制有版权的音频块等风险。现在,结果正在公布。

根据OpenAI自己的框架,研究人员发现gpt - 40具有“中等”风险。总体风险等级是从网络安全、生物威胁、说服和模型自治四个总体类别的最高风险等级中得出的。所有这些都被认为是低风险的,除了说服,研究人员发现gpt - 40的一些写作样本可能比人类写的文本更能左右读者的观点,尽管模型的样本总体上并不更有说服力。

OpenAI发言人Lindsay McCallum r 米告诉The Verge,系统卡包括由内部团队创建的准备评估,以及OpenAI网站上列出的模型评估和威胁研究(METR)和阿波罗研究(Apollo Research)等外部测试人员,这两家公司都为人工智能系统进行评估。

这并不是OpenAI发布的第一个系统卡;GPT-4、有视力的GPT-4和DALL-E - 3也进行了类似的测试,并发布了研究结果。但OpenAI在关键时刻发布了这款系统卡。从公司员工到州参议员,该公司对其安全标准的批评不绝于耳。就在gpt - 40系统卡发布前几分钟,the Verge独家报道了参议员伊丽莎白·沃伦(Elizabeth Warren)和众议员洛里·特拉汉(Lori Trahan)的一封公开信,信中要求就OpenAI如何处理举报人和安全审查给出答案。这封信概述了许多被公开提及的安全问题,包括首席执行官萨姆·奥特曼(Sam Altman)在2023年因董事会的担忧而短暂离开公司,以及一名安全高管的离职,该高管声称“安全文化和流程已经让位于闪亮的产品。”

此外,该公司在美国总统大选前夕发布了一款功能强大的多式联运车型。尽管OpenAI希望强调该公司正在测试真实场景以防止误用,但该模型显然存在意外传播错误信息或被恶意行为者劫持的潜在风险。

有很多人呼吁OpenAI提高透明度,不仅仅是模型的训练数据(它在YouTube上训练吗?),还有它的安全测试。在OpenAI和许多其他领先的人工智能实验室所在的加利福尼亚州,州参议员斯科特·维纳(Scott Wiener)正在努力通过一项法案,以规范大型语言模型,包括限制公司在其人工智能被用于有害方式时承担法律责任。如果该法案获得通过,OpenAI的前沿模型在向公众提供模型之前必须遵守国家规定的风险评估。但gpt - 40系统卡最大的收获是,尽管有外部红队和测试人员,但其中很多都依赖于OpenAI来评估自己。

本文来自作者[絮恋]投稿,不代表吴茳号立场,如若转载,请注明出处:https://520xc.com/zskp/202508-3162.html

(11)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 絮恋
    絮恋 2025年08月13日

    我是吴茳号的签约作者“絮恋”!

  • 絮恋
    絮恋 2025年08月13日

    希望本篇文章《OpenAI称其最新的GPT-40模型风险级别为‘中等’》能对你有所帮助!

  • 絮恋
    絮恋 2025年08月13日

    本站[吴茳号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 絮恋
    絮恋 2025年08月13日

    本文概览:OpenAI发布了gpt - 40系统卡,这是一份研究文件,概述了该初创公司在发布最新型号之前进行的安全措施和风险评估。 gpt - 40于今年5...

    联系我们

    邮件:吴茳号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们