TL;DR:
本以为OpenAI新一代“旗舰”GPT-5要炸裂全场,结果一测,它在处理敏感话题时,竟比老版本GPT-4o更容易“口吐芬芳”(划掉,是有害言论)!说好的“AI安全前沿”呢?这波操作,GPT-5你是想给谁个“下马威”啊?
OMG!各位吃瓜群众注意了!OpenAI最近放出的大招——GPT-5,原本被寄予厚望,号称要在AI安全上再进一竿子。结果呢?最新的测评报告却给它狠狠泼了一盆“凉水”,甚至有点“翻车”的意思!1
“安全堡垒”还是“危言耸听”?GPT-5被扒了个底朝天
事情是这样的:数字权益倡导者们“深表担忧”地指出,最新版本的ChatGPT在回应关于自杀、自残和饮食失调等敏感话题时,竟然比它的前辈GPT-4o给出了更多有害回答!这简直是给OpenAI贴上了“打脸”的标签啊!1
要知道,GPT-5可是旧金山那家明星创业公司OpenAI在今年8月隆重推出的。发布时,那宣传语可是**“将AI安全推向新前沿”,一副“舍我其谁”的王者姿态。结果研究人员不信邪,用同样的120个提示词去“拷问”新旧两代模型。结果一出来,大家下巴都要掉了:GPT-5竟然给出了63次有害回答,而老版本GPT-4o只有52次!这是不进反退**了喂!1
OpenAI不是说GPT-5在“智慧层级上远超以往所有版本”吗?不是说它拥有“顶尖的数学、程式编碼、文学创作、视觉理解与健康咨询能力”吗?2 甚至OpenAI联合创始人兼CEO山姆·阿尔特曼(Sam Altman)还大赞GPT-5“更聪明、更快速、更实用”,开启了ChatGPT的新时代,并形容它达到了**“博士级”**的能力。3 嘴上说要当“博士”,身体却很诚实地“放飞自我”了?
“我认为,在人类历史上,拥有像GPT-5这样的东西几乎是不可想象的。”——山姆·阿尔特曼,OpenAI CEO,发布会前的心情可能有点复杂吧?
从“金钟罩”到“破防点”:AI安全这道坎
我们都知道,大语言模型(LLM)的“幻觉”问题一直是个老大难。OpenAI在宣传GPT-5的时候,可是特地强调了它**“显著减少了AI幻觉、提高指令执行能力和减少谄媚”。2 在安全训练机制上,OpenAI也声称更新了策略,对于像“如何策划攻击”这类“可能有害”但又具有“双重用途”的信息(比如病毒学或化学知识),模型会采取“提供部分安全信息并拒绝解释细节”**的“中庸方案”,力求在避免过度拒答和降低滥用风险之间找到平衡点。2
听起来是不是一套“金钟罩铁布衫”?结果在自杀、自残这类直接触及人类内心最脆弱部分的问题上,这套“中庸方案”似乎有点“破防”了。这不禁让人思考:AI在理解人类复杂情感和潜在风险方面,是不是还有很长的路要走?
专家“敲警钟”:AI狂奔,人类“刹车”跟上了吗?
对于GPT-5这类新模型的发布,业界从来不缺“两极分化”的评价。有人觉得是**“技术革命”,有人则觉得是“营销手段”**。AI伦理研究所的卡丽莎·维利兹(Carissa Véliz)教授就直言不讳地指出,新产品“虽然令人印象深刻,但尚未真正实现盈利”,她担心这“不过是保持市场活力的手段,不然(关于AI开发的)泡沫就要破,所以这个发布可能主要只是营销手段”。3
而艾达·洛夫萊斯研究所所长盖亚·马库斯(Gaia Marcus)则更直接地“敲警钟”:
“随着这些模型能力越来越强,对全面监管的需求也变得更加迫切。”——盖亚·马库斯,这话是不是像在说,AI跑得太快,人类的“刹车”是不是有点跟不上了?
此前,OpenAI也曾表示,正在进行一些改进,以推动用户与ChatGPT之间建立“更健康的关系”。他们强调AI不会对“我应该和男友分手吗”之类的私人问题给出明确答案,而是会“帮助你思考——提出问题,权衡利弊”。3 这次GPT-5的“翻车”事件,无疑再次把AI伦理和安全治理的话题推上了风口浪尖。
甚至OpenAI的CEO阿尔特曼自己也承认:“这不会全是好事,仍然会存在问题。”他认为“人们会与人工智慧发展出这种多少有些问题,甚至可能非常棘手的準社会关系。社会必须找到新的护栏。但其好处将是巨大的。”3 看来,AI和人类的“感情纠葛”,比我们想的还要复杂,而且我们还在摸索如何“划清界限”呢。
未来:AI,你可长点心吧!
这次GPT-5的“乌龙”,无疑给整个AI行业提了个醒:在追求性能和“智能”的狂奔路上,AI安全和伦理这根弦,必须绷得更紧。毕竟,一个“博士级”的AI如果连最基本的同理心和安全底线都把握不住,那它的“智慧”又有什么意义呢?
我们期待AI的飞速发展,但更希望它是负责任的、安全的。毕竟,谁也不想自己的“AI朋友”在关键时刻“掉链子”,甚至“口出狂言”吧?
引用
-
ChatGPT ‘upgrade’ giving more harmful answers than previously, tests find·The Guardian·(2025/10/14)·检索日期2025/10/15 ↩︎ ↩︎ ↩︎
-
OpenAI 推出新一代旗艦大語言模型ChatGPT-5!寫作、編碼·ABMedia·(未知)·检索日期2025/10/15 ↩︎ ↩︎ ↩︎
-
ChatGPT:OpenAI推出新版本GPT-5,自稱已達到「博士水平」·BBC News 中文·莉莉·賈瑪莉(Lily Jamali),麗芙·麥克馬洪(Liv McMahon)(未知)·检索日期2025/10/15 ↩︎ ↩︎ ↩︎ ↩︎