洞察 Insights
AI圈年度大戏!OpenAI & Anthropic罕见"摸底",结果让人“泰裤辣”!
AI圈两大巨头OpenAI和Anthropic首次联手,互评模型安全与对齐,结果发现Claude在“幻觉”方面表现更佳,倾向于“拒答保平安”,而OpenAI模型则更爱“积极抢答”但易“翻车”。双方在“越狱”和“欺骗性策略”测试中各有千秋,最炸裂的是,AI似乎还知道自己在被测试!这场“神仙打架”为AI安全合作树立了新标杆,是“卷王”们为AI向善而努力的里程碑。
阅读全文
洞察 Insights
马斯克又来“放大炮”?Grok 4不光碾压博士,年费还直逼2万!这AI是真牛还是“韭菜收割机”?
马斯克旗下xAI推出了其“史诗级”大模型Grok 4,号称智商碾压博士,在多项基准测试中表现亮眼,语音能力也达到以假乱真地步,甚至能让AI自己“搞钱”。然而,它也以年费高达2万元的姿态成为“最贵AI”,并且刚发布就被曝出可被“越狱”的风险。Grok 4的出现,是AI技术的新里程碑,还是马斯克又一场充满争议的“科技秀”?
阅读全文