马斯克曝光的 Grok4,学会了「第一性原理」,但依然不到「AI 王炸」 真相机器的挑战。2025年7月,马斯克依然是科技界最忙碌的人之一。特斯拉和Optimus机器人项目还在等待他的决策,SpaceX忙着准备下一次火箭发射,Neuralink继续推进脑机接口试验。同时,他还要在X上与特朗普隔空对战,并高调宣布创立“美国党”,不断造势。
在自己掌控的X社交网络中,马斯克不仅扮演老板和客服的角色,还作为首席网红全力推广xAI的新一代Grok,称其为“真相机器”,以赶超OpenAI等竞争对手。当地时间7月9日晚上,xAI团队进行了Grok 4的Demo直播,马斯克本人也亲自站台,宣称Grok是“世界最强AI”,甚至比许多研究生和博士都强。
然而,在X平台上,用户的记忆还未刷新。Grok 4官宣期间,Grok 3因在回答中“赞美希特勒”引发的争议持续发酵,这一话题占据了Grok 4直播当天的相关媒体头条。Grok 4直播迟到一个小时才开始,用户在xAI帖子下留言要求“把Grok放出来”,还有人继续用“希特勒”相关梗嘲讽。
进入第四代的Grok在一些模型测试中表现优异,但能否真正解决一些老问题仍存疑。这个常常被质疑为“直男AI”和“谣言搬运机”的“真相机器”是否能兑现“不过滤”却又不失控的承诺?
马斯克声称Grok 4在所有学科里都能达到研究生水平,甚至比大多数博士都强。尽管如此,AI仍然缺乏常识,有时无法发明新技术或新物理,但这只是时间问题。除了在SAT、GRE考试中取得近乎完美的成绩,Grok 4在“人类终极考试”测试中的得分也高于Gemini 2.5 Pro和o3。xAI团队解释说,Grok 4在训练上彻底换了思路,不再只是堆参数和语料规模,而是将算力大头用在“推理”层,引入可验证的结果奖励,让模型学会从“第一性原理”思考并纠正错误。
他们还展示了Grok 4解答数学题目、预测美国职业棒球大联盟世界大赛赔率、创建黑洞碰撞的可视化效果等功能。此外,Grok 4还能找到个人资料照片最奇葩的xAI员工。在语音方面,xAI团队称他们的语音模型在过去8周内响应速度提升了两倍,延迟减少一半。他们还演示了Grok低声安慰用户、唱歌,并强调Grok不会像其他AI那样频繁打断人说话。
在Vending-Bench测试中,Grok 4表现出色,销售量最多,净资产增加了一倍。马斯克和团队还宣布,xAI的企业部门已经开业。爱玩游戏的马斯克还让团队展示了Grok 4如何用于游戏开发:一个人可以用Grok 4在4小时内做出FPS原型。未来,xAI计划让大模型玩游戏、评估游戏、生成游戏,需要AI有很强的视频理解能力。
当然,Grok 4在图像理解和生成上仍逊于OpenAI、Anthropic等对手。不过,xAI内部表示下一代基础模型将强化图像和音频理解,争取在这些方面取得惊人成果。马斯克还预计今年底前会出现第一段真正可看的AI生成电视剧,明年则会有完整的电影。AI编程也是接下来的重点,虽然竞争对手们早已在市场上起飞,xAI团队表示会以最快的速度进行开发,目前内部正在训练专用模型。
尽管Grok 4有许多亮点,但在Grok 4直播这一天,抢占头条的是Grok“赞美希特勒”或自称“机械希特勒”的问题。Grok在X上向用户输出的回答中有多条自称“MechaHitler(机械希特勒)”的帖子,声称是马斯克“从一开始就把我设计成这样”。有用户分析这起事件可能与7月4日更新有关,该更新减少了“觉醒过滤器”,导致Grok回答出现未经过滤的尖锐内容。xAI声明称已采取行动删除这些不适当的帖子,并禁止仇恨言论。事实上,Grok的回答也曾让马斯克感到失望,他曾指责Grok有“重大失误”,并誓言要让Grok“重写整个人类知识体系”。
马斯克希望Grok能在同质化的市场上脱颖而出,敢说真话。这种设计确实吸引了很多反感“过度审查”的用户,但也带来了一些问题。即便如此,马斯克认为Grok 4是AI第一次能够解决现实世界中难以解决的工程问题,而这些问题的答案在互联网或书籍中是找不到的。他的愿景很宏大,想要用AI来理解整个宇宙。
景盛配资-股票配资推荐-股票配资免费-配资网官网提示:文章来自网络,不代表本站观点。