当前位置:首页 > 风谈

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

风谈

《风驰赛车手》今日首播 黄景瑜李治廷让教练头疼

来源标题: 《风驰赛车手》今日首播 黄景瑜李治廷让教练头疼由淘宝独家冠名的首档赛车竞技生存真人秀《风驰赛车手》将于今天中午12点在优酷视频独家首播。作为填补赛车题材综艺市场空白之作,节目主打一个出其不 ...

风谈

IDEA研究院发布DINO

计算机视觉技术在真实世界的应用场景十分广泛。然而,过去主流的小模型方案,难以应对碎片化、多变的长尾需求,限制了技术落地规模。源自自然语言研究的Transformer架构诞生后,视觉模型与之结合,走上一 ...

风谈

大模型隐藏玩家上桌:DeepSeek 向左,面壁向右

作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后,玩家已逐步分化为三种趋势:一类玩家仍追随 OpenAI 的脚步卷大参数基座模型,另外一类烧不起钱的玩家转头拥抱应用端,而第三类则自始至终都在摸索如何更高效打造 ...

风谈


我要啦免费统计