当前位置:首页 > 风台趣

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

风台趣

Kimi 正在重新定义「AI 搜索」

AI搜索的故事是这么讲的:传统搜索过程需要输入关键词,然后机械地反馈回来具有相关性的数十个蓝色链接。AI搜索则不是返回链接,而是帮助总结好的内容、聚合一份「答案」。为了让这份答案看起来更加丰富,很多产 ...

风台趣