当前位置:首页 > 风集趣

GRPO在《时空谜题》中击败o1、o3

近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Resear ...

风集趣

警惕!“美企竟这样绕过禁令,偷拿中国关键矿物”

【文/观察者网 柳白】面对中国依国际惯例执行的关键矿物管制,一些美西方买家叫苦不迭,甚至动起歪脑筋。路透社7月9日报道披露,为绕过中方管制,有美国买家通过第三国转运拿到了矿物。比如根据海关和航运记录, ...

风集趣

大模型隐藏玩家上桌:DeepSeek 向左,面壁向右

作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后,玩家已逐步分化为三种趋势:一类玩家仍追随 OpenAI 的脚步卷大参数基座模型,另外一类烧不起钱的玩家转头拥抱应用端,而第三类则自始至终都在摸索如何更高效打造 ...

风集趣

中国第一艘第一次第一座彰显重大突破

来源:中国日报第一座中国空间站“天宫”全面建成运营,全球第一座第四代核电站石岛湾基地投入商业运行,“嫦娥六号”实现全球第一次月球背面无人采样返回,第一次按照国际通行适航标准研制的国产大飞机C919实现 ...

风集趣