阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍2025-07-14 02:45编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...趣台
反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了2025-07-14 02:202 月 16 号,马斯克在 X 上发布了一条自家 Grok 3 模型的发布预告。并配文“地球上最聪明的 AI”要来了。北京时间 2025 年 2 月 18 日中午,马斯克如约带领着 xAI 的工程师和 ...趣台
上合组织国家电影节闭幕,《三大队》获最佳影片2025-07-14 01:55来源标题:上合组织国家电影节闭幕,《三大队》获最佳影片电影节的电影市场活动上,嘉宾观看中国电影科技企业的虚拟影片。 新华社发7月6日晚,2025上合组织国家电影节闭幕式在重庆永川区举办。本届电影节集中 ...趣台
六重篇章礼赞盛世,七大类别全面覆盖 2025“北京大视听”网络视听精品重磅发布2025-07-14 01:48来源标题:六重篇章礼赞盛世,七大类别全面覆盖 2025“北京大视听”网络视听精品重磅发布7月2日上午,以“视听潮涌 文艺生辉”为主题的第三届北京网络视听艺术大会隆重开幕。北京市 ...趣台
印度德里地区发生4.5级地震 多地震感强烈2025-07-14 01:38据欧洲与地中海地震中心测定,当地时间7月10日9时04分,印度德里地区发生4.5级地震,震源深度10公里,震中位于北纬28.6065度,东经76.5817度。印度国家地震中心尚未发布有关震中和震级的详 ...趣台
国产 AI Infra 变革进行时:新势力正在崛起2025-07-14 01:20作者丨朱可轩编辑丨陈彩娴近日,“源神”Deepseek 密集开源了一系列代码库,包括FlashMLA、DeepEP、DeepGEMM、DualPipe 等项目及 3FS 系统,几乎实现了对 AI In ...趣台
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理2025-07-14 00:59清华和上交的最新论文中,上演了一场“学术打假”的戏码。文中研究者们对当前“纯 RL 有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验,他们证明引入强化学习的模型在某些任务中的表现,竟 ...趣台
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?2025-07-14 00:52昨天一早,Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。消 ...趣台
昆仑万维开源「天工」13B系列大模型,0门槛商用2025-07-14 00:3410月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...趣台
阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力2025-07-14 00:324月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。作为阿里巴巴 ...趣台