万字实录：VLA 范式，具身智能的曙光与迷雾丨GAIR Live-热点吃瓜网- 揭开趣味故事，乐享丰富内容

阿里与上交大提出 LLM 长文本计算新解法：可处理文本长达 1900k 字节、效率提升 2.4 倍

2025-07-14 02:45

编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...

2025-07-14 02:20

2 月 16 号，马斯克在 X 上发布了一条自家 Grok 3 模型的发布预告。并配文“地球上最聪明的 AI”要来了。北京时间 2025 年 2 月 18 日中午，马斯克如约带领着 xAI 的工程师和 ...

2025-07-14 01:55

来源标题：上合组织国家电影节闭幕，《三大队》获最佳影片电影节的电影市场活动上，嘉宾观看中国电影科技企业的虚拟影片。新华社发7月6日晚，2025上合组织国家电影节闭幕式在重庆永川区举办。本届电影节集中 ...

2025-07-14 01:48

来源标题：六重篇章礼赞盛世，七大类别全面覆盖 2025“北京大视听”网络视听精品重磅发布7月2日上午，以“视听潮涌文艺生辉”为主题的第三届北京网络视听艺术大会隆重开幕。北京市 ...

2025-07-14 01:38

据欧洲与地中海地震中心测定，当地时间7月10日9时04分，印度德里地区发生4.5级地震，震源深度10公里，震中位于北纬28.6065度，东经76.5817度。印度国家地震中心尚未发布有关震中和震级的详 ...

2025-07-14 01:20

作者丨朱可轩编辑丨陈彩娴近日，“源神”Deepseek 密集开源了一系列代码库，包括FlashMLA、DeepEP、DeepGEMM、DualPipe 等项目及 3FS 系统，几乎实现了对 AI In ...

2025-07-14 00:59

清华和上交的最新论文中，上演了一场“学术打假”的戏码。文中研究者们对当前“纯 RL 有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验，他们证明引入强化学习的模型在某些任务中的表现，竟 ...

2025-07-14 00:52

昨天一早，Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型，其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。消 ...

2025-07-14 00:34

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...

2025-07-14 00:32

4月27日，夸克AI超级框发布全新AI相机，上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力，夸克AI超级框从视觉出发创新下一代搜索体验，进一步理解和回答物理世界中的各类问题。作为阿里巴巴 ...