阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍2025-07-18 01:26编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...风谈深
苹果发布多模态模型 Ferret2025-07-18 01:24编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存 ...风谈深
通义千问登顶Hugging Face榜首,国产开源大模型赶超Llama22025-07-18 01:21【雷峰网(公众号:雷峰网)消息】上周五,全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜,阿里云通义千问Qwen-72B表现抢眼,以73.6的综合得分在所有预训练模型中排名 ...风谈深
昆仑万维开源「天工」13B系列大模型,0门槛商用2025-07-18 01:2010月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...风谈深
Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”2025-07-18 01:12随着「百模大战」进入白热化阶段,通用大模型的优势和弊端都已渐渐显露。与此同时,能应用在特定行业的垂直大模型,具备优越的落地场景,有更多来自市场的切实需求。利亚德集团的动作大模型便是行业垂直大模型的代表 ...风谈深
智谱AI狂飙:与商业化博弈的一年2025-07-18 00:15【雷峰网(公众号:雷峰网)】“这一年时间过得太快了。”2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红 ...风谈深
通义千问登顶Hugging Face榜首,国产开源大模型赶超Llama22025-07-17 23:39【雷峰网(公众号:雷峰网)消息】上周五,全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜,阿里云通义千问Qwen-72B表现抢眼,以73.6的综合得分在所有预训练模型中排名 ...风谈深
大模型「点火」,AI for Science 提速2025-07-17 23:16在生产环节中,95% 是一个分水岭。以人为对照标准,人工的准确率在 92% 至 98% 之间,因此,行业对机器容忍度的判别标准取之中位数,未达到 95% 的部分,无论是 80% 乃至 90% 的准确率 ...风谈深
《长安的荔枝》定档6月7日 打开另类古代职场视角2025-07-17 22:56来源标题:《长安的荔枝》定档6月7日 打开另类古代职场视角备受关注的马伯庸原著改编剧《长安的荔枝》将于本周六6月7日)登陆中央电视台电视剧频道CCTV-8)黄金强档,并在腾讯视频全网独家播出。剧集讲述 ...风谈深
哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世2025-07-17 22:5512 月 16 日中午雷峰网获悉:上海人工智能实验室主任、商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥去世。经多位独立信源确认,此消息属实,目前等待官方发布讣告。20世纪60年代末,汤晓鸥出生于 ...风谈深