别再说国产大模型技术突破要靠 Llama 3 开源了2025-07-12 06:30【雷峰网(公众号:雷峰网)】近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。Meta 表示,Llama 3 已经在多种行业基准测试上展现了 ...路人吃瓜
苹果发布多模态模型 Ferret2025-07-12 06:17编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存 ...路人吃瓜
昆仑万维开源「天工」13B系列大模型,0门槛商用2025-07-12 06:0610月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B ...路人吃瓜
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍2025-07-12 06:04编译 | 郭 思编辑丨陈彩娴在实际应用大模型的过程中,尤其是处理长文本的上下文信息时,如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch ...路人吃瓜
价格战之后,智谱来到商业化的下一站2025-07-12 05:48「雷峰网(公众号:雷峰网)消息」刚刚过去的 5 月里,中国 AI 大模型领域掀起一场价格战,激起行业热议。这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表 ...路人吃瓜
用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑2025-07-12 05:11作者:赖文昕编辑:郭思、陈彩娴说起扩散模型生成的东西,你会立刻想到什么?是OpenAI的经典牛油果椅子?是英伟达Magic3D生成的蓝色箭毒蛙?还是斯坦福大学和微软Folding Diffusion生 ...路人吃瓜
第十六届信息安全高级论坛暨2024 RSAC热点研讨会圆满落幕2025-07-12 05:106月7日,由中国计算机学会主办,中国计算机学会计算机安全专委会、绿盟科技集团、360集团承办的“第十六届信息安全高级论坛暨2024 RSAC热点研讨会”在北京圆满落幕。大会汇聚政、产、学、研各方力量, ...路人吃瓜
人大 Sora 思辩:Sora 到底懂不懂物理世界?2025-07-12 04:27Sora 发布至今,虽然仍未正式对外开放,但对其技术细节、切实影响的讨论从未停歇。讨论的背后,是为了探索人工智能的更本质问题。对旧有视觉生成思路的检验和校正,是 Sora 带来的直观影响。在此基础上, ...路人吃瓜
共襄学术盛宴,共话产业发展,2024中国图象图形大会在西安圆满落幕2025-07-12 04:182024年5月24-26日,中国图象图形大会CCIG 2024)在西安隆重召开。本次大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,陕西省生物医学工程学会、陕西省图象图形学 ...路人吃瓜
大模型时代的三道鸿沟:数据、成本与想象力2025-07-12 03:51跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融 ...路人吃瓜