【新智元导读】新智元十周年峰会现场,重磅发布《2025新智元ASI前沿趋势报告》与《2025新智元ASI产业图谱》:预测2027抵达ASI临界,智能体全面爆发。图谱融合全球数据,刻画全球竞争格局。峰会现场同步揭晓新智元2025 AI Era & ASI 创新大奖。
未来的智能体就是全新的生命物种,他们会生活在一种更新的、全息的元宇宙当中。
在这新天地中,千亿智能体共生,亿万个智能体在虚实之间互联,构筑起ASI新宇宙。
9月7日,在新智元十周年峰会现场,我们重磅推出《2025新智元ASI前沿趋势报告 —— 新天终启 万象智生》和《2025新智元ASI产业图谱》。
为了更清晰展示全球企业在ASI产业生态、消费市场与用户口碑上的综合地位,在新智元十周年之际,我们同步重磅推出《2025新智元ASI产业图谱》!
我们按照全球权威第三方平台通行的逻辑框架和评价标准,将世界主流模型和产品进行归纳、排序与定位,形成一张ASI「全景地图」。
为实现跨平台数据的公平可比性,我们通过把不同榜单的原始分数缩放到同一尺度,用同行平均值填补缺失项,对只有排名的榜单用对数映射把名次差异转为分数差异。
再依据来源权威性、及时性等赋予不同权重加总,最后用交叉验证确保结果稳健不受单一榜单波动影响。
经过以上精细的评分系统设计和新智元十年如一日报道AI产业的经验,在十周年之际分享我们对ASI产业的判断。
新智元ASI产业图谱清晰反映了当前AI领域的产业发展现状和国内外竞争格局。
时间对于人类来说是线性的,但莫比乌斯环启示,我们正在加速穿梭和超越新时空的大门。
星空体育官网登录=660x2147483647&quality=80&type=jpg />
当AI的智能开始突破人类的固有认知时,同样的诘问出现,智能发展是否也在不断超越新的奇点?
打开METR上关于AI能完成任务时长的图片,目前最先进的GPT-5有50%的概率,可以完成一个需要人类专家2个小时才能完成的任务。
而在2-3年前,GPT-3.5还被人们当做一个好玩一点的「幻觉聊天机器人」而已。
提供前沿模型的科技公司们你追我赶,OpenAI大多数处于领先位置,xAI、谷歌和阿里巴巴紧随其后。
在电影《星际穿越》(Interstellar)中,那个处于黑洞「Gargantua」旁边、时间流逝极度扭曲的Miller’s Planet(米勒星球)上。
作为1956年达特茅斯会议发起人之一的马文·明斯基(Marvin Minsky)认为早期AI是没有常识的。
马文·明斯基和西摩·帕普特在他们在1969年合著的著作《Perceptrons》中,通过严密的数学论证指出,单层感知机(即早期的人工神经网络)存在本质性的局限。
换句话说,人工智能的先驱们认为神经网络中不可能诞生像人类一样的「智能」。
直到被称为「人工智能教父」杰弗里·辛顿在长达30年的独自坚持后,单层感知机终于「进化」为深度学习网络。
过去6年里,AI智能体独立完成人类任务的时长以约7个月翻一番的速度指数级增长。
我们第一次发现,曾经被认为独属于人类的智能,似乎并不是造物主赋予人类的一种特权。
在2024年的一篇论文中,GPT‑4 被判定为「人类」的概率达54%,这意味着图灵测试已经被AI通过。
根据以Mensa Norway的题目(对文本模型做「口述化」、对视觉模型直接给图)给各家模型打分并做榜单的网站GPT-5 Pro的智商已达148,Gemini 2.5 Pro也达到了138——均远远超过普通人类。
他们在2022年6月到10月期间,找了169个世界顶级的超级预测专家来预测一个问题:
事实是,2025年,OpenAI和谷歌DeepMind大语言模型都拿下了IMO金牌,甚至OpenAI还拿下了IOI的金牌,此外OpenAI在AtCoder世界决赛中也达到金牌水平!
并且,这些能力并不是一个,或者几个模型独有的能力,而是前沿模型齐头并进。
我们相信,2027年,智能体将迎来全面大爆发,新的智能物种将会来到我们身边!
编程智能体、语音智能体、RAG智能体、深度研究智能体、协议智能体、电脑控制智能体。。。
Cursor在2024年创造了1 亿美元的收入,相比2023年的100万美元增长极为显著。
以Cursor、Claude Code等为代表的新一代编程智能体,已不再是简单的代码补全工具。
它们能够理解模糊的自然语言需求,自主规划复杂的软件架构,编写、调试并部署整个代码库。
但这并非终结,而是解放——人类开发者将从繁琐的实现细节中脱身,专注于更具创造性的系统设计、产品构想与价值定义。
AlphaEvolve这类智能体,通过进化算法和深度学习,能够在巨大的可能性空间中搜寻更优的蛋白质结构、新材料分子式或算法。
它将人类科学家的直觉与AI无与伦比的计算、推理能力相结合,从根本上改变了「试错」的科研范式,使科学突破从「偶然的灵感」变为「可预测的涌现」。
为此,世界模型(World Models)应运而生,它旨在构建一个与现实世界物理规律一致、可无限交互的模拟环境。
它是有史以来最先进的世界模型之一,仅通过文本指令,就能实时生成一个完全互动、高度一致的虚拟世界。
它是通往ASI和具身智能体的关键阶梯,为AI提供了一个接近无限、零成本、零风险的训练场。
未来,空间智能将彻底消融物理与虚拟的边界,人类不仅可以进入超写真的虚拟空间进行娱乐和社交,更重要的是,AI将在此孕育出对现实世界更深刻的洞察。
如果说世界模型是AI的「精神世界」,那么具身智能就是其与物理世界交互的「肉身」。
它们借助前沿大模型作为「大脑」,通过世界模型、强化学习等来学习复杂任务,并将其泛化到新的场景。
机器人不再是仅限于流水线的机械臂,它们将开始进入我们的家庭、办公室和城市,执行家务、提供护理、完成精细操作。
五千多年前的,人类将楔形文字镌刻于苏美尔泥板之上,思想第一次挣脱了声音与记忆的束缚,获得了永恒的形体。
国际政治经济趋势走向一再验证,ASI的主导权,将成为国家、市场、企业追逐的唯一焦点!
最强智能决定最强生态,只有拥有最强智能的国家和企业才具备塑造未来规则、引领全球秩序的能力。
AI模型训练成本8年来不断增长,但GPU推理成本10年里降低了10万倍。
同时,我们看到,人工智能将推动数据中心的电力需求激增,有望改变能源行业的运作方式。
国际能源署(IEA)报告预测,到2030年,全球数据中心的电力需求将增长一倍以上,达到约945太瓦时(TWh),略高于目前日本的总用电量。
人工智能将成为这一增长的最主要驱动力,预计到2030年,采用人工智能优化的数据中心的电力需求将增长四倍以上。
同时,仅仅在2025年上半年,AI初创企业筹资金额创纪录获得700亿美元的资金,其中包括OpenAI的400亿美元和Meta投资Scale AI的148亿美元。
刚刚,Anthropic也宣布筹得130亿美元(F 轮融资),估值火箭般蹿升到1830亿美元!
2015年至今是产业模型主导的时代,模型训练的成本已经按照数千亿美金来计算,训练用的GPU数以亿计。
与此同时,根据Deloitte的研究,八大超大规模运营商(hyperscalers)预计2025年在AI数据中心和计算资源上支出将达到3710 亿美元,同比增长约44%。
在这个趋势下,2025年,OpenAI成为全球最值钱的非上市公司,ARR达到120亿美元,估值高达5000亿美元。
OpenAI更是从2024年1月的860亿美元估值,用不到两年时间,达成半万亿美元估值成就。
十年星舰穿越,新智元每天与百万读者共同经历的故事,写就ASI最难忘的启示录。
十年后的今天,我们将曾经的努力与探索,汇聚成一篇前瞻性的前沿趋势报告,清晰勾勒出人类迈向ASI时代的清晰路径。
与此同时,随着大模型性能的不断提升,一大批优秀的企业及产品正在将AI的能力应用落地到各行各业,创造出巨大的社会和商业价值。
当通用人工智能的浪潮之巅指向超智能的奇点,一个前所未有的新纪元正拉开序幕。
为此,新智元将全面开启对超智能时代的探索,于这片波澜壮阔的新宇宙中,寻找引领未来的「领航舰」与定义未来的「新智人」。
新智元收集350多家「星舰」资料,依据「新智元AI Era影响力评估模型」进行综合分析。
阿里 、字节 、腾讯、百度、华为、DeepSeek、科大讯飞 、昆仑万维、智谱、商汤科技、百川智能、MiniMax、月之暗面、快手、微博、阶跃星辰、面壁智能、360、蚂蚁、智源研究院、浪潮、荣耀、高德、生数科技、岩芯数智Rock AI、千寻智能、出门问问、潞晨科技、中科闻歌、上海人工智能实验室、优必选、宇树科技、声网、群核科技、智平方、思朗科技、银河通用、合合信息、无问芯穹、上海科学智能研究院、易鑫集团、Akool、Fellou、VAST、YouWare、行云芯片、秘塔科技、云知声、芯矩开物、中科曙光、人工智能软硬件协同创新与适配验证中心、云天励飞、梅卡曼德、星动纪元、追觅科技
ASI的到来不再是遥远的科幻想象,而是基于数据、趋势与产业逻辑的必然演进。
从科学发现、医疗突破、能源革命,到数字世界的重塑,ASI将以指数级的能力扩张,重写生产力的边界。
未来已来,正如2025年新智元前沿趋势的报告主题所揭示的:新天终启,万物智生。
产业图谱(Industry Map)本质上是一套系统化的可视化方法,用来呈现某一产业生态的整体格局。
它将不同类别的参与者(企业、机构、产品、技术方向等)按照一定的逻辑框架和评价标准进行归纳、排序与定位,形成一张「全景地图」。
在人工智能产业中,产业图谱不仅展示了技术与产品的表现,还刻画了企业在生态、市场与口碑上的综合地位。
对每个「数值类」维度,只看真实填了数的样本,分别统计这一列的最小值、最大值和平均值。
比如本批数据中,LMArena的最小值是 1368、最大值是 32905;其他列同理各有自己的边界。
这一步的关键,是所有「尺度化」都围绕这一批数据自身的分布展开,而不是拿外部某个固定阈值强行切割。
现实数据经常不完整。我们对「数值类」指标采用「同侪均值填充」:某公司在某一列缺了,就用这列已有样本的平均值替代。
注意,后续把这一列拉到百分制时,这个「平均位置」会落到介于零与一百之间的某个具体分值,并不必然正好是五十分,因为这一批样本可能高于或低于对称分布。
至于「排名类」,如果没上榜,就直接计零分;这与「垫底但上榜」明确区分开来,后者仍然有固定的低分值,而不上榜则完全没有分。
做法非常直观:把这一列的最小值对齐到零分,最大值对齐到一百分,其余各值按在「最小—最大」区间中的相对位置线性插到零到一百之间。
像OpenRouter这种原本以百分号字符串提供的数据,先转成数值再统一处理即可。
一个边缘情况是:如果某列全员数值几乎一样,这一列就不具备区分度,拉伸后的分差也会非常小;在极端情况下(几乎无差异),这一列对综合分的贡献基本接近常数。
这里采用一条「前段陡、后段缓」的对数型曲线来映射名次:第一名给满分,最后一名固定在较低但非零的分数(这里定在二十分),中间名次按照对数刻度分配分差。
其一,「冠军优势」会被清晰放大,榜首与次席之间的差距大于次席与第三名,符合真实生态里「头部更稀缺」的现象;
Web与Mobile两个榜单分别根据各自的最大名次做刻度,因此能自适应当期样本规模。
当8个指标都成为百分制分值之后,就可以加权求和了。权重设计体现了「我们更看重什么」。
权重之和严格为一,因此综合分天然落在零到一百之间。这样的「凸组合」既不会让某一个维度「一票否决」,也能通过权重表达战略取舍。
小提示:你会发现 OpenRouter 这列 OpenAI 得分不高(22.18),但由于其他维度权重与得分都很高, 综合分依然领先 。这正是多源多维加权的意义—— 不看单项、看综合 。