2025 年 4 月 8 日,斯坦福大学 “以人为本人工智能研究所”(HAI)发布的《2025 年人工智能指数报告》显示,当前中美人工智能竞争呈现“美国领先、中国追赶”的格局,但中国在关键技术突破和应用场景落地上展现出强劲势头。
模型数量方面,2024 年美国机构研发了 40 个重要 AI 模型,而中国仅有 15 个,数量上美国领先。
模型性能上,中美顶级 AI 模型的性能差距已从 2023 年的 20% 大幅缩小至 0.3%。以大规模多任务语言理解(MMLU)基准测试为例,2023 年中国模型与美国模型的得分差距高达 17.5 分,而到 2024 年底,这一差距已缩减至仅 0.3 分。中国的 DeepSeek 等开源模型与闭源巨头的性能差距从 2024 年的 8% 缩减至 1.7%,在数学、代码和推理任务中与 OpenAI 旗舰模型不相上下。
研发投入上,2024 年美国私营 AI 投资达 1091 亿美元,约为中国(93 亿美元)的 12 倍,美国在投资规模上具有显著优势。
学术研究方面,中国是人工智能论文发表数量和专利申请数量最多的国家,但美国在论文高影响力方面依然占据优势。中国AI专利数量占全球40%,AI期刊论文发表量连续五年全球第一。
硬件突破:寒武纪、华为等企业推出对标英伟达A100的算力芯片,同时中国设立475亿美元半导体基金加速国产化替代。
今年 1 月,中国的 DeepSeek R1 模型引起了不小的轰动,因为它被透露几乎可以与其更流行的西方 AI 模型的功能相媲美,例如 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini,但计算资源支出非常低。
中国 AI 初创公司 DeepSeek 通过专注于低成本、高性能的大型语言模型 (LLM) 迅速获得关注。其最新的开源模型 DeepSeek-R1 展示了与主流模型相当的智能,突出了软件和硬件技术的突破,并加速了通用人工智能 (AGI) 的进步。
DeepSeek的出现,使得中美顶级AI模型的性能差距从2023年的20%缩小至2024年的0.3%。以DeepSeek为代表的开源模型在MMLU等基准测试中逼近美国闭源巨头,性能差距从8%降至1.7%。
据 DIGITIMES 称,DeepSeek 的出现鼓励该行业探索类似的生成式 AI 应用程序和服务,预计这将推动对 AI 芯片计算能力的需求增加。
DeepSeek 凭借其开源策略和成本优势,强调开放协作和社区参与,加速技术迭代,并通过去中心化降低技术封锁的风险。通过优化代码调度机制以降低计算成本并提高模型开发和部署效率,该公司在竞争激烈的 LLM 市场中显示出优势。
阿里巴巴、字节跳动和百度等公司近期发布的大模型,则采取了在性能、技术特点、应用场景等方面与美国大模型进行差异化竞争的策略,与美国顶尖模型的差距在不断缩小。
模型性能方面,美国大模型以 OpenAI 的 GPT-4 为代表,在复杂的推理能力、高级编码能力、多种学术学习能力等方面表现强大,在国际权威评测中往往名列前茅,如在 MMLU 基准测试中得分较高。
中国大模型整体与美国顶尖模型的差距在不断缩小。例如,字节跳动的豆包通用模型 pro 在主观评测中表现出色,在智源研究院的 FlagEval 百模评测报告中勇夺第一;百度声称文心一言的最新版本在某些关键指标上超越了 ChatGPT 3.5 和 GPT 4;阿里巴巴的通义大模型在生成文本的流畅性和准确性上也有不错表现。不过,中国模型在整体上可能仍稍逊一筹,在一些评测中,美国模型在理科、推理等方面的优势较为明显
技术特点上,美国大模型例如 GPT-4 是一个混合模型,由 8 个不同的模型组成,每个模型都有 2200 亿个参数,支持 32768 个令牌的最大上下文长度,具有多模态能力,能处理文本和图像等多种信息。
中国大模型,如字节跳动的豆包大模型团队提出了全新的稀疏模型架构 UltraMem,有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2 至 6 倍,推理成本最高可降低 83%;百度文心大模型基于百度在搜索和知识图谱领域的深厚积累,以知识增强语义理解为核心;阿里巴巴通义大模型依托阿里在电商、云计算等领域的优势和海量数据,在商业智能、内容创作等领域有应用潜力。
应用场景方面,美国大模型在全球范围内应用广泛,尤其在科研、学术、创意写作、代码开发等领域占据重要地位,其品牌影响力大,被国际上众多开发者和企业所采用。
中国大模型更侧重于结合国内市场的需求和特点进行应用开发。例如,字节跳动的豆包大模型与旗下的产品生态紧密结合,在短视频内容生成、智能推荐等领域有着独特的优势;百度文心一言在知识问答、内容创作等方面,借助百度的搜索和知识图谱优势,为用户提供服务;阿里巴巴通义大模型在电商场景、商业分析等方面具有一定的应用优势。
本报告强调了中国在成为全球 AI 领导者的过程中在 AI 发展道路上取得的重大进展。按照这个速度,人工智能正在演变成为施加经济和地缘政治影响力的重要工具,因此对主导地位的竞争可能会继续加剧。
中国能在AI大模型上彻底拉近与美国的差距,在我看来,主要与中国在AI人才培养数量、政策支持和应用场景落地等方面的优势有关。
中国目前已建立AI 与计算机科学教育全球规模最大、层次最完整的培养体系。2019 年,教育部增设 “人工智能” 本科专业,是 AI 学科体系化建设的重要里程碑,截至 2023 年,全国已有 400 多所高校开设 AI 相关专业。AI 培养方案逐步完善,职业教育和社会培训兴起,为各层次 AI 人才培养提供补充。很多高校设置 “AI+” 的交叉学科,让 AI 学科的门类逐渐齐全,整个 AI 体系的人才培养跟产业界有良好的互动。
中国从中央到地方出台了一系列政策支持 AI 发展,仅中央层面出台的支持政策就有:《新一代人工智能发展规划》、《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》、《国家车联网产业标准体系建设指南(智能网联汽车)(2023 版)》和《生成式人工智能服务管理暂行办法》等。
在星空体育平台官网应用场景落地上面,中国的优势就不用多说了。中国在制造业、医疗、智慧城市等领域快速推进AI应用。例如,青岛“灯塔工厂”通过AI优化生产流程,良品率提升至99.9997%;雄安新区部署50万个智能传感器,构建实时感知的城市系统。
美国凭借技术生态、资本密度和先发优势保持领先,但中国通过政策聚焦、应用场景创新和算法优化快速缩小差距。未来竞争将更多集中在边缘计算、行业垂直应用及伦理治理等维度,而开源生态可能成为打破技术壁垒的关键变量。未来的人工智能行业,可能呈现出小型模型崛起、成本普惠化和开源生态主导等特点。
2025年成为“小型AI模型的突破之年”。微软Phi-3-mini仅用38亿参数达到与5400亿参数模型相当的性能,而中国团队通过算法优化(如DeepSeek)证明小模型同样能实现高效推理。
AI普惠将成为主流。目前AI推理成本两年内下降280倍,硬件成本年均降幅30%。例如,达到GPT-3.5水平的模型调用成本从20美元/百万token降至0.07美元。
堆砌硬件已不是主流,未来大部分大模型都将通过开源生态与算法创新来推进。中国开源社区(如清华计图、百度PaddlePaddle)开发者数量激增300%,挑战TensorFlow和PyTorch的生态垄断。
中国是否最终会在人工智能竞赛中取代美国,这个问题只能随着事态的发展而得到解答。然而,美国可能需要采取更多措施来保持其目前作为人工智能领先国家的地位。