扫描分享
本文共字,预计阅读时间。
近日,斯坦福大学人工智能中心( Stanford Institute for Human-Centered Artificial Intelligence,简称HAI)发布了《2025年人工智能指数报告》(The 2025 AI Index Report)。
报告指出,人工智能将成为21世纪最具变革性的技术。本次发布的报告涵盖了研发、技术性能、负责任人工智能、经济影响、科学和医学、政策、教育和公众舆论等多个主题,通过全面、数据化的观察和分析,希望为全球政策制定者、商业领袖和公众揭示人工智能的技术进展、经济影响与社会效应。
以下是本次报告的主要结论:
1. 人工智能在复杂基准测试中的表现持续取得突破
2023年,研究者推出了MMMU、GPQA和SWE-bench等全新测试体系,旨在检验前沿AI系统的极限能力。仅一年后,系统性能就迎来显著跃升:三项测试得分分别提高18.8、48.9和67.3个百分点。除基准测试外,AI在高质量视频生成领域取得重大突破,某些场景下的语言模型代理在限时编程任务中甚至超越人类水平。
2. AI正在深度融入日常生活
从医疗到交通,人工智能正加速从实验室走向现实应用。2023年,美国FDA批准的AI医疗设备达223项,较2015年的6项实现跨越式增长。自动驾驶领域,Waymo在美国每周提供超15万次无人驾驶服务,百度Apollo Go自动驾驶出租车也以亲民价格开始在多个中国城市提供服务,标志着该技术已进入规模化商用阶段。
3. 企业全面拥抱AI,驱动投资与生产力双增长
2024年,美国民间AI投资达1091亿美元,约为中国(93亿美元)的12倍,英国(45亿美元)的24倍。生成式AI表现尤为亮眼,全球投资额达339亿美元,较2023年增长18.7%。企业应用持续加速:78%的企业在2024年部署了AI技术,较上年55%的渗透率显著提升。研究证实,AI不仅能提升生产效率,在多数场景下更有助于弥合劳动力技能差距。
4. 美国仍主导顶尖模型研发,但中国正加速缩小性能差距
2024年,美国机构推出了40个重要AI模型,大幅领先中国(15个)和欧洲(3个)。尽管美国在数量上保持优势,但中国模型的性能差距快速收窄:在MMLU、HumanEval等核心基准测试中,中美模型得分差从2023年的两位数缩减至近乎持平。此外,中国在AI论文与专利数量方面继续保持领先。与此同时,模型研发呈现全球化趋势,中东、拉美和东南亚等地均有突破性成果问世。
5. 负责任AI生态发展参差不齐
尽管AI相关事故呈爆发式增长,但主流工业级模型开发者中开展标准化负责任AI评估的比例仍然很低。不过,HELM Safety、AIR-Bench、FACTS等新型基准测试工具为事实性与安全性评估开辟了新路径。企业层面,对负责任AI风险的认知与实际行动之间仍存在鸿沟。相比之下,全球AI治理持续深化合作:2024年,经合组织(OECD)、欧盟、联合国、非盟等国际组织密集发布治理框架,重点关注透明度、可信度等负责任AI核心原则。
6. 全球AI乐观情绪攀升,但地区差异显著
中国(83%)、印尼(80%)、泰国(77%)等国民众高度认可AI技术的净效益。而加拿大(40%)、美国(39%)、荷兰(36%)等国的乐观度相对低迷。但值得注意的是,德国(+10%)、法国(+10%)、加拿大(+8%)、英国(+8%)、美国(+4%)等传统审慎国家自2022年以来公众态度明显转向积极。
7. AI技术效能提升、成本下降、普及加速
得益于小型模型的能力突破,达到GPT-3.5水平的系统推理成本在2022年11月至2024年10月间骤降280倍。硬件层面,成本年均降幅达30%,能效年提升40%。开源权重模型与闭源模型的性能差距快速缩小,部分基准测试差异率一年内从8%收窄至1.7%。多重技术突破正在瓦解AI应用门槛。
8. 政府AI治理双轨并进:监管与投资并举
2024年,美国联邦机构发布了59项AI相关法规,较2023年翻倍,涉及部门数量增加两倍。全球75个国家的立法机构AI相关提案同比增长21.3%,较2016年激增9倍。在加强监管的同时,各国持续加码投资:加拿大承诺投资24亿美元、中国设立475亿美元半导体基金、法国承诺投入1090亿欧元、印度计划拨款12.5亿美元、沙特启动千亿美元级“超越计划”等战略布局。
9. AI与计算机科学教育普及加速,但资源鸿沟犹存
全球三分之二国家已实施或规划K-12阶段计算机科学教育,较2019年翻倍,非洲与拉美地区进展最快。美国计算机专业本科毕业生数量十年间增长22%。但受制于电力等基础设施短缺等问题,非洲多国计算机科学教育普及率不足30%。在美国,81%的K-12计算机教师认为AI应纳入基础教育课程,但仅45%具备相关教学能力。
10. 工业界领跑AI创新,技术前沿竞争白热化
2024年,业界贡献了89%的重要AI模型(2023年为60%),但学术界仍然是高引用率研究的首要来源。模型规模持续增长:训练算力每5个月翻倍,数据集每8个月扩容一倍,能耗年增率达100%。模型性能差距急剧缩小:头部与第十名模型得分差一年内从11.9%收窄至5.4%,前两名差距仅0.7%,前沿领域竞争越来越激烈。
11. AI推动科学革命,斩获顶级学术殊荣
AI对科学研究的颠覆性贡献获权威奖项背书:两项诺贝尔奖分别授予深度学习理论基础(物理学)与蛋白质折叠应用(化学),图灵奖则花落强化学习领域的突破性研究。
12. 复杂推理仍是AI技术瓶颈
AI在国际数学奥林匹克等结构化任务中表现惊艳,但在PlanBench等复杂推理基准测试中合格率不足40%。即便存在可验证的准确解,AI系统仍无法稳定处理涉及多步逻辑推导的任务,这制约了其在高精度需求场景的应用可靠性。
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。

非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。
本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。