前瞻钱瞻292. 必听！2025斯坦福《人工智能指数报告》重点及趋势

前瞻钱瞻：《2025人工智能指数报告》由斯坦福大学人类中心人工智能研究所（HAI）编制，旨在全面分析人工智能（AI）技术在多个领域的发展与应用。报告详细介绍了AI在科研、商业、政策、医疗、伦理等方面的最新进展，并探讨了全球范围内AI的投资、采纳与影响。随着AI技术的不断成熟，它不仅在提升生产力和推动科技创新方面发挥着重要作用，还在塑造未来社会、经济和治理结构中扮演着至关重要的角色。

The 2025 AI Index Report | Stanford HAI

（点以上链接可直接下载报告）

本报告提供了基于深入分析的数据和见解，帮助政策制定者、企业领袖和研究人员了解AI当前的发展态势、技术突破以及其未来趋势。以下是本报告的重点分类及重要分析，旨在为各行业决策者提供宝贵的参考。

2025年人工智能指数报告》的TOP TAKEAWAYS：

AI在严格基准测试中的表现持续提升：2023年，研究人员推出了新的基准测试（如MMMU、GPQA和SWE-bench），以测试先进AI系统的极限。到2024年，AI在这些基准上的表现大幅提高，分别提高了18.8%、48.9%和67.3个百分点。

AI越来越多地融入日常生活：从医疗到交通，AI正在迅速从实验室走向日常生活。2023年，FDA批准了223款AI医疗设备，而自2015年仅批准了6款。在道路上，自动驾驶汽车不再是实验性的：美国最大的自动驾驶运营商之一Waymo每周提供超过15万次自动驾驶服务，而百度的Apollo Go机器人出租车车队现在已经覆盖了中国多个城市。

企业全面投入AI，推动投资和使用创纪录增长：2024年，美国私人AI投资增长至1091亿美元，是中国（93亿美元）的12倍，是英国（45亿美元）的24倍。生成性AI特别受到青睐，全球私人投资增长了18.7%，达到339亿美元。AI的商业应用也在加速：78%的组织报告称2024年使用了AI，远高于前一年的55%。同时，越来越多的研究证实，AI提高了生产力，并且在大多数情况下，有助于缩小劳动力中的技能差距。

美国仍在生产顶级AI模型方面领先，但中国缩小了性能差距：2024年，美国机构生产了40个显著的AI模型，而中国为15个，欧洲为3个。尽管美国在数量上保持领先，但中国的模型迅速缩小了质量差距：在MMLU和HumanEval等主要基准上的性能差距，从2023年的两位数缩小至2024年的接近平衡。

负责任AI生态系统在发展，但进展不均衡：与AI相关的事件数量急剧上升，但主要工业模型开发者之间的标准化负责任AI评估仍然稀缺。然而，像HELM Safety、AIR-Bench和FACTS等新基准为评估准确性和安全性提供了有希望的工具。企业之间对负责任AI风险的认识仍存在差距，而政府的行动更加紧迫：2024年，全球AI治理的合作加强，包括OECD、欧盟、联合国和非洲联盟发布了专注于透明度、可信度等核心负责任AI原则的框架。

全球AI乐观情绪上升，但地区分歧依然存在：在中国（83%）、印度尼西亚（80%）和泰国（77%）等国家，大多数人认为AI产品和服务更具益处。而在加拿大（40%）、美国（39%）和荷兰（36%）等国家，乐观情绪远低于这些水平。尽管如此，自2022年以来，多个之前持怀疑态度的国家（如德国、法国、加拿大、英国、美国）对AI的乐观情绪有所增长。

AI变得更加高效、经济和可访问：通过越来越强大的小型模型，系统的推理成本已经在2022年11月到2024年10月期间下降了超过280倍。在硬件层面，成本每年下降30%，能源效率每年提高40%。开源模型正在缩小与封闭模型的差距，在某些基准测试中的性能差距从8%缩小至1.7%。

各国政府加大AI投入并推进相关法规：2024年，美国联邦机构推出了59项与AI相关的法规，是2023年的两倍，来自42个独立机构，比2023年的21个机构还多。全球范围内，AI在立法中的提及增长了21.3%，自2023年起的增加幅度达到九倍。

AI和计算机科学教育扩展，但存在访问和准备的差距：三分之二的国家现在提供或计划提供K-12计算机科学教育，是2019年的两倍，非洲和拉丁美洲取得了最多的进展。在美国，计算机科学的学士学位毕业生在过去10年间增长了22%。然而，由于缺乏基础设施，许多非洲国家的访问仍然受到限制。在美国，81%的K-12计算机科学教师认为AI应纳入基础计算机科学教育，但不到一半的人觉得自己有能力教授它。

行业在AI领域疾步前进，但前沿领域的竞争日益激烈：2024年，近90%的显著AI模型来自行业，相较于2023年的60%，学术界依然是引用最多的研究来源。模型规模继续快速增长——训练计算每五个月就翻倍，数据集每八个月翻倍，功率使用每年增加。然而，性能差距正在缩小：2023年排名前10的模型之间的Elo技能分数差距从11.9%降至5.4%，前两个模型之间的差距仅为0.7%。

11. AI在科学中的重要性获得认可：
AI在科学领域的重要性得到了进一步的认可，并获得了重大科学奖项。2024年，深度学习相关的研究成果分别获得了诺贝尔物理学奖和化学奖。而图灵奖则授予了强化学习的基础性贡献。这些荣誉表明，AI不仅改变了商业和社会，还对基础科学研究产生了深远影响。

12. 复杂推理仍然是一个挑战：
尽管AI在许多任务上表现出色，例如国际数学奥林匹克（IMO）问题，但在复杂推理基准（如PlanBench）上，AI仍然存在较大困难。尽管AI可以解决许多逻辑任务，尤其是那些可以通过证明正确解决的任务，但在涉及复杂推理和大量数据的高风险场景中，它的可靠性仍然不足

第1章：研究与开发（Research and Development）

AI出版物数量持续增长
2023年，AI出版物总数达到24万篇，几乎是2013年的三倍，且占计算机科学领域出版物的41.8%。
AI专利数量大幅增加
自2010年以来，AI相关的专利数量持续上升，2023年授予的AI专利已达到12.2万件。
AI模型的开放与使用方式变化
API访问成为最常见的模型发布方式，2024年，61个显著AI模型中，有20个采用API访问。

第2章：技术性能（Technical Performance）

AI在基准测试中的表现提升
2024年，AI在多个新基准测试中的得分大幅提高，尤其是在推理能力和视频生成等任务中。
小型AI模型的崛起
小型AI模型在多个基准测试中展示出与大型模型相当的性能，且具有更高的效率。
推理能力与复杂性挑战
AI尽管在某些复杂推理任务上有进展，但在高风险应用中仍存在不稳定性。

第3章：负责任AI（Responsible AI）

负责任AI的标准化滞后
尽管越来越多的公司采取了去偏见设计，但AI模型中的隐性偏见仍然是一个突

Published on 8 months, 1 week ago

Podcast Episode Details

前瞻钱瞻292. 必听！2025斯坦福《人工智能指数报告》重点及趋势

第1章：研究与开发（Research and Development）

第2章：技术性能（Technical Performance）

第3章：负责任AI（Responsible AI）