。企业成为模型开发的主要力量,中国在论文、专利和模型发布方面活跃度持续提高。
2024 年,阿里巴巴发布 6 个知名(notable) 模型,全球排名第三。字节跳动、DeepSeek、腾讯、智谱各发布 2 个知名模型:「国产五英杰」,集体进入世界第一阵营。
清华大学 2023 年发布 8 篇进入全球前 100 高被引论文,与 Google 并列第一。
研究估计,高质量网络训练数据可能在 2026~2032 年间消耗殆尽,行业正关注替代数据来源。
2024 年,多项新模型在语言、数学、视频生成等能力上取得进展。领先模型之间的差距缩小,小模型表现提升明显。AI 在推理能力方面仍存在挑战。
尽管“思维链”方法改善了模型表现,AI 仍难以稳定解决大型逻辑或规划问题,尤其是在训练范围之外的任务上。
在两小时预算内,AI 代理在 RE-Bench 测试中得分是人类的 4 倍。但在 32 小时任务中,人类得分是 AI 的两倍。AI 在部分任务中效率更加高,但仍有时间限制。
AI 应用规模持续扩大,但围绕安全性、可信度、偏见与误用的挑战也在增加。行业在相关评估与治理上的行动仍有限,政府与研究界的介入力度逐步增强。
根据 McKinsey 调查,大部分企业管理的人意识到 RAI 风险,但采取行动的不多。管理者对不准确性、法规合规和网络安全的关注度分别为 64%、63%、60%。
2024 年,多国机构(OECD、欧盟、联合国、非盟等)发布 RAI 治理框架,内容涉及透明性、可解释性和信任等核心原则。
许多网站设置限制,减少 AI 模型对网页内容的抓取。2024 年,C4 数据集中受限 token 比例从前一年的 5~7% 上升至 20~33%。
C4:Colossal Clean Crawled Corpus这是一个大规模的文本数据集,大范围的应用于大型语言模型(LLM)的预训练。该数据集来源于 Common Crawl 项目收集的海量公开网页抓取数据。为提升数据质量以适应模型训练的需求,原始的 Common Crawl 数据经过了大量且细致的清洗与过滤处理,旨在移除例如网站模板代码、导航元素、重复内容以及其他非自然语言文本。
2024 年,十余个国家在选举期间出现 AI 相关虚假内容,但实际影响仍不明确,部分预期效果未实现。
GPT-4、Claude 3 Sonnet 等模型在性别与种族上仍表现出隐性偏见。例如,女性更常被关联到人文学科,男性更常与领导角色相关联。
2024 年,RAI 相关论文在主流 AI 会议中的录用量为 1278 篇,比 2023 年增长 28.8%。自 2019 年以来,该方向保持持续增长。
2024 年,AI 在商业领域的应用加快,全球投资总额创历史上最新的记录。生成式 AI 领域尤其受到资本青睐。各行业开始感受到初步的财务影响,但普遍仍处于早期阶段。
2024 年,全球 AI 投资达到 2523 亿美元,同比增长 26%。其中,私人投资直接投资增长 44.5%,并购增长 12.1%。
2024 年,在生成式 AI 领域,美国的私人投资再达 339 亿美元,同比增长 18.7%,比 2022 年增长超过 8.5 倍,占全部 AI 投资的 20% 以上。
2024年,在整个 AI 投资领域,美国的私人投资为 1091 亿美元,是中国(93 亿美元)的近 12 倍,是英国(45 亿美元)的 24 倍。
2024 年,78% 的企业报告正在使用 AI,比上一年(55%)明显地增长。采用生成式 AI 的企业占比也从 33% 提升到 71%。
在已有使用的企业中,49% 在服务运营中报告了成本下降,但多数降幅低于 10%。在销售、供应链等环节中,也有 50~70% 的企业报告了营收增长,大多分布在在 5% 以下。
中国大陆和港澳台地区的企业 AI 使用率增长了 27 个百分点,增长幅度为全球最高。欧洲增长 23 个百分点。
2023 年,中国安装了 27.6 万台工业机器人,是日本的 6 倍、美国的 7.3 倍,占全球总量的 51.1%。
2023 年,协作型机器人占新装工业机器人的 10.5%,2017 年该比例为 2.8%。服务型机器人在医疗以外的应用也呈现增长。
多家科技公司与核电厂达成合作协议,支持 AI 所需的高能耗运行。包括微软重启美国 Three Mile Island 核反应堆,Google 与 Amazon 也已签署相关协议。
多项研究显示,AI 应用可带来整体生产率提升,尤其有助于低技能岗位员工提高绩效,与高技能员工之间的差距有所缩小。
AI 在生物医药、临床知识、基础科学等领域的应用逐步扩大。多个新模型发布,研究效率提高。AI 在特定任务中已具备超越人类的能力,但模型验证、临床集成仍是挑战。
2024 年发布了多款大规模蛋白质序列预测模型,包括ESM3 和 AlphaFold 3,模型规模增加带来预测精度的进一步提升。
新工具如Aviary(用于训练生物任务的 LLM agent)和FireSat(用于预测森林火灾)在 2024 年得到应用,展示出 AI 在科研支持上的多样化方向。
研究发现,GPT-4 在复杂病例诊断中表现优于医生团队。其他研究也表明AI 在癌症检测、高风险患者识别等任务中具备较高准确性。
截至 2023 年,FDA 批准的 AI 医疗设施总数达 223 个。相比 2015 年(仅 6 个),增长显著。
2024 年的研究表明,AI 生成的合成医疗数据可在保障隐私的同时,用于改进健康风险预测和新药发现。
关于医疗AI 伦理的论文数量自 2020 年以来增长近四倍,从 288 篇增至 1031 篇,反映该议题在学术界受到重视。
全球多个国家在 2024 年加强了 AI 基础设施投资和监管推进。AI 成为政策议程核心议题,国家层面机构与国际组织陆续发布治理框架,AI 安全合作初具体系。
2016 年,全美仅有 1 项州级 AI 法律2023 年,增至 49 项;2024 年翻倍至 131 项。相比之下,联邦级立法仍进展缓慢。
在 2023 年的英国 AI 安全峰会后,首批国家级 AI 安全研究所设立于美国与英国。2024 年的首尔 AI 峰会推动更多机构承诺加入,包括日本、法国、德国、意大利、新加坡、韩国、澳大利亚、加拿大及欧盟。
2024 年,美国共有 42 个联邦机构出台 AI 相关规章制度,是 2023 年的两倍。全年共发布 59 项新规,比去年增长超过一倍。
截至 2024 年,美国有约 24 个州已经就 Deepfake 问题,展开治理工作。
全球慢慢的变多国家将 AI 和计算机科学纳入基础教育体系,美国高校相关毕业人数持续增长。但教育资源、师资能力、基础设施等方面的区域差异仍然存在。
2023–2024 学年,美国高中阶段学生参与计算机科学课程的比例有所提升。但在州别、种族、性别、收入等方面仍存在很明显差距。
美国 81% 的 K–12 计算机科学教师认为 AI 应纳入基础课程教学体系,但仅不到一半的教师表明了自己具备教授 AI 的能力。
相较于 2019 年,这一比例翻倍。其中,非洲与拉丁美洲国家的进展最显著。但一些非洲国家仍因基础设施(如供电)问题导致教学覆盖不足。
2023 年,美国获得 AI 相关硕士学位的毕业生人数相比 2022 年几乎翻倍。虽然本科与博士层面的增长较缓,但整体呈持续上升趋势。
在信息与通信技术毕业生数量上,美国仍居全球领先位置。西班牙、巴西、英国紧随其后。土耳其在性别平衡方面表现最佳。
2024 年,多数国家的公众对 AI 带来积极影响的期待上升,但对 AI 公司、数据隐私及算法公平性的信任普遍偏低。各国之间的态度差异显著。
在 26 个国家中,有 18 个国家的受访者更倾向于认为 AI 产品利大于弊。全球总体比例从 2022 年的 52% 上升至 55%。
约三分之二的受访者认为,未来 3~5 年内,AI 将对个人日常生活产生显著影响。相比 2022 年增加了 6 个百分点。
认为 AI 公司能妥善保护个人数据的受访者比例,从 2023 年的 50% 降至 2024 年的 47%。对算法是否公正的信心也有所下降。
在中国(83%)、印尼(80%)、泰国(77%)等国,绝大多数人认为 AI 利大于弊;而在加拿大(40%)、美国(39%)、荷兰(36%)等国家,这一比例显著偏低。
2024 年,美国有 61% 的收房的人说“担心无人驾驶汽车”,仅 13% 表示信任该技术。虽然担忧比例相比 2023 年略有下降,但仍高于 2021 年(54%)。
2023 年,美国地方层级的政策制定者中,73.7% 支持加强 AI 监管,高于 2022 年的 55.7%。其中支持率为 79.2%,共和党为 55.5%。
例如德国、法国、加拿大、英国、美国的 AI 乐观比例相比 2022 年分别提升了 10%、10%、8%、8%、4%。
全球范围内,60% 的受访者认为 AI 将在未来 5 年内改变自身的工作方式,但只有 36% 担心 AI 会在最近一段时间内取代自己的岗位。
在美国地方政府中,对隐私保护(80.4%)、再培训政策(76.2%)和部署规范(72.5%)支持度较高。但对禁用人脸识别(34.2%)、工资补贴(32.9%)、全民基本收入(24.6%)支持度较低。
55% 的人认为 AI 能“节约时机”,51% 认为它能“带来更好的娱乐体验”,但只有 36% 看好它能改善国家经济,31% 认为它将改善就业市场。