加入收藏 | 设为首页 | 会员中心 | 我要投稿 济南站长网 (https://www.0531zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

斯坦福连续发了四年的人工智能报告,今年讲了什么?

发布时间:2021-07-10 12:19:39 所属栏目:大数据 来源:互联网
导读:由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,旨在促进基于数据的 AI 广泛交流和有效对话。 刚刚,AI Index 正式发布了 2021 年度报告。 报告下载地址: https://aiindex.stanford.edu/re
由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,旨在促进基于数据的 AI 广泛交流和有效对话。
 
刚刚,AI Index 正式发布了 2021 年度报告。
 
报告下载地址:
https://aiindex.stanford.edu/report/
 
2021 AI Index 报告极大地扩展了可用数据量,并与大量外部组织合作校准数据、深化该报告与 Stanford HAI 的联系。该报告还从多个方面展示了 COVID-19 对 AI 发展的影响。例如「技术表现」章节探讨了 AI 初创公司如何利用机器学习技术加速 COVID 相关药物研发;「经济」章节表明 AI 招聘和私人投资并未受到新冠大流行的严重影响,仍处于增长态势。
 
该报告从研发、技术表现、经济、教育等多个维度探讨了过去一年的 AI 发展,得出了如下重要结论:
 
对 AI 领域的私人投资额呈现显著增长,其中「药物、癌症、分子学、药物研发」获得最大比例的投资——138 亿美元,是 2019 年的 4.5 倍;
 
中国在学术工作方面的成绩超过美国。多年前,中国的 AI 期刊发表文章数量即超过美国,现在中国首次在期刊引用量上也占据了优势。不过在过去十年中,美国的 AI 会议论文(及高被引论文)数量仍超过中国;
 
合成媒体(deepfake)数量大增,文本、图像、视频合成方面都出现了突破。这显示了 AI 的飞快发展,但也引发了人们对其滥用、误用的潜在担忧;
 
AI 应用的伦理挑战引起 AI 社区的更多关注。2015-2020 年间涉及伦理及相关关键词的论文数量增长迅速;
 
AI 领域面临多样性挑战。2019 年,美国 45% 的 AI 博士新生是白人,仅有 2.5% 是非裔美国人,3.2% 是西班牙裔。目前,AI 研究者正在努力提升该领域的多样性;
 
自 2017 年加拿大发布国家 AI 战略后,多个国家采取了类似措施,截至 2020 年有 30 多个国家发布了国家 AI 战略;
 
更多 AI 博士选择进入工业界,而不是留在学术界,离开学界进入企业的教授数量也在持续增长;
 
企业主导了 AI 研究者的常用工具,如企业开发的软件库(谷歌的 TensorFlow 和 Keras、Facebook 的 PyTorch)成为 GitHub 上最热门的框架;
 
政府对 AI 领域的兴趣继续增长,如美国政府斥资数十亿美元投入 AI 的民用与非民用。美国国会提及「AI」的次数是上一届国会的三倍;
 
监控技术呈现出快速、廉价的特点,得到越来越广泛的使用。2020 年图像分类、人脸识别、视频分析、语音识别等技术取得显著进展,用于大规模监控的技术快速成熟。
 
该报告共包括「研发」、「技术表现」、「经济」、「AI 教育」、「AI 应用的伦理挑战」、「AI 多样性」、「AI 政策与国家战略」七个部分。以下将介绍每个章节的核心内容。
 
第一章:研发
 
报告首先从「同行评审 AI 论文」、「AI 期刊论文」、「AI 会议论文」、「AI 专利」、「arXiv 论文」五个部分概述了 AI 领域的论文发表情况。
 
同行评审论文数量猛增
 
自 2000 至 2019 年,同行评审 AI 论文数量增长了约 12 倍,同期同行评审论文占所有论文发表量的比例从 2000 年的 0.82% 增长到 2019 年的 3.8%。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
中国 AI 期刊论文被引量首超美国
 
就 AI 期刊论文而言,2020 年发表的 AI 期刊论文数量是 2000 年的 5.4 倍。其中,2020 年当年发表的 AI 期刊论文数量就比 2019 年增长了 34.5%,大大超过 2018 至 2019 年的涨幅(19.6%)。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2020 年 AI 期刊论文发表数量。
 
其中,中国的 AI 期刊论文发表数量最多(占比 18.0%),超过美国(12.3%)和欧洲(8.6%)。这对于中国而言并非首次。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2020 年不同地理区域的 AI 期刊论文发表数量占世界总量的比例。
 
值得一提的是,2020 年中国的 AI 期刊论文被引量首次超过美国。不过,在过去十年中,美国的 AI 会议论文引用量仍超过中国。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2020 年 AI 期刊论文引用量的占比情况,中国以 20.7% 的比例首次超过美国(19.8%)。
 
AI 会议快速发展
 
过去十年,AI 会议论文数量呈迅猛增长态势。2020 年,AI 会议论文数量占所有会议论文的比例已高达 20.2%。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2020 年,AI 会议论文发表数量占所有会议论文的比例。
 
2019 年,中国的 AI 会议论文发表数量占比超过美国。然而,从 AI 会议论文被引用量来看,美国在过去 21 年中持续占据主导地位。2020 年,美国以 40.1% 的比例名列第一,中国则以 11.8% 的比例位居第二,二者差距仍然很大。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2020 年不同地区的 AI 会议论文发表数量的占比情况。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2020 年不同地区的 AI 会议论文被引用量的占比情况。
 
arXiv 论文发表情况
 
除了传统的期刊和会议以外,预印本平台的论文发表也很重要。过去 6 年中,arXiv 平台上的 AI 相关论文增长了五倍多,从 2015 年的 5478 篇增长到 2020 年的 34,736 篇。其中中国的 arXiv 论文发表总数仍逊色于美国和欧洲,不过从占比情况来看,中国正在奋起直追。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2015-2020 年,不同地区在 arXiv 上发表 AI 论文数量的占比情况。
 
就 arXiv 上的六个 AI 细分领域而言,2015-2020 年间,机器人学 (cs.RO) 和机器学习 (cs.LG) 论文数量增长最快,分别增长了 11 倍和 10 倍。2020 年,机器学习与计算机视觉 (cs.CV) 占比最高,分别为 32.0% 和 31.7%。2019-2020 年,增长最快的类别是计算与语言 (cs.CL) 和机器人学 (cs.RO),论文数量分别增长了 35.4% 和 35.8%。
 
此外,得益于数据和算力的发展,深度学习论文数量飞速增长。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2010-2019 年,arXiv 平台上深度学习论文的发表数量。
 
新冠疫情促使 AI 会议参会人数暴涨
 
由于新冠疫情的影响,大多数 AI 会议以线上的形式举行,参会人数出现了很大增长。2020 年,该报告统计的九个会议的参数总人数几乎翻了一番。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2010-2020 年,参加大小型 AI 会议的人数。
 
大公司参与度高,或加剧计算鸿沟
 
有研究表明,大型科技企业对 AI 顶会的参与度有所增加。研究者认为学术界算力的不均匀分布(即「计算鸿沟」)将加剧深度学习时代的不平等。大型科技企业拥有更多资源来设计 AI 产品,但其多样化程度逊色于较小型的机构,而这引发了对 AI 偏见及公平性的担忧。下图展示了大企业在 10 个 AI 顶会中的参与度,这或许会加速计算鸿沟。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2000-2019 年,大型科技企业的 AI 会议论文数量占比情况。
 
TensorFlow 仍是最流行的 AI 软件库
 
除了论文、会议情况以外,该章节还介绍了 AI 开源软件库。其中谷歌开发的 TensorFlow 框架仍然是最流行的 AI 软件库,其次是 Keras 和 PyTorch。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2014-2020 年,AI 库的流行程度(按照 GitHub 星数来计算)。
 
第二章:技术表现
 
本章概括了计算机视觉、语言、语音、概念学习、推理等多个 AI 子领域的技术进展。
 
AI 生成一切
 
目前,AI 系统可以合成高质量的文本、语音和图像,甚至人类都很难辨别真伪。这将带来大量 AI 下游应用,并促使研究者投入到生成模型检测技术的研究中。下图展示了过去两年中生成模型的进展:
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2018-2020 年生成模型在 STL-10 数据集上的 FID 得分。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2014-2020 年 GAN 人脸生成技术进步。
 
计算机视觉的产业化
 
计算机视觉在过去的十年里取得了巨大的进步,这主要归功于机器学习技术(特别是深度学习)的应用。新的数据显示,计算机视觉正在产业化:在一些最大的基准上,表现开始趋于平缓,这表明社会需要制定和商定更难的基准,以进一步获得测试表现。
 
与此同时,企业正在投入越来越多的计算资源,比以往任何时候都以更快的速度训练计算机视觉系统。同时,用于已部署系统的技术(如用于分析视频静止帧的目标检测框架)正在迅速成熟,这表明将进一步部署 AI。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
ImageNet 挑战的 TOP-1 准确率变化。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
COCO 密集姿态估计挑战的平均精度变化。
 
NLP 评估指标
 
自然语言处理的迅速发展产生了 AI 系统,其语言能力显著提高,已开始对世界产生有意义的经济影响。谷歌和微软都在他们的搜索引擎中部署了 BERT 语言模型,而从微软到 OpenAI 等公司也开发了其他大型语言模型。
 
这一点可以从在 SuperGLUE 上获得人类水平性能的系统的快速兴起看出。SuperGLUE 是为响应早期 NLP 进展(超越 GLUE 评估的功能)而开发的 NLP 评估套件。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
SuperGLUE 基准。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
SQUAD 1.1 和 SQUAD 2.0 的 F1 SCORE 变化。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
GPT-3 在 42 个基准上的表现。
 
AI 推理问题
 
大多数技术问题的度量都显示了在固定的基准上,即每个时间点最佳系统的性能。针对 AI 指数开发的新分析提供了一些指标,这些指标考虑到了一个不断发展的基准,并考虑到随着时间的推移,将一组系统的总体性能的一部分归因于单个信用系统。这些分析适用于两个符号推理问题:自动定理证明和布尔公式的可满足性。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2016-2020 年解决所有 400 个实例的总时间(布尔满足问题)。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
1997-2020 年解决的问题百分比(自动定理证明)。
 
机器学习变革医疗保健和生物学领域
 
机器学习正在改变医疗保健和生物学领域。DeepMind 的 AlphaFold 应用深度学习技术在数十年来的蛋白质折叠生物学挑战中获得重大突破。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2006-2020 年 CASP 最佳团队在自由建模中的预测准确度。
 
科学家们用机器学习模型来学习化学分子的表示,以便制定更有效的化学合成计划。AI 创业公司 PostEra 在疫情期间利用基于机器学习的技术加速推进与 COVID 相关的药物发现。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
PostEra:Moonshot 提交的药物总数。
 
第三章:经济
 
AI 的兴起不可避免地提出了这样一个问题:这些技术将在多大程度上影响企业、劳动力和更广泛的经济?AI 最近取得的进展和突破为企业提供了大量利益和机遇,从自动化提高生产率、使用算法为消费者定制产品到大规模分析数据等等。
 
然而,AI 带来的效率和生产率的提高也包含巨大的挑战:企业必须寻找和留住技能型人才以满足其生产需求,同时要注意采取措施来降低使用 AI 的风险。此外,COVID-19 大流行给全球经济带来了混乱和持续的不确定性。私营企业是如何依赖和扩展 AI 技术来帮助企业渡过这一最困难的时期的?
 
AI 生物获最多投资
 
药物、癌症、分子、药物发现是 2020 年私人 AI 投资额最大的一个项目,超过 138 亿美元,是 2019 年的 4.5 倍。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2019 年与 2020 年 AI 全球私人投资的领域分布。
 
AI 人才招聘仍在继续增长
 
巴西、印度、加拿大、新加坡和南非是 2016 年至 2020 年 AI 招聘增长最快的国家。尽管出现了 COVID-19 大流行,但所有采样国家 2020 年的 AI 雇佣人数仍在继续增长。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2020 年 AI 招聘指数的国家分布情况。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2016-2020 年 AI 招聘指数在不同国家的变化。
 
AI 私人投资趋势
 
越来越多的 AI 私人投资集中到少数的初创企业。尽管受到疫情影响,但 2020 年私人 AI 投资额较 2019 年增长了 9.3%,增幅高于 2019 年(5.7%),不过新成立的公司数量连续三年处于下降趋势。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2015-2020 年全球新增 AI 公司数量。
 
斯坦福连续发了四年的AI报告,今年讲了什么?
 
 
2015-2020 年度 AI 基金公司的私人投资额。
 
AI 道德问题的受关注度
 
麦肯锡的一项调查显示,尽管越来越多人呼吁解决 AI 使用相关的道德问题,但业界在解决这些问题的努力上非常少。例如,AI 的公平性等问题仍然受到很少公司的关注。此外,与 2019 年相比,2020 年将个人或个人隐私风险视为相关风险的公司较少。
 
斯坦福连续发了四年的AI报告,今年讲了什么?

(编辑:济南站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!