近年来,在多种因素的推动下,机器学习 (ML) 经历了快速转型和采用。
关于人工智能(AI)和 ML 为什么会不断发展,有很多观点。麦肯锡最近的一份报告将 ML 的工业化和应用 AI 确定为今年的主要趋势之一。在本周 AWS re:Invent 大会的一次会议上,亚马逊(AWS)人工智能和机器学习副总裁兼总经理 Bratin 概述了这家云巨头看到的六大关键趋势,这些趋势有助于推动 2022 年及以后的创新和采用。
AWS 声称其 AI/ML 服务拥有超过 100,000 名客户。这些服务分布在三个层级:ML 基础设施服务,使组织能够构建自己的模型;SageMaker,提供构建应用程序的工具;以及针对特定用例的专用服务,例如转录。
「机器学习已经从一项小众活动转变为公司开展业务不可或缺的一部分,」Saha 在会议期间说。
趋势一:模型复杂性不断提高
Saha 说,近年来 ML 模型的复杂性呈指数级增长。他对「指数」一词的使用也不夸张。
衡量机器学习模型复杂程度的一种方法是计算其中的参数数量。Saha 解释说,参数可以被认为是嵌入在 ML 模型中的值变量。Saha 说,2019 年,当时最先进的 ML 模型大约有 3 亿个参数。快进到 2022 年,最好的模型现在已经超过 5000 亿。
「换句话说,在短短三年内,机器学习模型的复杂程度增加了 1600 倍,」Saha 说。
这些庞大的模型现在通常被称为基础模型。使用基础模型方法,可以使用海量数据集对 ML 模型进行一次训练,然后针对各种不同的任务进行重复使用和调整。因此,企业可以通过更易于采用的方法从日益复杂的过程中受益。
「[基础模型] 将机器学习的成本和工作量降低了一个数量级,」Saha 说。
趋势二:数据增长
越来越多的数据和不同类型的数据被用于训练 ML 模型。这是 Saha 确定的第二个关键趋势。
组织现在正在构建经过结构化数据源(如文本)以及非结构化数据类型(包括音频和视频)训练的模型。能够将不同的数据类型放入 ML 模型中,这导致 AWS 开发了多种服务来帮助训练模型。
Saha 强调的一种此类工具是 SageMaker Data Wrangler,它可以帮助用户使用一种使其适用于 ML 训练的方法来处理非结构化数据。本周在 re:Invent 大会上,AWS 还在 SageMaker 中添加了对地理空间数据的新支持。
趋势三:机器学习产业化
AWS 也看到了 ML 产业化的趋势。这意味着 ML 工具和基础架构更加标准化,使组织能够更轻松地构建应用程序。
Saha 表示,ML 工业化很重要,因为它可以帮助组织实现开发自动化并使其更加可靠。随着组织构建和部署更多模型,工业通用方法对于扩展至关重要。
「即使在亚马逊内部,我们也在使用 SageMaker 进行工业化和机器学习开发,」Saha 说。「例如,最复杂的 Alexa 语音模型现在正在 SageMaker 上进行训练。」
趋势四:针对特定用例的 ML 支持的应用程序
由于针对特定用例的专用应用程序,ML 也在增长。
Saha 表示,AWS 客户已要求供应商自动化常见的 ML 用例。例如,AWS(和其他供应商)现在提供语音转录、翻译、文本转语音和异常检测等服务。这些为组织提供了一种更简单的方法来使用 ML 支持的服务。
例如,实时音频通话中的情绪分析是一个新的复杂用例,AWS 现在通过其 Amazon Transcribe 服务的实时通话分析功能支持该用例。Saha 表示,该功能使用语音识别模型来了解客户情绪。
趋势五:负责任的人工智能
负责任的人工智能也有增长的趋势和需求。
「随着人工智能和机器学习的发展,人们意识到我们必须负责任地使用它,」Saha 说。
从 AWS 的角度来看,负责任的人工智能需要具备几个关键属性。系统需要公平,无论种族、宗教、性别和其他用户属性如何,对所有用户平等运作。ML 系统还需要可解释,以便组织了解模型的运作方式。还需要治理机制,以确保负责任的人工智能得到实践。
趋势六:机器学习民主化
推动 ML 向前发展的最后一个关键趋势是使技术民主化,使更多人可以获得工具和技能。
「客户告诉我们,他们……通常很难招聘到他们需要的所有数据科学人才,」Saha 说。
在 Saha 看来,民主化挑战的答案在于继续开发低代码和用例驱动的工具,以及教育。
「AWS 还在投资培训下一批机器学习开发人员,」Saha 说。「AWS 承诺,到 2025 年,我们将通过免费的云计算技能培训帮助超过 2900 万人提高他们的技术技能。」
参考内容:https://venturebeat.com/ai/aws-names-6-key-trends-driving-machine-learning-innovation-and-adoption/