超大规模云计算提供商的新战场:人工智能云服务

如今,人工智能云服务已经成为超大规模云计算提供商的又一战场,因为它们可以吸引数据科学家和开发人员在他们的平台上培训模型。

如果人工智能是IT技术的未来的话,那么云计算供应商的云服务将成为即将到来的应用浪潮的前沿和中心。

虽然行业在人工智能和机器学习(ML)方面不乏炒作,但全球主要的云计算供应商已经在这方面积累了一些经验,并将在未来几年为他们创造更大的业务。

亚马逊网络服务(AWS)、微软、谷歌、IBM等公司在过去一年中增加了数十种云计算人工智能工具,并且具有不同程度的复杂性。这些平台是否选用这些工作负载取决于人工智能和机器学习如何适应企业的业务战略。尽管如此,这些云计算供应商已经急于填补他们的服务空白,并让那些主要以机器学习为业务的企业和那些面临压力的、具有一定目标和策略但缺乏经验的公司能够接触到人工智能。

尽管基于云计算构建的基于人工智能的应用程序有一些早期的成功案例,但大部分市场仍处于观望状态,特别是深度学习。调研机构Gartner公司分析师Chirag Dekate表示,企业需要对所采用的技术进行选择,无论是从头开始构建,还是简单地集成一些API驱动的云服务(如语音和图像识别)。

4

“企业的IT领导者已经认识到人工智能的价值。”他说,“亚马逊、谷歌、微软和其他公司正在对人工智能技术投入大量资金,用于内部消费和基于云计算的外部消费,因为他们知道这些高级分析功能将具有巨大的价值。”

展望未来,Dekate表示他期望这些提供商在增加人工智能云服务的功能方面更加积极。目前由于对人工智能技术不太熟悉,可能会影响云计算供应商的业务,因为他们希望争夺客户,特别是那些想要尝试人工智能产品的客户。

总部位于佛罗里达州坦帕市的移动网络商Syniverse公司通过与VMware公司的合作将其vRealize协调的私有云扩展到IBM Cloud和AWS云平台。该公司并未使用许多云原生服务,但将其视为平台之间潜在的差异化因素。

“我们认为一个很有发展的领域是人工智能和基于机器学习的工具,这可以使我们能够快速为客户创建新的报告和分析。”Syniverse首席技术官Chris Rivera说。

从初级到高级的人工智能云服务

云计算提供商基本上在其平台上构建了三个层次的人工智能服务。最底层的人工智能也是最复杂的,但可以提供最佳性能,位于基础设施层。主要提供云计算的供应商支持流行的框架,如TensorFlow或Apache MXNet以及基于GPU的虚拟机,然后可以提供其他可能的服务来构建和训练模型。

谷歌在日前推出了TensorFlow集成TPU实例类型的测试版本,该类型基于定制处理器。

第二层次的人工智能是一个为数据科学家量身打造的新兴空间,但它抽象了大部分底层基础设施,并集成了硬件配置和机器学习框架。它将人工智能更好地作为即服务类别,其中包括IBM Watson,Amazon SageMaker,Microsoft Machine Learning Studio,Google Machine Learning Engine和Google AutoML等工具。

第三层次的人工智能涉及可以集成到现有应用程序中的基于API的插件服务。这些将面向人工智能的应用新手,并且所有主要供应商都有一些提供认知、语音和图像识别工具的服务。

Dekate说:“无论是数据科学家还是建筑师或开发人员,都试图开发一个基于人工智能的智能应用程序,他们基本上都试图将应用程序引入自己的生态系统。”

了解云计算人工智能的优点和缺点

然而,由于这些GPU加速节点需要更多计算能力,并且训练模型需要大量数据进行存储和处理,所以公共云受到了深度学习和大量用户的限制。

“大多数组织都在试图通过最大的资本支出来采用人工智能。”他说,“但是,如果深度学习是组织的中流砥柱的话,那么在数据中心中建设就更有意义。”

深度学习对于图像识别和文本分析等特定需求的企业来说非常有用,但即使深度学习神经网络的创建者也不得不承认,解决企业所面临的更广泛问题的人工智能并不是解决问题的灵丹妙药。尽管在内部部署数据中心开展这项工作有一些成本优势,但重要的是数据引力的警告。他说,如果企业的数据已经在公共云上运行,那么在云端完成这项工作会更有效,而不会产生迁移的成本。

总部位于纽约的Alpha Vertex公司在谷歌云平台上培训机器学习模型,并将其融入其针对金融行业的分析服务中。如果这些模型整天运行在最大的实例类型中,那么肯定会面临成本问题,但该公司已经构建了基础设施,以使用成本更低、规模更小的虚拟机和竞价型实例。在训练分析模型时,它还使用Kubernetes从大约20个虚拟机扩展到1000多个虚拟机,这可以避免内部资源利用不足的问题。

“采用Kubernetes,就像管理一两个人与管理整个部门的区别。,”Alpha Vertex公司首席技术官Michael Bishop说。

企业通过内部迁移这些模型的成本效益分析,始终如一地支持将其留在云端,以保持其技术领先地位的需要。

“高端GPU的成本相当高,并且没有一个很好的摊销生命周期。”Bishop说,“如果企业依靠大量投入资源来采用这种技术的话,那么真的很难跟上其发展的步伐。”

Zendesk公司构建了Answer Bot,它是使用Amazon Simple Storage Service,GPU实例,TensorFlow,以及Amazon Aurora的客户虚拟助理。这个机器人使用深度学习预测模型来识别常见问题,并更快速地回答客户问题,并提出最佳实践。

Answer Bot去年年底在AWS云平台上增加了SageMaker服务,这个在抽象大部分底层基础设施管理之前就已经问世了,但是Zendesk公司将以自2011年以来使用AWS的相同原因考虑这项服务:卸载底层IT操作,并专注于其核心业务。

“任何管理工作都不是真正的数据科学工作。” Zendesk公司技术运营副总裁Steve Loyd说,“SageMaker的承诺是它可以为用户提供更多的围绕TensorFlow构建的全套接口和自动化功能,并且可以让用户以更少的成本实现更多的目标。”

除了炒作之外,人工智能还需付出努力

Loyd表示,数据科学家不仅建立这些模型,而且还要不断验证。如果能够采用工具更好地解决底层基础设施问题,数据科学家就有更多时间调整其算法。随着AWS公司和其他云计算提供商使他们的人工智能工具集更易于使用,机器学习的进入门槛将会继续下降,因此从数据集中获取数据更容易。

但即使是人工智能用户也认为这不是万能的,特别是因为大多数模型的功能相对简单。许多公司确信他们需要人工智能技术,但不知道该怎么做。

“人们对于人工智能最大的误解之一是,人工智能就像一种炼金术或是一个魔术盒,只要付出和努力,就会获得惊人的成果。”Alpha Vertex公司的Bishop说,“但获得高质量的结果非常困难,我认为人们不会完全理解这一点。”

尽管如此,他们警告说放弃人工智能只是因为炒作的结果与现实不符。Dekate指出,比云计算供应商的人工智能技术更重要的是,企业如何整合这些技术并加速他们自己的创新。那些成功的企业比较务实,在数据和基础设施管理方面拥有良好的基础。

“每个组织都将需要有一个人工智能策略,”他说,“采用机器学习和人工智能是一个长期的事情,但现在必须参与其中,这样企业才能在竞争中领先。”

文字来源:机房360