尽管生成式人工智能(genAI)模型有望在规模上缩小以满足更明确定义的需求和企业预算,但仍有大量服务提供商正在制定基于提供AI云服务的收入路径。
在上周致股东的年度信中,亚马逊首席执行官安迪·贾西表示,公司将减少构建面向消费者的genAI应用,更多地专注于向企业客户提供可通过网络服务出售的AI模型。
“有时人们会问我们,‘你们的下一个支柱是什么?你们已经有了Marketplace、Prime和AWS,接下来呢?’贾西写道:“如果你今天问我,我会以生成式人工智能为首。我们对大部分具有改变世界意义的人工智能都建立在AWS之上感到乐观。”
贾西对AI服务收入流的期望并不失实。根据IDC对2000多名IT和业务决策者的调查,组织计划在未来一年半内将对AI倡议的投资增加10%至15%,相比2022年日历年。
去年秋季,亚马逊推出了Bedrock,通过AWS云提供各种大型语言模型(LLMs),组织可以通过这些模型构建genAI应用。该公司还最近推出了Amazon Q,一个基于云的AI辅助软件编码助手。
亚马逊的Bedrock通过单个API提供了来自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI以及亚马逊自己的LLM的AI“基础模型”。亚马逊的AI云客户名单现在包括ADP、Delta航空、GoDaddy、Intuit、辉瑞和西门子。
目前云计算是向企业交付genAI应用的所有其他方法中的佼佼者;这是因为构建专有基础设施的成本很高。自OpenAI在2022年11月推出ChatGPT以来,亚马逊网络服务、谷歌、IBM、微软和甲骨文已经投资了数十亿美元用于AI云服务。
“只有超大规模公司和超大规模公司才能负担得起训练和运行非常大的LLMs和基础模型,”Gartner杰出副总裁分析师Avivah Litan说:“这些成本达到了数亿美元。”
Litan指的是具有数千亿参数的模型,例如,那些具有少于1000亿参数的模型。然而,使用云服务提供的LLMs的成本“相对可控”,而且“目前也是由超大规模公司补贴的,”Litan说。
然而,随着企业继续扩大其genAI应用的试点,云服务的成本可能成为一个限制因素。相反,许多组织正在寻求部署更小的、针对特定任务的本地LLMs。
埃森哲全球人工智能咨询负责人丹·迪亚西奥表示,基于更多数据训练的较小领域特定模型最终将挑战当前主导地位的大型LLMs,包括OpenAI的GPT 4、Meta AI的LLaMA 2和谷歌的PaLM 2。较小的模型也将更容易针对特定用例进行训练。
根据Gartner研究,到2025年,由于数据质量不佳、风险控制不足、成本不断上升或业务价值不明确,30%的genAI项目将在概念验证(POC)后被放弃。到2028年,超过一半从头开始构建自己的LLMs的企业将因成本、复杂性和部署中的技术债务而放弃他们的努力。
根据Gartner最近的一份报告,当前的供应商定价模型可能会将创新、开发、训练和运行LLMs的高成本转嫁给企业,这意味着企业可能看不到他们的AI项目的投资回报。即使定价由希望获得早期市场份额的供应商补贴,这通常也不足以产生快速回报。Gartner表示,相反,组织应该从genAI中长期获得生产力增益和投资回报。
弗雷斯特研究公司的首席分析师李·萨斯塔尔表示,通过云端的AI服务将继续增长,因为AWS Bedrock、Azure AI和Google Cloud Vertex等产品降低了进入门槛。
“考虑到云中的数据引力,通常从训练数据开始是最简单的。然而,将会有很多用例适用于较小的LLMs和边缘AI推理。此外,云提供商将继续通过Kubernetes平台提供构建自己的AI平台的选择,这些平台数据科学家已经使用了几年,”萨斯塔尔说:“这些实现将在数据中心内部进行,使用如红帽OpenShift AI之类的平台。与此同时,新的GPU定向云,如Coreweave,将提供第三个选择。这还处于早期阶段,但云提供商提供的托管AI服务将继续是AI生态系统的核心。”
虽然较小的LLMs正在崛起,但根据Litan的说法,企业仍将使用主要公司的AI云服务,当他们需要访问非常大的LLMs时。即便如此,更多的组织最终将使用运行在更小硬件上的小型LLMs,“甚至可以是普通笔记本电脑。
“我们将看到支持该配置以及所需的隐私、安全和风险管理服务的服务公司的崛起,”Litan说:“这两种模式——非常大的基础模型云服务交付和小型基础模型私有云服务交付——都有足够的空间。”
亚马逊早期的AI云服务之一是Sagemaker,这是一个集成开发环境(IDE),供开发人员和工程师构建、训练和部署机器学习和AI模型。“Bedrock在短短几个月内就有了数万名活跃客户,表现非常强劲,”贾西写道:“不像大规模将现代化的基础设施迁移到云端……,这场genAI革命将从一开始就建立在云端之上。”