中评社北京4月17日电/据澎湃新闻报道,亚马逊公司终于宣布加入生成式AI竞赛,但不是完全由自己构建人工智能模型,而是招募第三方在亚马逊云上托管模型。
当地时间4月13日,亚马逊云科技(AWS)推出Amazon Bedrock,这意味着通过API(应用程序编程接口)即可访问来自AI21 Labs、Anthropic、Stability AI和亚马逊的基础模型,幷由此构建生成式AI驱动的应用程序。
目前,Bedrock以“有限预览”(limited preview)的形式提供,同时AWS还提供对Amazon Titan模型(由AWS在内部训练的一系列基础模型)的访问。
亚马逊在生成式AI市场的最有力举措
根据Grand View Research的估计,Bedrock是亚马逊迄今为止在生成式AI市场上最有力的举措,到2030年该市场的价值可能接近1100亿美元。
生成式AI是人工智能的一种,能够创造新内容和想法,包括对话、故事、图像、视频和音乐。与所有人工智能技术一样,生成式AI的能力由机器学习模型提供。这些模型是基于大量数据进行预先训练的大模型,通常被称为基础模型(Foundation Models)。
机器学习的最新进展(特别是基于Transformer的神经网络架构的发明)直接带来这一类模型的爆发式增长,这类模型通常包含数十亿个参数或变量。2019年最大的预训练模型是3.3亿个参数。现在,最大的模型的参数超过5000亿个,相当于几年间增加了1600倍。
借助Bedrock,AWS客户可以选择通过API使用来自不同提供商(包括AWS)的AI模型。不过,目前还有诸多细节尚未公布,比如正式的定价。AWS强调,Bedrock的目标是构建“企业级”AI应用程序的大客户,将其与现有的一些AI模型托管服务区分开来,例如竞争对手谷歌云和微软云。<nextpage>
Bedrock上托管的第三方模型包括AI21 Labs的Jurassic-2系列,这是一个多语种大语言模型,可以生成西班牙语、法语、德语、葡萄牙语、意大利语和荷兰语的文本;还有Anthropic开发的大语言模型Claude,它基于Anthropic对训练诚实和负责任的AI(responsible AI)系统的大量研究,能够执行多种对话和文本处理任务;Stability AI开发的文生图基础模型Stable Diffusion也可通过Bedrock访问,这是文生图领域目前最流行的模型,能够生成图像、艺术作品、商标和其它设计图。
至于亚马逊的定制产品——Titan模型目前包括两种:文本生成模型和文本嵌入模型。文本生成模型类似于OpenAI的GPT-4(但在性能方面不一定相同),可以执行诸如撰写博客文章和电子邮件、总结文档以及从数据库中提取信息等任务。
嵌入模型能够将文本输入(字词、短语甚至是大篇幅文章)翻译成包含语义的数字表达(即embeddings嵌入编码)。虽然这种大语言模型不生成文本,但对个性化推荐和搜索等应用程序却大有好处,因为相对于匹配文字,对比编码可以帮助模型反馈更相关、更符合情境的结果。亚马逊云科技生成式AI业务全球副总裁瓦西·菲罗明(Vasi Philomin)称,亚马逊网站的产品搜索就采用了类似的文本嵌入模型。
除此之外,AWS还宣布“AI编程助手”Amazon CodeWhisperer正式可用(去年推出了预览版)。据悉,其在适用Python、Java、JavaScript、TypeScript和C#之外,新增支持Go、Kotlin、Rust、PHP和SQL等10种开发语言。开发者可以通过在VS Code、IntelliJ IDEA、Amazon Cloud9等集成开发环境中的Amazon Toolkit插件访问CodeWhisperer。
亚马逊云科技数据库、数据分析和机器学习业务全球副总裁斯瓦米·西瓦苏布拉姆尼安(Swami Sivasubramanian)称,在预览期间曾进行了一项生产力测试。与未使用CodeWhisperer的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高 27%。“这是开发人员生产力的巨大飞跃,而我们相信这才仅仅是个开始。”<nextpage>
不同的路:瞄准企业客户
与谷歌和微软已发布面向大众的产品相比,亚马逊云服务显然瞄准的是企业客户。菲罗明在采访中表示,“我们认为,每个应用程序都可以通过生成式AI进行重新构想。”
“现在整个世界都在争先恐后。”AI文档初创公司Coda的首席执行官兼AWS新AI产品的早期测试员石西尔·梅罗特(Shishir Mehrotr)表示,目前公司急于为这项新技术做好准备,这类似于从计算机到智能手机的转变。
AWS正在开辟一条不同的道路,迄今为止没有对其他人工智能公司或面向消费者的工具进行重大投资。AWS表示,希望为整合生成式AI功能的企业充当一个中立平台,也就是说不依赖于任何一家人工智能初创公司。
“我们认为,客户将需要许多不同的生成式AI模型来满足不同的目的,而且任何一种模型都不可能满足所有客户,甚至不可能满足一个客户的所有需求。”亚马逊云服务CEO亚当· 塞利普斯基(Adam Selipsky)说。
去年11月,Stability AI选择AWS作为其首选云提供商。今年3月,Hugging Face与AWS合作,将前者的文本生成模型引入AWS平台。最近,AWS为初创公司推出了一个生成式AI加速器,幷表示将与英伟达合作构建“下一代”基础设施来训练AI模型。
法律问题隐忧
实际上,围绕生成式AI还有许多未解决的法律问题。<nextpage>
微软的生成式AI模型套件Azure OpenAI Service取得了成功,该套件将OpenAI模型与面向企业客户的附加功能捆绑在一起。微软在一篇博文中表示,截至3月,已有超过1000名客户在使用Azure OpenAI服务。
但是,包括OpenAI和Stability AI在内的生成式AI技术公司,目前已面临几起诉讼。原告称,这些公司未经许可使用受版权保护的数据来训练生成模型。生成式AI模型通过对样本图像和文本进行“训练”来“学习”创造艺术、代码等,这些图像和文本通常是从网络上直接抓取的。此外,澳大利亚的一位市长因ChatGPT发布不准确言论威胁要对OpenAI提起诽谤诉讼。
实际上,对于亚马逊的Titan FM系列模型,菲罗明也幷没有透露究竟是在哪些数据上进行训练的。但他强调,Titan模型的建立是为了检测和删除AWS客户所提供数据中的“有害”内容,拒绝用户输入的“不恰当”内容,以及过滤包含仇恨言论、粗俗语言和暴力内容的输出。可是,正如ChatGPT所展示的那样,即使是非常好的过滤系统也可以被绕过。 |