AI创新下的生成式人工智能——Amazon Bedrock

原创

淼学派对 2024-06-12 11:24:06 博主文章分类：推广 ©著作权

文章标签 人工智能 Amazon 生成式数据 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者淼学派对的原创作品，请联系作者获取转载授权，否则将追究法律责任

什么时生成式人工智能

亚马逊云的生成式 AI产品

Amazon Bedrock VS Amazon SageMake

Amazon Bedrock的由来

Amazon Bedrock 的申请与使用

Amazon Bedrock 的使用案例

什么时生成式人工智能

生成式人工智能（Generative Artificial Intelligence，简称生成式 AI）是一种基于机器学习和人工智能技术的范畴，其目标是让计算机系统能够自主地生成各种类型的数据，如文本、图像、音频等，而不仅仅是对已有数据的模仿或分类。生成式 AI 的核心能力在于创造新的内容，而不仅仅是对已知模式的重复应用。其中，生成式人工智能模型是生成式 AI 的重要组成部分，而 chatGPT 就是其中的一种代表性模型。成式 AI 的原理基于深度学习，特别是神经网络技术，它可以通过分析大量的训练数据来学习数据的分布和模式，然后利用这些学习到的模式来生成新的数据。生成式 AI 不仅可以生成高质量的文本，还可以用于图像生成、音乐创作、视频生成等各种领域。

亚马逊云的生成式 AI产品

AWS 为大型语言模型开发人员提供了多种可能性。Amazon Bedrock 是使用 LLM 构建和扩展生成式人工智能应用程序的最简单方法。Amazon Bedrock 是一项完全托管的服务，可通过 API 提供来自 Amazon 和领先 AI 初创企业的 LLM，因此您可以从各种 LLM 中进行选择，找到最适合您的应用场景的模型。

AI创新下的生成式人工智能——Amazon Bedrock_Amazon

Amazon Bedrock VS Amazon SageMake

mazon Bedrock和Amazon Sagemaker是两个独立的服务
Amazon SageMaker是端到端的机器学习平台，它的功能包括从数据标注到数据训练、再到部署、上线以后的持续监控以及基于原始数据的再迭代等端到端的能力。在生成式AI大模型出现之前，它就已经非常成熟的在帮助客户解决问题了。
Amazon Bedrock的定位是要解决以下几个核心的问题：
一是能帮客户快速找到行业领先模型，并通过API的方式尽可能的不用客户自己去管理底层硬件和运维即可访问。
二是，用户采用Amazon Bedrock做模型调优和训练的时候，和使用Amazon SageMaker的区别是，Amazon SageMaker首先是面向数据科学家，需要编写代码并提供数据以及添加参数去做模型和调优。从应用形式上，在Bedrock里面，客户只需要提供20个已经标注好的数据，就可以很快展开，不需要编写太多的代码。
二者基本的区分如果画一下用户画像的话，SageMaker是针对专业人员，Bedrock是尽可能降低门槛，让偏向于行业的场景用户能够更好的用起来。
Bedrock作为一个新的、生成式AI的生产工具，依托于现有的五个已经预设的基础模型，通过API直接调用，生成更多的内容。 Amazon SageMaker是全方位的、全功能化的机器学习工具，包括数据标注到训练到推理，整个能力都是具备的，同时它也有一些预设的能力。可以根据需要选择适用的场景。也就是说，Bedrock只是在生成式AI领域，Amazon SageMaker是针对所有机器学习和人工智能领域。生成式AI只是AI的一部分，而Amazon SageMaker是面向整个AI/ML的。
另外，在部署集成方面，Amazon SageMaker和Bedrock还有一些结合点。事实上SageMaker的某些功能可以被复用到Bedrock训练出来的模型上面。比如客户通过Bedrock自己定制了一个模型出来，新的模型在应用的时候，模型管理的流程是可以互通的。客户可以将基础模型与 Amazon SageMaker 机器学习功能集成，使用 Experiments 测试不同模型和使用Pipelines 大规模管理基础模型等等。

Amazon Bedrock的由来

具体来说，Bedrock主要包含两部分，一个是亚马逊云科技自己的模型Titan，另一个是来自初创公司AI21 Labs、Anthropic，以及Stability AI的基础模型。

基础模型具体包括：

Amazon自研Titan
Claude（Anthropic）
Jurassic-2（AI21 Labs ）
Stable Diffusion（Stability.AI）

AI创新下的生成式人工智能——Amazon Bedrock_人工智能_02

Titan基础模型的构建是基于亚马逊云科技在机器学习领域20多年的经验。Titan包含了两个大语言模型，一个是用于生成文本的Titan text，一个是让网络搜索个性化的Titan Embeddings。Titan text针对的是总结、文本生成、分类、开放式问答和信息提取等任务。文本嵌入Titan Embeddings模型，能够将文本输入（字词、短语、大篇幅文章）翻译成包含语义的数字表达（embeddings入编码）。

AI创新下的生成式人工智能——Amazon Bedrock_人工智能_03

用户可以通过自己的数据定制Titan模型。并且，亚马逊云科技非常保护用户数据隐私，不会将用户数据拿来再训练Titan模型。而且，不同于其他大模型时常会出现的「幻觉」，Titan在训练时非常关注精度，就是为了保证产生的响应一定是高质量的。除了亚马逊云科技的Titan模型，开发者们还可以利用其他的基础模型。其中包括AI21 Labs开发的Jurassic-2多语种大语言模型系列，能够根据自然语言指令生成文本内容，目前支持西班牙语、法语、德语、葡萄牙语、意大利语和荷兰语。还有Anthropic开发的大语言模型Claude，能够执行多轮对话和文本处理任务。第三个基础模型便是Stability AI的文本图像生成模型Stable Diffusion。通过这些模型，开发者只用20个样本，就能一键定制自己的模型。

AI创新下的生成式人工智能——Amazon Bedrock_数据_04

举个例子，一位营销经理想为手提包新品开发广告创意，他只需向Bedrock提供标注过的最佳广告，以及新品描述，Bedrock就能自动生成媒体推文、展示广告和产品网页。同样的，所有数据都进行了加密，任何客户数据都不会被用于训练底层模型。目前，Coda AI、Deloitte、埃森哲、Infosys等合作伙伴已经用上了Bedrock。

Amazon Bedrock 的申请与使用

首先在使用Bedrock之前要首先申请模型的访问权限，目前只在us-east-1,us-west-2,ap-southeast-1,ap-northeast-1中可用，需要先申请模型的访问权限，对于所有模型，默认都是没有开放的，在model access界面首先选择请求访问，会让您这边填写一下公司名称，网址，用途，然后请求访问权限就好，这边公司网址尽量选择海外，目前中国区域不稳定，另外这个账号的付款公司也是需要选择海外的，之后选择自己所需模型。
登录Bedrock控制台之后，首先到model access界面，点击Edit，勾选需要的模型，如不需要的模型只要勾选留空会自动删除，然后选择保存，保存之后就可以使用所提供的模型了，比如Claude和Stable Diffusion XL等。因为使用外海时默认为英文状态下的控制台。

AI创新下的生成式人工智能——Amazon Bedrock_人工智能_05