Amazon Web Services GenAI

热点与趋势追踪

  • Manus智能体助手引爆行业需求
    • Manus.im发布了50多个Agent应用场景,引发了对企业定制版智能体场景的广泛需求,尤其是在行业头部客户中。
    • 实现基础:MCP + Agent + Computer Use + Coding,效果取决于模型能力。
    • Claude 3.7 Sonnet:超强的Coding、Agentic、Reasoning和多模态能力使其成为首选。
    • 先发优势:AWS是唯一正式可用的Claude 3.7 Sonnet云厂商,推动智能体助手项目。
    • 资源支持:AWS提供智能体实现的演示系列和落地方法,包括Computer Use Deep Dive、电商Computer Use Demo、快速演示视频、带解说版本、MCP Multi-agent Demo、MCP + DeepResearch Demo,以及代码和Bedrock Multi-Agent Agent Demo。

Use Case With Suggested Model

  • 模型选择建议:根据不同使用案例选择适当的模型。
    • 实时翻译
      • 模型:Nova(低延迟敏感,低成本)
    • 图像识别:
      • 模型:Nova(准确率高,性价比高)
    • 图片生成:
      • 模型:DeepSeek(擅长推理策划)
    • 角色扮演:
      • 模型:Claude(角色生动,特征一致性)
    • 代码生成:
      • 模型:Claude(社区高口碑)
    • 内容分析与创作:
      • 模型:Claude(强文本理解、创作、生成能力)
    • 运营策划,学术研究:推荐使用。
      • 场景一:一个场景推荐合适的性价比和能力适配模型。
      • 场景二:一个场景需要多个模型的参与实现最佳效果,针对场景选择模型。

Use Case With Model Combos

  • 模型组合案例:结合多个模型实现最佳效果
    • 代码伴侣:DeepSeek R1 + Claude 3.5/3.7(用于架构设计和代码生成)。
    • Multi Agent:Claude Haiku(Agentic Planner,Function call)+ DeepSeek R1/Claude 3.7(DeepResearch)。
    • Chatbot:Nova Lite(Content recognition)+ Claude 3.5/3.7。
    • 复杂翻译系统:Nova Lite(高阶翻译审查,初始翻译)+ Reasoning(持续迭代Complex jobs).
    • 应该根据实际的场景选择合适的模型组合。

企业使用生成式 AI 的主流应用场景

  • 应用场景
    • 翻译:社交、游戏、电商、零售、制造、金融、媒体 (聊天翻译、客服翻译、小说翻译)
    • 审核:跨行业 (聊天内容审核、评论审核、视频审核、图片审核)
    • 智能运营:电商、零售、游戏、媒体、差旅、制造 (评论反馈、舆情分析/VOC、报告分析、文字与图片标签识别与分类)
    • 智能开发:跨行业 (代码生成、原型制作、代码审核、AIops)
    • 内容写作:游戏、社交、媒体、电商 (文案写作、故事或剧本创作、营销内容创作、多媒体内容制作、角色描述生成)
    • 智能运维:跨行业 (运维问题排查、一键生成架构图、一键部署Java项目)
    • 角色扮演:游戏、社交 (角色扮演/NPC/AI伴侣、社交聊天、虚拟陪伴、游戏互动、数字人互动)
    • 知识助手:跨行业 (问答助手、知识库构建和检索、智能问答系统、文档理解和QA生成、研究分析助手)
    • 智能办公:跨行业 (文档处理、会议记录和总结、日常办公自动化)
    • 智能客服:跨行业 (智能客服问答、客服质量检测、客服培训、智能导购)
    • 智能教辅:教育 (智能教学、题目解答、培训系统、教育评估、学习规划、学情分析)
  • 外部链接
    • GenAI Asset Hub (技术资产)
    • Bedrock 公开案例集链接

翻译

  • 目标:以快速、高质量、低成本实现内容本地化,实现翻译的信、雅、达
  • 问题
    • 人力翻译:成本高、效率低
    • 机器翻译:翻译生硬、上下文理解差、特殊词汇定制化弱、成本较高
  • 应用场景
    • 实时翻译:聊天室实时翻译、客服实时翻译
    • 短视频翻译:字幕翻译、剧本翻译
    • 离线翻译:财报翻译、小说翻译、电商产品描述翻译、说明书翻译、营销文案、策划文案翻译等
  • 一级场景:翻译
  • 二级场景:字幕翻译、小说翻译、文档翻译、聊天翻译

模型选择建议(翻译)

  • 字幕翻译:优先Claude Sonnet
    • 语言理解深度、语言风格保留、语境适应能力、语言简洁精准的同时保持一致性强
  • 小说翻译:优先Claude Sonnet
    • 文学性把控能力、意境还原能力、语言多样性以及文体一致性、文化转换深度等,以及reasoning mode下有更长的output长度 (64K, 128K Beta)
  • 文档翻译:优先Claude Sonnet
    • 保持格式结构完整性,技术术语翻译准确,上下文理解以及长文本处理能力强,多语言的支持,以及reasoning mode下有更长的output长度 (64K, 128K Beta), Amazon Nova Pro为辅
  • 聊天翻译:优先推荐Amazon Nova
    • 延迟,成本为先的场景 – 优先推荐Amazon Nova (Micro和Lite,Micro为延迟和成本最低的模型首选),其他考虑Claude Haiku代替传统机翻的最佳场景

您可以使用 Amazon Bedrock 执行以下操作

  • 实验提示和配置
  • 利用数据源信息增强响应生成
  • 创建能够推理如何帮助客户的应用程序
  • 使用训练数据使模型适应特定任务和领域
  • 提高基于基础模型的应用程序的效率和输出
  • 确定最适合您用例的模型

小说翻译 – 样例

  • 文学性把控能力、意境还原能力、语言多样性以及文体一致性、文化转换深度,模型选择Sonnet
  • 给出了一个中英文的小说翻译样例,说明了翻译之后保留了文学性。

文档翻译 – 样例

  • 保留了文档格式,专用词语翻译准确保持格式结构完整性,技术术语翻译准确,上下文理解以及长文本处理能力强,多语言的支持

商品描述翻译

  • 专业词汇翻译准确,小语种发挥稳定
    • 保持商品专业术语准确性
    • 多语言能力强
    • 语境理解能力
    • 保留关键营销元素
    • 格式保持一致,模型选择Sonnet
    • 给出了一个商品描述翻译的例子,包括简体中文、英语、马来语和乌尔都语。

长文本翻译工作流 – 利用Agent反思优化提升 AI 翻译质量

  • Translation Agent 的核心在于其独特的“反思工作流”,该工作流模拟了人类翻译专家的思考过程,将翻译任务分解为三个主要步骤:
    • 初始翻译:Translation Agent 首先利用 LLM 对输入文本进行初步翻译,得到一个初步的译文。
    • 反思与改进:与传统机器翻译系统直接输出译文不同,Translation Agent 会引导 LLM 对自身的翻译结果进行反思,并提出改进建议。
    • 优化输出:最后 Translation Agent 根据 LLM 提出的改进建议,对初始译文进行优化,最终生成一个更加精准、流畅且符合目标语言习惯的译文。
    • 最新模型提供混合推理模式
    • 大幅提升支持更长输出Token (最长到128K)
    • Agent等领域表现显著提升
    • 推理成本可调
  • 使用Claude组合

字幕翻译 – 样例

  • 语言理解深度、语言风格保留、语境适应能力、语言简洁精准的同时保持一致性强,模型选择Sonnet

  • 将下面对话字幕翻译成中文,俚语翻译要地道,特点要保留,口语翻译要原汁原味

    • 提供了一个字幕翻译的例子,展示了Sonnet模型在俚语翻译和口语翻译方面的能力。

聊天翻译 – 样例

  • 即时IM聊天:速度与成本兼具代替传统机翻即时消息低延迟快速响应、符合应用的语境与口语化表达、成本远优于传统机翻 (4%-10%),模型选择Nova/Haiku

Case - Nova Win Case

  • 利用Nova模型进行在线翻译可以替代谷歌翻译
  • 挑战:产品翻译质量、延迟、稳定性、成本
  • 模型选择:根据客户情况及过往经验,选择了Nova-Micro; Haiku 3; Sonnet V1 三款模型,分别从响应时间,稳定性,翻译质量,成本等维度进行评估。最终推荐选择Nova- Micro模型。推荐客户使用COMET评分,提升运营决策效率。
  • 方案设计
    • 使用CRI方式提升模型回复的稳定性。
    • 推荐使用Converse API调用,提升响应速度。
  • 上线结果
    • 实际推理延迟在300-400ms之间。满足业务需求。
    • 每分钟消耗Token 80K/Min(40K Input + 40K output)
模型推理时间推理时间标准差COMET 评分成本(对比谷歌翻译)
Nova Micro450ms500.8234成本为谷歌翻译的 4%
Haiku 3400ms2100.4722成本为谷歌翻译的 11%
Sonnet V1707ms196--

GenAI Asset - 翻译相关

  • 基于LLM的专词翻译方案 Deck Link1 Code Repo Link1 Demo Link1
  • PPT翻译 Deck Link1 Code Repo Link1 Demo Link1
  • 视频字幕自动翻译 Deck Link1 Code Repo Link1 Demo Link1
  • 图片翻译 Deck Link1 Code Repo Link1 Demo Link1
  • 基于 Bedrock的多模型Agent和反思式翻译工作流 Code Repo Link1
  • 实时语音翻译成多种语言 Deck Link1 Code Repo Link1 Demo Link1

海艺互娱案例

  • 关于企业:海艺互娱以游戏领域为起点,打造全流程艺术创作平台,并降维推广到其他领域包括平面设计、电商广告、品牌营销等垂直领域。
  • 业务需求
    • SD具有上手门槛,提示词的语种和质量影响生图质量。输入提示词过程只支持英文,生成的图片质量会随着提示词的丰富程度和结构有较大的区别,对使用者语言能力和提示词要求较高 ,工作效率得不到发挥。
    • 提升客服系统体验,海艺互娱用户规模迅速扩张,现有客服系统无法满足需求。
  • 解决方案
    • 应用 Amazon Bedrock 为生成式 AI 绘图过程作提示词优化,可将超过30+种语言的用户输入提示词翻译为英语;并且提供提示词工程服务,自动对用户输入的不完善的提示词进行补充和优化,帮助生成更高质量的图片。
    • 通过接入 Amazon Bedrock 应用生成式 AI 赋能星云智能客服系统,自动化识别用户意图、丰富客服知识库、提升用户交互的方式,迅速解决了 客服资源瓶颈问题。通过深度分析用户的历史交互数据和行为特征,智能匹配用户需求,帮助用户迅速找到所需信息,解决问题。
    • 数据分析可视化,基于生成式AI的数据分析功能,高效处理和分析大量数据,生成直观的视觉化图表,优化服务策略。
  • 收益
    • 用户满意度提升超过 50%。
    • 支撑海艺互娱网站月活跃用户数超过 1000 万,实现了 1.4 倍的增长。
    • 利用大模型实现多语言翻译,节省超过 50% 的运营成本。
    • 从初步接洽、POC 测试、架构部署,到最终业务上线,整个过程仅仅花费一个月就得以高效落地

智能运营

  • 一级场景:智能运营

  • 二级场景:VOC、报告分析

模型选择建议 (智能运营)

  • VOC:优先Claude Sonnet
    • 高精度文本理解能力、多维度分析能力、结构化输出能力、多语言处理能力
  • 报告分析:优先Claude Sonnet
    • 能够理解复杂的术语和专业表达、能够多种格式、多元数据处理获取关键信息、特殊功能如更深层次的趋势分析、复杂的逻辑推理 reasoning mode下有更长的output长度 (64K, 128K Beta),结合Multi-agent工作流,可以结合多模型组合方式来推荐

Voice of Customer (VoC) 评论分析 / 舆情分析

  • 业务价值:针对商品评论、行业报告、第三方社交媒体、客户服务反馈等用户服务场景,生成舆情分析与洞察报告;了解终端客户情绪,判断营销价值,提高效率并且得到更精准的总结与洞见,如:

    • 分析客户反馈和投诉,改进客户服务质量,提高客户满意度。
    • 根据客户的意见和情绪,优化广告和宣传的内容,分析关键词和话题趋势等,帮助企业做出更好的营销和决策。
    • 通过分析社交媒体、客户社区评论等,用户对特定商品、活动事件的观点,以及竞争对手的评价和比较,发现客户的需求,为产品改进提供参考。
  • 可行性:无需定制化,直接借助基础模型对超长上下文窗口的文本分析、总结和生成能力,实现快速验证和生产。

  • 一个VoC样例,细致的分类,模型选择Sonnet

报告分析 财报分析 – 样例

  • 根据提供的财务报告,以下是NVIDIA 2024财年的核心财务分析:

    • 业绩亮点:
      • 收入大幅增长126%至609亿美元
      • 毛利率提升15.8个百分点至72.7\%。
      • 营业收入激增681%至330亿美元
      • 每股收益飙升586%至11.93美元
    • 业务分部表现
      • 计算与网络部门收入474亿美元,同比增215%
      • 图形部门收入135亿美元,增长14%
      • 计算与网络部门营业收入增长530%,为主要增长动力
    • 技术创新
      • 推出Hopper GPU计算平台、Grace CPU、Blackwell GPU架构等新产品
      • 在AI、数据中心、网络、汽车等领域持续创新
    • 股东回报
      • 5年总股东回报率达1436%
      • 5年内回报股东218亿美元,包括198亿美元股票回购和20亿美元股息
  • 老铁的非正式分析

报告分析 财 报 分 析 – 进 阶 版 – 样例

  • 展示了如何使用 Sonnet 利用MCP on Bedrock Asset 做财报分析,通过自然语言指令生成详细的股票分析报告,并保存为HTML文件。

Multi-Agent金融投资助手投资分析

  • 样例 使用Claude组合

标签识别

  • 这是一张社区中用户上传的图片,识别并罗列其中的主要商品,然后为图片打标签,提示词 模型选择Sonnet

Shulex案例

  • 关于企业:Shulex (Voc.ai) 是一家面向全球 VOC 市场的 AI SaaS 公司。
  • 业务需求
    • 客户触点分散,VOC数据分析与洞察难
    • 用户需求日趋多样化
  • 解决方案
    • 海量客户反馈进行数据和语义分析
    • 构建出对应的 RAG 框架,识别和确认用户的意图,进行知识召回;并对 现有知识库内容进行排序,以在后续回答时进一步提升命中率,对整个 RAG 框架的逐步强化
    • 轻松创建和部署完全托管式的Agent
  • 收益
    • 用户满意度提升15.4\%,用户留存率提升12.1\%.仅用三周就完成 Shulex 应用的落地
    • 模型迭代时间缩短了30\%.整体模型迭代时间比使用传统 IDC 训练的方式缩短了 30%

GenAI Asset – 运营相关

  • 智能CDP/CRM Code Repo Link1
  • 快速上手使用 Amazon Bedrock Multi-Agent Collaboration Deck Link1 Code Repo Link1

内容写作

  • 目标:利用模型的多模态理解能力,多语种能力,长上下文理解能力以及丰富的表达实现创意内容的生成
  • 问题
    • 人力创作周期长,成本高,多语种二创难
    • 模型表达需要丰富,娱乐性强,风格一致性强
    • 需要模型擅长情节推动,自然对话
    • 模型需要具备长上下文理解能力、长输出、多语种能力、多模态理解能力
  • 应用场景
    • 脚本创作:短视频脚本、电影解说
    • 小说续写:基于主干生成小说、基于上下文生成风格固定的小说
    • 娱乐创作:AI占星/塔罗、旅游计划、营销文案

Sonnet 内容创作 - 样例

  • 给出了关于小说主干生成的样例,使用了网络素材

短视频解说脚本生成 Sonnet 内容创作 - 样例

  • 生成了一段关于伊耿·坦格利安的短视频解说脚本,使用了网络素材。

小 说 续 写 内容创作 - 样例

  • 上下文༚ 少林派僧侣和群雄一见,登时纷纷呼喝༚“这是星宿派的邪门武功༁”“不是降龙十八掌༁”“不是丐帮功夫༁”丐帮弟子之中竟也有人叫道༚“咱们和少林派比武,不能使邪派功夫༁”“帮主,你该使降龙十八掌才是༁”“使邪派功夫,丢了丐帮脸面。” 游坦之听得众人呼喝之声大作,不由下心下踌躇,第二招便使不出去。

  • 那骑黑马的正是丐帮前任帮主乔峰。只见他身形魁梧,相貌堂堂, 目光如电,神采飞扬,纵身下马,大步走上前来。 游坦之见了乔峰,顿时面色苍白,身子微微发抖。他虽已是星宿派 弟子,但对这位威名赫赫的前任帮主仍心存畏惧。 乔峰走到寺前,向众少林僧人合十行礼,然后看向游坦之,冷冷道 ༚"游坦之,你既已叛出丐帮,投入星宿派,为何还要冒用降龙十八 掌的名号?枉你曾是丐帮弟子,连这点骨气都没有吗?"

角色扮演

  • 一级场景:角色扮演

  • 二级场景:角色扮演

模型选择建议 (角色扮演)

  • 角色扮演 优先Claude Sonnet 3.7
    • 多模态理解,语言表达丰富,多语种能力强,输出格式/风格更稳定,具有更强情节推动的能力,生成对话更多,趣味性更高。支持200K上下文和高达128K最常输出,同时生成速度快于Sonnet 3.5

生成式 AI 应用场景 – 角色扮演

  • 目标:利用模型的多模态理解能力,多语种能力,长上下文理解能力以及丰富的表达实现角色扮演
  • 问题
    • 往往需要多模型策略实现最高性价比
    • 需要模型表达丰富,娱乐性强,风格一致性强
    • 需要模型擅长情节推动,自然对话
    • 需要模型具备长上下文理解能力
    • 需要模型支持长输出,模型具备多语种能力、多模态理解能力
  • 应用场景
    • 角色扮演:情感陪伴、游戏NPC、培训教辅
    • 社交:AI助聊
    • 心理疗愈:AI心理医生

多模态角色生成 角色扮演 - 样例

  • 基于给定的图片,使用 Sonnet 生成一段人物描述和自我介绍,符合generation z的时代,sassy,幽默又神秘
    • 生成了一段英文的人物描述和自我介绍,带有幽默和神秘感。

AI 角色 多轮对话 角色扮演 - 样例

  • 角色是Pepper,帮助teenagers to deal with bullies in school
    • 当遇到Bully说“Are you eating rice? ew… smell like my grandma's toes”时的回答。
  • 分享了Pepper的过往经历

智能教辅

  • 一级场景:智能教辅
  • 二级场景:AI生题、AI(拍图)解题判题、代码教学、多模态外语教学、学情分析、教学视频理解问答

模型选择建议 (智能教辅)

  • AI生题:优先Claude Sonnet 3.7
    • 推理策划能力强,生成题目质量更高,多样性更强,工具调用能力更强
  • AI (拍图)解题判题:优先Claude Sonnet 3.7 with thinking
    • 开启Extended Thinking,数学能力显著增强且可结合多模态能力实现拍图解题,判题
  • 代码教学:优先Claude Sonnet 3.7
    • 代码开发效果强,支持200K上下文和高达128K最常输出,同时生成速度快于Sonnet 3.5
  • 多模态外语教学写作:优先Claude Sonnet 3.7
    • 多语种能力强,推理策划能力强,支持200K上下文和高达128K最常输出
  • 多模态外语教学语音教学:优先Nova Pro/Lite
    • 高性价比且推理速度快
  • 学情分析:优先Claude Sonnet 3.7
    • Text2SQL能力强,推理策划能力强,生成报告质量更高,支持200K上下文和高达128K最常输出,同时生成速度快于Sonnet 3.5
  • 教学视频理解问答追求性价比:优选Nova Pro/Lite
    • 高性价比,直接读取视频理解
  • 教学视频理解问答追求高质量:优选Claude 3.7