Amazon Web Services GenAI
热点与趋势追踪
- Manus智能体助手引爆行业需求
- Manus.im发布了50多个Agent应用场景,引发了对企业定制版智能体场景的广泛需求,尤其是在行业头部客户中。
- 实现基础:MCP + Agent + Computer Use + Coding,效果取决于模型能力。
- Claude 3.7 Sonnet:超强的Coding、Agentic、Reasoning和多模态能力使其成为首选。
- 先发优势:AWS是唯一正式可用的Claude 3.7 Sonnet云厂商,推动智能体助手项目。
- 资源支持:AWS提供智能体实现的演示系列和落地方法,包括Computer Use Deep Dive、电商Computer Use Demo、快速演示视频、带解说版本、MCP Multi-agent Demo、MCP + DeepResearch Demo,以及代码和Bedrock Multi-Agent Agent Demo。
Use Case With Suggested Model
- 模型选择建议:根据不同使用案例选择适当的模型。
- 实时翻译:
- 模型:Nova(低延迟敏感,低成本)
- 图像识别:
- 模型:Nova(准确率高,性价比高)
- 图片生成:
- 模型:DeepSeek(擅长推理策划)
- 角色扮演:
- 模型:Claude(角色生动,特征一致性)
- 代码生成:
- 模型:Claude(社区高口碑)
- 内容分析与创作:
- 模型:Claude(强文本理解、创作、生成能力)
- 运营策划,学术研究:推荐使用。
- 场景一:一个场景推荐合适的性价比和能力适配模型。
- 场景二:一个场景需要多个模型的参与实现最佳效果,针对场景选择模型。
- 实时翻译:
Use Case With Model Combos
- 模型组合案例:结合多个模型实现最佳效果
- 代码伴侣:DeepSeek R1 + Claude 3.5/3.7(用于架构设计和代码生成)。
- Multi Agent:Claude Haiku(Agentic Planner,Function call)+ DeepSeek R1/Claude 3.7(DeepResearch)。
- Chatbot:Nova Lite(Content recognition)+ Claude 3.5/3.7。
- 复杂翻译系统:Nova Lite(高阶翻译审查,初始翻译)+ Reasoning(持续迭代Complex jobs).
- 应该根据实际的场景选择合适的模型组合。
企业使用生成式 AI 的主流应用场景
- 应用场景:
- 翻译:社交、游戏、电商、零售、制造、金融、媒体 (聊天翻译、客服翻译、小说翻译)
- 审核:跨行业 (聊天内容审核、评论审核、视频审核、图片审核)
- 智能运营:电商、零售、游戏、媒体、差旅、制造 (评论反馈、舆情分析/VOC、报告分析、文字与图片标签识别与分类)
- 智能开发:跨行业 (代码生成、原型制作、代码审核、AIops)
- 内容写作:游戏、社交、媒体、电商 (文案写作、故事或剧本创作、营销内容创作、多媒体内容制作、角色描述生成)
- 智能运维:跨行业 (运维问题排查、一键生成架构图、一键部署Java项目)
- 角色扮演:游戏、社交 (角色扮演/NPC/AI伴侣、社交聊天、虚拟陪伴、游戏互动、数字人互动)
- 知识助手:跨行业 (问答助手、知识库构建和检索、智能问答系统、文档理解和QA生成、研究分析助手)
- 智能办公:跨行业 (文档处理、会议记录和总结、日常办公自动化)
- 智能客服:跨行业 (智能客服问答、客服质量检测、客服培训、智能导购)
- 智能教辅:教育 (智能教学、题目解答、培训系统、教育评估、学习规划、学情分析)
- 外部链接
- GenAI Asset Hub (技术资产)
- Bedrock 公开案例集链接
翻译
- 目标:以快速、高质量、低成本实现内容本地化,实现翻译的信、雅、达
- 问题:
- 人力翻译:成本高、效率低
- 机器翻译:翻译生硬、上下文理解差、特殊词汇定制化弱、成本较高
- 应用场景:
- 实时翻译:聊天室实时翻译、客服实时翻译
- 短视频翻译:字幕翻译、剧本翻译
- 离线翻译:财报翻译、小说翻译、电商产品描述翻译、说明书翻译、营销文案、策划文案翻译等
- 一级场景:翻译
- 二级场景:字幕翻译、小说翻译、文档翻译、聊天翻译
模型选择建议(翻译)
- 字幕翻译:优先Claude Sonnet
- 语言理解深度、语言风格保留、语境适应能力、语言简洁精准的同时保持一致性强
- 小说翻译:优先Claude Sonnet
- 文学性把控能力、意境还原能力、语言多样性以及文体一致性、文化转换深度等,以及reasoning mode下有更长的output长度 (64K, 128K Beta)
- 文档翻译:优先Claude Sonnet
- 保持格式结构完整性,技术术语翻译准确,上下文理解以及长文本处理能力强,多语言的支持,以及reasoning mode下有更长的output长度 (64K, 128K Beta), Amazon Nova Pro为辅
- 聊天翻译:优先推荐Amazon Nova
- 延迟,成本为先的场景 – 优先推荐Amazon Nova (Micro和Lite,Micro为延迟和成本最低的模型首选),其他考虑Claude Haiku代替传统机翻的最佳场景
您可以使用 Amazon Bedrock 执行以下操作
- 实验提示和配置
- 利用数据源信息增强响应生成
- 创建能够推理如何帮助客户的应用程序
- 使用训练数据使模型适应特定任务和领域
- 提高基于基础模型的应用程序的效率和输出
- 确定最适合您用例的模型
小说翻译 – 样例
- 文学性把控能力、意境还原能力、语言多样性以及文体一致性、文化转换深度,模型选择Sonnet
- 给出了一个中英文的小说翻译样例,说明了翻译之后保留了文学性。
文档翻译 – 样例
- 保留了文档格式,专用词语翻译准确保持格式结构完整性,技术术语翻译准确,上下文理解以及长文本处理能力强,多语言的支持
商品描述翻译
- 专业词汇翻译准确,小语种发挥稳定
- 保持商品专业术语准确性
- 多语言能力强
- 语境理解能力
- 保留关键营销元素
- 格式保持一致,模型选择Sonnet
- 给出了一个商品描述翻译的例子,包括简体中文、英语、马来语和乌尔都语。
长文本翻译工作流 – 利用Agent反思优化提升 AI 翻译质量
- Translation Agent 的核心在于其独特的“反思工作流”,该工作流模拟了人类翻译专家的思考过程,将翻译任务分解为三个主要步骤:
- 初始翻译:Translation Agent 首先利用 LLM 对输入文本进行初步翻译,得到一个初步的译文。
- 反思与改进:与传统机器翻译系统直接输出译文不同,Translation Agent 会引导 LLM 对自身的翻译结果进行反思,并提出改进建议。
- 优化输出:最后 Translation Agent 根据 LLM 提出的改进建议,对初始译文进行优化,最终生成一个更加精准、流畅且符合目标语言习惯的译文。
- 最新模型提供混合推理模式
- 大幅提升支持更长输出Token (最长到128K)
- Agent等领域表现显著提升
- 推理成本可调
- 使用Claude组合
字幕翻译 – 样例
语言理解深度、语言风格保留、语境适应能力、语言简洁精准的同时保持一致性强,模型选择Sonnet
将下面对话字幕翻译成中文,俚语翻译要地道,特点要保留,口语翻译要原汁原味
- 提供了一个字幕翻译的例子,展示了Sonnet模型在俚语翻译和口语翻译方面的能力。
聊天翻译 – 样例
- 即时IM聊天:速度与成本兼具代替传统机翻即时消息低延迟快速响应、符合应用的语境与口语化表达、成本远优于传统机翻 (4%-10%),模型选择Nova/Haiku
Case - Nova Win Case
- 利用Nova模型进行在线翻译可以替代谷歌翻译
- 挑战:产品翻译质量、延迟、稳定性、成本
- 模型选择:根据客户情况及过往经验,选择了Nova-Micro; Haiku 3; Sonnet V1 三款模型,分别从响应时间,稳定性,翻译质量,成本等维度进行评估。最终推荐选择Nova- Micro模型。推荐客户使用COMET评分,提升运营决策效率。
- 方案设计:
- 使用CRI方式提升模型回复的稳定性。
- 推荐使用Converse API调用,提升响应速度。
- 上线结果:
- 实际推理延迟在300-400ms之间。满足业务需求。
- 每分钟消耗Token 80K/Min(40K Input + 40K output)
模型 | 推理时间 | 推理时间标准差 | COMET 评分 | 成本(对比谷歌翻译) |
---|---|---|---|---|
Nova Micro | 450ms | 50 | 0.8234 | 成本为谷歌翻译的 4% |
Haiku 3 | 400ms | 210 | 0.4722 | 成本为谷歌翻译的 11% |
Sonnet V1 | 707ms | 196 | - | - |
GenAI Asset - 翻译相关
- 基于LLM的专词翻译方案 Deck Link1 Code Repo Link1 Demo Link1
- PPT翻译 Deck Link1 Code Repo Link1 Demo Link1
- 视频字幕自动翻译 Deck Link1 Code Repo Link1 Demo Link1
- 图片翻译 Deck Link1 Code Repo Link1 Demo Link1
- 基于 Bedrock的多模型Agent和反思式翻译工作流 Code Repo Link1
- 实时语音翻译成多种语言 Deck Link1 Code Repo Link1 Demo Link1
海艺互娱案例
- 关于企业:海艺互娱以游戏领域为起点,打造全流程艺术创作平台,并降维推广到其他领域包括平面设计、电商广告、品牌营销等垂直领域。
- 业务需求:
- SD具有上手门槛,提示词的语种和质量影响生图质量。输入提示词过程只支持英文,生成的图片质量会随着提示词的丰富程度和结构有较大的区别,对使用者语言能力和提示词要求较高 ,工作效率得不到发挥。
- 提升客服系统体验,海艺互娱用户规模迅速扩张,现有客服系统无法满足需求。
- 解决方案:
- 应用 Amazon Bedrock 为生成式 AI 绘图过程作提示词优化,可将超过30+种语言的用户输入提示词翻译为英语;并且提供提示词工程服务,自动对用户输入的不完善的提示词进行补充和优化,帮助生成更高质量的图片。
- 通过接入 Amazon Bedrock 应用生成式 AI 赋能星云智能客服系统,自动化识别用户意图、丰富客服知识库、提升用户交互的方式,迅速解决了 客服资源瓶颈问题。通过深度分析用户的历史交互数据和行为特征,智能匹配用户需求,帮助用户迅速找到所需信息,解决问题。
- 数据分析可视化,基于生成式AI的数据分析功能,高效处理和分析大量数据,生成直观的视觉化图表,优化服务策略。
- 收益:
- 用户满意度提升超过 50%。
- 支撑海艺互娱网站月活跃用户数超过 1000 万,实现了 1.4 倍的增长。
- 利用大模型实现多语言翻译,节省超过 50% 的运营成本。
- 从初步接洽、POC 测试、架构部署,到最终业务上线,整个过程仅仅花费一个月就得以高效落地
智能运营
一级场景:智能运营
二级场景:VOC、报告分析
模型选择建议 (智能运营)
- VOC:优先Claude Sonnet
- 高精度文本理解能力、多维度分析能力、结构化输出能力、多语言处理能力
- 报告分析:优先Claude Sonnet
- 能够理解复杂的术语和专业表达、能够多种格式、多元数据处理获取关键信息、特殊功能如更深层次的趋势分析、复杂的逻辑推理 reasoning mode下有更长的output长度 (64K, 128K Beta),结合Multi-agent工作流,可以结合多模型组合方式来推荐
Voice of Customer (VoC) 评论分析 / 舆情分析
业务价值:针对商品评论、行业报告、第三方社交媒体、客户服务反馈等用户服务场景,生成舆情分析与洞察报告;了解终端客户情绪,判断营销价值,提高效率并且得到更精准的总结与洞见,如:
- 分析客户反馈和投诉,改进客户服务质量,提高客户满意度。
- 根据客户的意见和情绪,优化广告和宣传的内容,分析关键词和话题趋势等,帮助企业做出更好的营销和决策。
- 通过分析社交媒体、客户社区评论等,用户对特定商品、活动事件的观点,以及竞争对手的评价和比较,发现客户的需求,为产品改进提供参考。
可行性:无需定制化,直接借助基础模型对超长上下文窗口的文本分析、总结和生成能力,实现快速验证和生产。
一个VoC样例,细致的分类,模型选择Sonnet
报告分析 财报分析 – 样例
根据提供的财务报告,以下是NVIDIA 2024财年的核心财务分析:
- 业绩亮点:
- 收入大幅增长126%至609亿美元
- 毛利率提升15.8个百分点至72.7\%。
- 营业收入激增681%至330亿美元
- 每股收益飙升586%至11.93美元
- 业务分部表现
- 计算与网络部门收入474亿美元,同比增215%
- 图形部门收入135亿美元,增长14%
- 计算与网络部门营业收入增长530%,为主要增长动力
- 技术创新
- 推出Hopper GPU计算平台、Grace CPU、Blackwell GPU架构等新产品
- 在AI、数据中心、网络、汽车等领域持续创新
- 股东回报
- 5年总股东回报率达1436%
- 5年内回报股东218亿美元,包括198亿美元股票回购和20亿美元股息
- 业绩亮点:
老铁的非正式分析
报告分析 财 报 分 析 – 进 阶 版 – 样例
- 展示了如何使用 Sonnet 利用MCP on Bedrock Asset 做财报分析,通过自然语言指令生成详细的股票分析报告,并保存为HTML文件。
Multi-Agent金融投资助手投资分析
- 样例 使用Claude组合
标签识别
- 这是一张社区中用户上传的图片,识别并罗列其中的主要商品,然后为图片打标签,提示词 模型选择Sonnet
Shulex案例
- 关于企业:Shulex (Voc.ai) 是一家面向全球 VOC 市场的 AI SaaS 公司。
- 业务需求:
- 客户触点分散,VOC数据分析与洞察难
- 用户需求日趋多样化
- 解决方案:
- 海量客户反馈进行数据和语义分析
- 构建出对应的 RAG 框架,识别和确认用户的意图,进行知识召回;并对 现有知识库内容进行排序,以在后续回答时进一步提升命中率,对整个 RAG 框架的逐步强化
- 轻松创建和部署完全托管式的Agent
- 收益:
- 用户满意度提升15.4\%,用户留存率提升12.1\%.仅用三周就完成 Shulex 应用的落地
- 模型迭代时间缩短了30\%.整体模型迭代时间比使用传统 IDC 训练的方式缩短了 30%
GenAI Asset – 运营相关
- 智能CDP/CRM Code Repo Link1
- 快速上手使用 Amazon Bedrock Multi-Agent Collaboration Deck Link1 Code Repo Link1
内容写作
- 目标:利用模型的多模态理解能力,多语种能力,长上下文理解能力以及丰富的表达实现创意内容的生成
- 问题:
- 人力创作周期长,成本高,多语种二创难
- 模型表达需要丰富,娱乐性强,风格一致性强
- 需要模型擅长情节推动,自然对话
- 模型需要具备长上下文理解能力、长输出、多语种能力、多模态理解能力
- 应用场景:
- 脚本创作:短视频脚本、电影解说
- 小说续写:基于主干生成小说、基于上下文生成风格固定的小说
- 娱乐创作:AI占星/塔罗、旅游计划、营销文案
Sonnet 内容创作 - 样例
- 给出了关于小说主干生成的样例,使用了网络素材
短视频解说脚本生成 Sonnet 内容创作 - 样例
- 生成了一段关于伊耿·坦格利安的短视频解说脚本,使用了网络素材。
小 说 续 写 内容创作 - 样例
上下文༚ 少林派僧侣和群雄一见,登时纷纷呼喝༚“这是星宿派的邪门武功༁”“不是降龙十八掌༁”“不是丐帮功夫༁”丐帮弟子之中竟也有人叫道༚“咱们和少林派比武,不能使邪派功夫༁”“帮主,你该使降龙十八掌才是༁”“使邪派功夫,丢了丐帮脸面。” 游坦之听得众人呼喝之声大作,不由下心下踌躇,第二招便使不出去。
那骑黑马的正是丐帮前任帮主乔峰。只见他身形魁梧,相貌堂堂, 目光如电,神采飞扬,纵身下马,大步走上前来。 游坦之见了乔峰,顿时面色苍白,身子微微发抖。他虽已是星宿派 弟子,但对这位威名赫赫的前任帮主仍心存畏惧。 乔峰走到寺前,向众少林僧人合十行礼,然后看向游坦之,冷冷道 ༚"游坦之,你既已叛出丐帮,投入星宿派,为何还要冒用降龙十八 掌的名号?枉你曾是丐帮弟子,连这点骨气都没有吗?"
角色扮演
一级场景:角色扮演
二级场景:角色扮演
模型选择建议 (角色扮演)
- 角色扮演 优先Claude Sonnet 3.7
- 多模态理解,语言表达丰富,多语种能力强,输出格式/风格更稳定,具有更强情节推动的能力,生成对话更多,趣味性更高。支持200K上下文和高达128K最常输出,同时生成速度快于Sonnet 3.5
生成式 AI 应用场景 – 角色扮演
- 目标:利用模型的多模态理解能力,多语种能力,长上下文理解能力以及丰富的表达实现角色扮演
- 问题:
- 往往需要多模型策略实现最高性价比
- 需要模型表达丰富,娱乐性强,风格一致性强
- 需要模型擅长情节推动,自然对话
- 需要模型具备长上下文理解能力
- 需要模型支持长输出,模型具备多语种能力、多模态理解能力
- 应用场景:
- 角色扮演:情感陪伴、游戏NPC、培训教辅
- 社交:AI助聊
- 心理疗愈:AI心理医生
多模态角色生成 角色扮演 - 样例
- 基于给定的图片,使用 Sonnet 生成一段人物描述和自我介绍,符合generation z的时代,sassy,幽默又神秘
- 生成了一段英文的人物描述和自我介绍,带有幽默和神秘感。
AI 角色 多轮对话 角色扮演 - 样例
- 角色是Pepper,帮助teenagers to deal with bullies in school
- 当遇到Bully说“Are you eating rice? ew… smell like my grandma's toes”时的回答。
- 分享了Pepper的过往经历
智能教辅
- 一级场景:智能教辅
- 二级场景:AI生题、AI(拍图)解题判题、代码教学、多模态外语教学、学情分析、教学视频理解问答
模型选择建议 (智能教辅)
- AI生题:优先Claude Sonnet 3.7
- 推理策划能力强,生成题目质量更高,多样性更强,工具调用能力更强
- AI (拍图)解题判题:优先Claude Sonnet 3.7 with thinking
- 开启Extended Thinking,数学能力显著增强且可结合多模态能力实现拍图解题,判题
- 代码教学:优先Claude Sonnet 3.7
- 代码开发效果强,支持200K上下文和高达128K最常输出,同时生成速度快于Sonnet 3.5
- 多模态外语教学写作:优先Claude Sonnet 3.7
- 多语种能力强,推理策划能力强,支持200K上下文和高达128K最常输出
- 多模态外语教学语音教学:优先Nova Pro/Lite
- 高性价比且推理速度快
- 学情分析:优先Claude Sonnet 3.7
- Text2SQL能力强,推理策划能力强,生成报告质量更高,支持200K上下文和高达128K最常输出,同时生成速度快于Sonnet 3.5
- 教学视频理解问答追求性价比:优选Nova Pro/Lite
- 高性价比,直接读取视频理解
- 教学视频理解问答追求高质量:优选Claude 3.7