📢 转载信息
原文作者:Wei Teh 和 Tulip Gupta
推荐系统是现代流媒体服务的核心,它决定了用户如何发现内容。传统的机器学习(ML)系统通常依赖协作过滤或基于内容的过滤,但这些系统往往忽视了上下文需求,如时间、心情或社交场景。代理式 AI(Agentic AI)通过动态对话和对观看环境的逻辑推理,将推荐体验提升到了新高度。
在本文中,我们将探讨如何利用 Amazon Bedrock AgentCore 和 Amazon Nova Sonic 2.0 构建一个能够理解用户偏好、提供个性化推荐并实时解答观影疑问的智能助手。
架构设计
该解决方案的核心流程包括电影推荐与电影场景分析。以下是其端到端架构:
工作流简述:
- 用户通过 Web UI 与系统建立 WebSocket 连接。
- Amazon Nova Sonic 2.0 负责处理语音指令,提供低延迟、类人的交互体验。
- AWS Fargate 容器编排代理工作流,利用 MCP(模型上下文协议)处理用户请求。
- 通过 Amazon Bedrock AgentCore Gateway,系统将 Lambda 函数转化为可供 AI 调用的工具,结合 OpenSearch 实现语义检索。
自然语音交互界面
我们使用了 Amazon Nova Sonic 2.0,这是 AWS 最新的语音到语音模型。它支持实时语音流,能够将传统的问答交互转化为自然、高效的对话。此外,通过在对话初期设置系统提示词(System Prompt),开发者可以定义 AI 的个性,确保其符合品牌调性。
电影推荐流
当用户提出“我想看点轻松有趣的电影”时,系统会:
- 识别用户意图并调用相应的推荐工具。
- 检索 DynamoDB 中的用户偏好画像(如观看历史)。
- 利用 Amazon Nova Micro 进行意图分类与查询改写。
- 结合语义检索与重排序模型(Amazon Rerank),输出最精准的推荐结果。
场景分析功能
用户可以随时暂停播放并询问:“这段剧情在讲什么?”或“那个演员是谁?”。系统通过记录当前时间戳,利用 Amazon Bedrock Data Automation 解析的视频元数据(如章节总结、台词、名人识别),结合剧本的语义向量搜索,实时生成精准的场景描述。
总结
本方案展示了如何通过 Agentic AI 将被动的反馈转化为主动的对话式发现。利用 Amazon Nova Sonic 2.0 的自然语言理解与 Bedrock 的检索增强生成(RAG)能力,流媒体服务能够为用户提供深度的个性化体验,从而显著提升用户参与度与留存率。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区