目 录CONTENT

文章目录

利用生成式AI加速营销创意构思——第1部分:使用Amazon Nova基础模型从创意到生成

Administrator
2025-12-24 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/accelerating-your-marketing-ideation-with-generative-ai-part-1-from-idea-to-generation-with-the-amazon-nova-foundation-models/

原文作者:David Laredo, Arturo Minor Bahena, José Gardiazabal, Jorge Lopez Reyes, and Juan Pablo Duque


营销团队面临着快速创建引人入胜的活动,同时保持品牌一致性和创意质量的日益增加的压力。传统的营销活动创建过程通常涉及创意团队、利益相关者和外部机构之间的多轮迭代,导致时间延长和成本增加。


生成模型(尤其是图像和视频生成模型)的出现和可用性,为在几分钟内快速迭代多个活动提案开辟了可能性。尽管如此,借助生成模型进行高效的活动创建仍然需要高水平的技能和对生成工具的掌握,例如提示工程、参数微调、应用护栏等。编辑、脚本和后期制作技能对于创建令人惊叹的故事也同样重要。


在本系列三篇文章中的第一篇中,我们将重点介绍如何利用 Amazon Nova 模型,通过 生成式AI 简化、简化和加速营销活动创建。我们将展示哥伦比亚最大的银行之一 Bancolombia 如何试验 Amazon Nova 模型来为其营销活动生成视觉素材。


现代营销活动的挑战

创建引人入胜的营销活动的挑战远远超出了创意开销,它在运营、财务和战略层面影响着企业。传统营销活动创建方法通常涉及内部团队、外部机构和利益相关者之间复杂的互动过程——每个团队都有自己的优先级、反馈周期和批准流程。


传统营销活动创建中最显著的痛点之一是工作的时间密集性。从最初的概念开发到最终素材的制作,活动从构思到执行往往需要数周甚至数月的时间。这个延长的过程中可能包括多轮修改、利益相关者批准和素材完善,这些都会增加内部流程的开销。然而,在营销业务中,活动启动的背景至关重要。外部因素,如最新新闻、时尚趋势、新发布的产品和季节等,都会影响用户对活动的接受度。这就是为什么时间对营销至关重要,而延迟发布活动可能意味着错失关键窗口期,或者让竞争对手抢先吸引受众注意力。


这些传统方法的财务影响同样令人担忧。营销团队经常面临预算限制,同时还被期望跨越多种渠道和交付格式(如社交媒体帖子、短视频、登陆页面等)交付复杂的活动。活动创建的成本——包括代理费用、制作费用以及延迟发布的机遇成本——可能会迅速升级。根据 Gartner 的一项调查,2024年,企业将其营销预算占总预算的比例从 9.9% 降至 7.7%,这进一步限制了用于创建营销活动的资源和时间。正是这种预算紧缩,使得 AI 工具对营销团队来说变得必不可少而非可选项。


除了时间和成本的考虑,营销团队还在应对一个根本性的矛盾:他们必须在市场要求的速度下,在创造新鲜、引人入胜的内容的同时,保持一致的品牌形象。这种挑战因跨不同系统和格式的内容个性化而变得更加复杂,每种格式都有其独特的技术要求和最佳实践。作为回应,我们看到公司正在完全重新思考资源分配方式。许多公司正在转向付费媒体,削减传统技术、减少员额,并缩减与代理机构的关系。这种情况很有趣:AI 工具既通过提高团队效率来帮助削减预算,又帮助团队度过这些预算削减。


实际影响是显著的。使用生成式AI的营销团队现在可以在几小时内完成过去需要数天或数周才能完成的工作。这些工具不仅仅是创造效率——它们正在为内容创作带来全新的方法。这种技术转变为实施先进的生成模型创造了完美条件,这些模型可以以前所未有的规模生成高质量的图像、视频和其他视觉素材。


Amazon Nova 基础模型家族

Amazon Nova 是一个基础模型 (FM) 家族,可通过 Amazon Bedrock 提供的 API 访问,由亚马逊创建,其特点是出色的价格性能比。


该家族由以下子家族组成:

  • Amazon Nova 理解模型——接受文本、图像和视频输入并生成文本输出的理解模型。它们提供了广泛的能力、准确性、速度和成本操作点选择。由四个模型组成:Amazon Nova Micro、Amazon Nova Lite、Amazon Nova Pro 和 Amazon Nova Premier。
  • Amazon Nova 创意内容生成模型——接受文本和图像输入并生成图像或视频输出的创意内容生成模型。由两个模型集成:Amazon Nova Canvas(图像生成)和 Amazon Nova Reel(视频生成)。
  • Amazon Nova 语音到语音模型——仅包含一个模型,Amazon Nova Sonic,这是一个语音到语音模型,接受语音作为输入并生成语音和文本作为输出。该模型旨在提供具有上下文丰富性的实时、类人语音对话。

使用 Amazon Nova Canvas 进行图像生成

使用 Amazon Nova Canvas,您可以通过文本提示生成逼真、影棚级的图像。Amazon Nova Canvas 能够生成高达 2K x 2K 的图像。Amazon Nova Canvas 还能够使用文本提示编辑现有图像以指导编辑。请参阅 Amazon Nova Canvas 视觉指南,了解 Nova Canvas 模型提供的可能性。要以编程方式生成图像,请输入以下代码:

import boto3
import base64
import io
import json
from PIL import Image
# Initialize the Bedrock client
bedrock_runtime = boto3.client( service_name="bedrock-runtime", region_name="us-east-1" # Specify your region
)
# Define your prompt for image generation
prompt = "A serene mountain landscape with a lake at sunrise, photorealistic style"
# Create the request payload for Amazon Nova Canvas
request_payload = { "taskType": "TEXT_IMAGE", "textToImageParams": {"text": prompt}, "imageGenerationConfig": { "cfgScale": 7, "seed": 42, "numberOfImages": 1, "width": 1024, "height": 1024 }
}
# Call the Bedrock model
response = bedrock_runtime.invoke_model( modelId="amazon.nova-canvas-v1:0", body=json.dumps(request_payload)
)
# Process the response
response_body = json.loads(response["body"].read())
image_base64 = response_body["images"][0]
# Convert base64 to image
image_data = base64.b64decode(image_base64)
image = Image.open(io.BytesIO(image_data))
# Save the image
image.save("generated_image.png")
print("Image generated and saved as 'generated_image.png'")

Amazon Nova 示例 GitHub 存储库 中查找更多 Amazon Nova 示例。


您可以在 AWS 人工智能博客上的 Amazon Nova Canvas 和 Amazon Nova Reel 的图像和视频提示工程 中了解有关 Amazon Nova Canvas 和 Amazon Nova Reel 提示工程的信息。


使用 Amazon Nova 加速营销活动视觉素材的创建

为了简化营销活动视觉素材的生成,我们提出了一种由生成式AI辅助的自动化流程,用于从活动创意过渡到活动视觉素材集。我们提出的流程描述如下:

  1. 您提供活动的描述
  2. 系统会自动检索与您当前活动相关的先前活动图像,您可以选择最能代表新活动创意的图像
  3. 系统将使用 Amazon Nova Pro 生成一个参考提示词,用于使用 Amazon Nova Canvas 生成活动的图像。您可以编辑此提示词。
  4. 系统将为您的活动生成最多五张图像。

Content management dashboard for senior tennis promotion campaign with description field and reference image galleryAI image generation workflow displaying multiple tennis action shots with consistent lighting and composition


现在我们来探讨该解决方案的一些关键概念。


参考图像推荐

在提供图像描述后,我们在图像数据库中搜索与我们活动相关的图像。这种搜索会返回与活动主题密切相关、并且在过去被证明成功的先前活动中使用的图像。用户可以选择一些参考图像来指导我们新的视觉素材的创建。这种技术是本系列下一篇文章的讨论主题。我们鼓励您阅读它,以更深入地了解我们如何使用多模态嵌入模型和向量数据库创建高效的搜索引擎。


使用大型语言模型 (LLM) 创建良好的图像生成提示词

尽管 Amazon Nova 创意模型对西班牙语或德语等语言有一定的理解能力,但英语仍然是唯一完全支持的语言。因此,用户应使用英语编写提示词,以最大限度地发挥 Amazon Nova 创意模型的潜力。此外,有效地提示创意模型需要与处理理解模型时不同的方法。即使是经验丰富的提示工程师也可能需要时间来调整他们的技术,以便充分释放创意模型的潜力。对于 LLM 内容生成的新手来说,这种学习曲线可能尤其陡峭。


为了应对这些挑战,我们使用一种称为元提示 (metaprompting) 的技术。这种方法涉及指示一个 LLM 为其他 FM 生成有效的提示词。例如,我们可以使用 Amazon Nova Pro 为 Amazon Nova Canvas 制作高质量的提示词来生成图像。


以下提示词模板演示了如何根据简单的图像描述(粗体突出显示)指示 Amazon Nova Pro 生成优化的文本到图像提示词:

You are a graphics designer named Joe that specializes in creating visualizations aided by text-to-image foundation models. Your colleagues come to you whenever they want to craft efficient prompts for creating images with text-to-image foundation models such as Nova Canvas.
You always respond to your colleagues requests with a very efficient prompt for creating great visualizations using text-to-image foundation models. These are some rules you will follow when interacting with your colleagues: * Your colleagues will discuss their ideas in their native languages, so please be flexible.
* Your answers will always be in English regardless of the language your colleague used to communicate.
* Your prompt should be at most 512 characters. You are encouraged to use all of them.
* Do not give details about or resolution of the images in the prompt you will generate.
* You will always say out loud what you are thinking
* You always reason only once before creating a prompt
* No matter what you always provide a prompt to your colleagues
* You will create only one prompt
* If provided with reference image descriptions (will be in between <reference_image_description> XML tags) carefully balance the contributions of the campaigns description with the reference images to create the prompt
* Never suggest to add text to the images Here are some guidelines you always follow when crafting effective image prompts: * Start with a Clear Vision: Have a clear idea of the image you want the AI to generate, picturing the scene or concept in your mind in detail.
* Choose Your Subject: Clearly state the main subject of your image, ensuring it’s prominently mentioned in the prompt.
* Set the Scene: Describe the setting or background, including the environment, time of day, or specific location.
* Specify Lighting and Atmosphere: Use descriptive phrases for lighting and mood, like “bathed in golden hour light” or “mystical atmosphere”.
* Incorporate Details and Textures: Enrich your prompt with descriptions of textures, colors, or specific objects to add depth.
* Avoid using negation words in the prompt creation. The use of negations is prohibited since this usually yields unwanted effects in the generated images.
* Be Mindful of Length and Clarity: Effective prompts tend to be detailed but not overly long, providing key visual features, styles, emotions or other descriptive elements.
* Special tokens can be added to provide higher-level guidance: Like “photorealistic”, “cinematic lighting” etc. These act like keywords for the model.
* Logically ordering prompt elements and using punctuation to indicate relationships: For example, commas to separate independent clauses or colons to lead into a description. Create a prompt for: A credit campaign for small coffee producers in the mountains of Colombia. Output only the prompt

答案是:

A vibrant, photorealistic scene showcasing small coffee producers in the lush, green mountains of Colombia, bathed in golden hour light. Farmers, dressed in traditional attire, are engaged in the coffee harvesting process, surrounded by coffee plants and picturesque landscapes.The atmosphere is warm and inviting, with a focus on community and sustainable practices. Include elements like rustic wooden tools, ripe coffee cherries, and the majestic Andean backdrop. Avoid modern technology and urban elements.

如您所见,我们得到了一个符合 Amazon Nova Canvas 要求的提示词,并获得了一张高质量的图像。


Traditional coffee harvesting in mountainous terrain, showing filled baskets of fresh cherries amid morning light and rolling landscape


我们的元提示词模板有四个部分:

  1. 我们设定了角色和高层任务(高效的提示词创建)。
  2. 我们设定了编写提示词时期望遵循的规则。例如,我们规定了字符限制,并指示模型仅以英语回答。
  3. 我们设置了描述我们希望提示词如何构建的指南,但这些指南不是强制性的。其中还包含有关最终模型使用的关键字的一些提示,因此元提示鼓励模型在其输出中使用它们。
  4. 我们确定了最终输出。

如果您想探索更多元提示创意,博客文章 使用数据感知提示优化改进 Amazon Nova 迁移性能 中有很好的见解。有关为 Amazon Nova 理解模型编写提示词的最佳实践,请参阅 Amazon Nova 用户指南


解决方案架构

现在我们提出了一个参考架构来实现上述想法。架构如下所示:

End-to-end AWS solution architecture for AI image generation with user management, storage, and API integration

  1. Amazon Bedrock 用于通过通用 API 调用 Amazon Nova Pro 和 Amazon Nova Canvas 模型。
  2. Amazon Lambda 函数用于创建元提示词、生成图像、检索相关图像并将活动存储在数据库中。
  3. 活动的详细信息存储在 Amazon DynamoDB 数据库中。
  4. API 使用 Amazon API Gateway 进行管理。
  5. Amazon Cognito 用于管理应用程序的用户。

下图显示了架构。


Bancolombia 如何使用 Amazon Nova 来简化其营销活动素材的生成

哥伦比亚领先的银行之一 Bancolombia 试验这种方法已有一年多的时间。通常,Bancolombia 的战略营销从设定目标、目标受众和主要信息的简报开始。一份详细的简报,通常包含视觉示例和数据分析,可以帮助简化团队和利益相关者之间的工作流程。

Bancolombia 营销科学家主管 Juan Pablo Duque 表示:“在制定简报和让所有利益相关者达成一致之间,通常需要进行许多会议和多轮变更。”“正是在这里,我们意识到我们可以引入新技术。‘一图胜千言’这句俗语非常真实。如果营销分析师能够使用生成式AI来制作视觉参考,那就太棒了。他们可以不只是使用文本,而是清晰地描绘出他们的想法。”


“我们开始试验,在每一次迭代之后,我们发现了更多的选择。例如,如果我们查看以前活动的信息会怎样?许多以前的举措都具有相同的目标,它们的表现如何可以作为有用的信息。将视觉效果与经过验证的活动元素结合使用,可以为创意团队提供更强大的基础,从而帮助他们在创意创建的早期阶段节省时间。”


“随着生成模型的不断改进,它们可以通过为不同的数字用途生成和调整图像来涵盖整个设计过程。这意味着生成的内容要遵循我们的平台准则。通过这种工作流程,发布可以更快地完成,团队可以对当前趋势做出反应,改进效果不佳的内容,并提供更一致的信息。”

实施最佳实践

在本节中,我们为打算自动化营销活动生成的读者提出了一套最佳实践。以下是一些技术注意事项和指南:

  1. 模块化架构 – 使用模块化方法实施解决方案,将图像搜索引擎和视觉生成组件分开。这便于维护和未来增强。
  2. 无服务器优先 – 使用 AWS Lambda 和 Amazon API Gateway 等无服务器技术来减少运营开销并提高可伸缩性。
  3. 模型版本控制 – 跟踪实施中使用的 Amazon Nova 模型的特定版本。这有助于重现性和故障排除。

对于安全最佳实践,请考虑以下指南:

  1. 最小权限访问 – 对所有组件,特别是访问 Amazon Bedrock 和其他 AWS 服务时,使用具有最小权限原则的 AWS 身份和访问管理 (IAM) 角色。
  2. 传输中和静态数据加密 – 确保所有数据,包括活动描述和生成的图像,都使用 AWS 密钥管理服务 (AWS KMS) 在传输中和静态时进行加密。
  3. 输入验证 – 对所有用户输入实施严格的输入验证,以帮助防止潜在的安全漏洞,特别是在活动描述和提示词编辑阶段。
  4. 安全 API 访问 – 使用 Amazon Cognito 进行用户身份验证和授权,以保护对 API 端点的访问。

为了优化性能,请遵循以下指南:

  1. 缓存策略 – 使用 Amazon ElastiCache 实现缓存层,以存储经常访问的数据,例如热门活动描述或常用参考图像。
  2. 异步处理 – 对于可能需要更长时间的图像生成任务,实施异步处理以改善用户体验和系统响应能力。
  3. 自动伸缩 – 为 Lambda 函数和 API Gateway 配置自动伸缩,以有效处理不同的负载。

对于错误处理和监控,请遵循以下指南:

  1. 全面的日志记录 – 使用 Amazon CloudWatch Logs 实施详细日志记录,以捕获系统事件、用户操作和模型交互。
  2. 自动警报 – 设置 CloudWatch 警报来监控关键指标并针对异常或错误发送通知。
  3. 优雅降级 – 通过实施适当的回退机制,设计系统以优雅地处理故障,例如 Amazon Nova 模型的暂时不可用。
  4. 定期审计 – 定期审计生成的內容,以验证是否符合品牌准则和道德标准。

通过遵循这些最佳实践,您可以为生成式AI营销活动解决方案的实施保持可靠性、安全性和效率。定期的监控和维护可以帮助您识别需要改进的领域,并随着营销活动需求的发展来优化您的系统。


结论

在本文中,我们演示了如何使用 Amazon Nova FM 家族通过自动化的、由 AI 驱动的方法来彻底改变营销活动创建。通过将 Amazon Nova Pro 用于智能提示词生成和 Amazon Nova Canvas 用于高质量图像创建相结合,我们展示了营销团队如何在保持品牌一致性和创意质量的同时,大幅减少制作引人注目的视觉素材所需的时间和资源。展望未来,此解决方案可以扩展以支持其他用例,例如:

  • 与营销自动化服务的集成
  • 使用客户洞察的高级个性化
  • 多渠道活动素材生成
  • 视觉内容的 A/B 测试自动化

在本系列的下一篇文章中,我们将讨论如何结合先前活动图像的信息来改进创意过程。


我们还鼓励您探索 Amazon Nova 模型家族在您的营销工作流程中的能力。您可以通过在 生成式 AI ML latam 示例 GitHub 存储库中部署公开可用的解决方案来开始。



关于作者

David Laredo 是 AWS 的原型架构师,他在那里通过颠覆性技术和快速原型设计技术帮助客户发现“可能性艺术”。他对 AI/ML 和生成式 AI 充满热情,并为此在整个 LATAM 地区撰写博客文章和参与公开发言。他目前领导 LATAM 地区的 AI/ML 专家社区。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区