目 录CONTENT

文章目录

Amazon Bedrock 现已在日本和澳大利亚推出 Anthropic Claude Sonnet 4.5 和 Haiku 4.5 的跨区域推理功能

Administrator
2025-11-01 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/introducing-amazon-bedrock-cross-region-inference-for-claude-sonnet-4-5-and-haiku-4-5-in-japan-and-australia/

原文作者:Derrick Choo, Stephanie Zhao, Jared Dean, Kazuki Motohashi, Melanie Li, and Saurabh Trikande


你好,G’day。

Anthropic 最新推出的 Claude Sonnet 4.5Claude Haiku 4.5 现已在 Amazon Bedrock 上可用,这标志着生成式 AI 模型迈出了重要一步。这些尖端模型在复杂的代理任务、编码和企业工作负载方面表现出色,为开发人员提供了增强的功能。与新模型一起,我们很高兴地宣布,日本和澳大利亚的客户现在可以在 Amazon Bedrock 中使用 Anthropic Claude Sonnet 4.5Anthropic Claude Haiku 4.5,并通过使用跨区域推理(CRIS)在其特定地理区域内处理数据。当客户需要满足在本地处理数据的要求时,这将非常有用。

本文将探讨日本和澳大利亚针对 Claude Sonnet 4.5 和 Claude Haiku 4.5 的新的特定地理区域跨区域推理配置文件。我们将深入探讨这些特定地理区域 CRIS 配置文件的详细信息,提供从旧模型迁移的指导,并向您展示如何开始使用此新功能,以充分发挥这些模型的潜力,用于您的生成式 AI 应用程序。

日本和澳大利亚跨区域推理

通过日本和澳大利亚的跨区域推理,您可以在本地地理区域内对 Anthropic Claude Sonnet 4.5 或 Claude Haiku 4.5 发出调用。通过使用 CRIS,Amazon Bedrock 通过整个推理请求生命周期在地理边界内(日本或澳大利亚)处理推理请求。

跨区域推理的工作原理

Amazon Bedrock 中的跨区域推理通过 AWS 全球网络运行,并在数据传输和静态存储时提供端到端加密。当客户在源 AWS 区域中提交推理请求时,Amazon Bedrock 会自动评估每个潜在目标区域的可用容量,并将请求路由到最佳目标区域。流量完全在 AWS 全球网络上传输,在列为源区域目的地的区域之间不经过公共互联网,并使用 AWS 内部服务到服务通信模式。遵循相同的设计,日本和澳大利亚的 GEO CRIS 使用安全的 AWS 全球网络自动在各自地理区域内的区域之间路由流量——在日本的东京和大阪之间,以及在澳大利亚的悉尼和墨尔本之间。CRIS 使用智能路由,在同一地理区域内的多个区域之间动态分配流量,而无需用户手动配置或干预。

跨区域推理配置

下表描述了日本和澳大利亚的 CRIS 配置。

日本 CRIS:对于在日本境内运营的组织,CRIS 系统在东京和大阪区域之间提供路由。

源区域 目标区域 描述
ap-northeast-1 (东京) ap-northeast-1 (东京)ap-northeast-3 (大阪) 来自东京区域的请求可以自动路由到东京或大阪区域。
ap-northeast-3 (大阪) ap-northeast-1 (东京)ap-northeast-3 (大阪) 来自大阪区域的请求可以自动路由到东京或大阪区域。

澳大利亚 CRIS:对于在澳大利亚境内运营的组织,CRIS 系统在悉尼和墨尔本区域之间提供路由。

源区域 目标区域 描述
ap-southeast-2 (悉尼) ap-southeast-2 (悉尼)ap-southeast-4 (墨尔本) 来自悉尼区域的请求可以自动路由到悉尼或墨尔本区域。
ap-southeast-4 (墨尔本) ap-southeast-2 (悉尼)ap-southeast-4 (墨尔本) 来自墨尔本区域的请求可以自动路由到悉尼或墨尔本区域。

注意:每个源区域的目的地区域列表在其 推理配置文件中列出。

开始使用

要开始使用澳大利亚或日本 CRIS,请使用 Amazon Bedrock 推理配置文件执行以下步骤。

  1. 配置 IAM 权限:验证您的 IAM 角色或用户是否具有使用跨区域推理配置文件调用 Amazon Bedrock 模型的必要权限。要允许 IAM 用户或角色调用特定地理区域的跨区域推理配置文件,您可以使用以下示例策略。策略中的第一个语句允许 Amazon Bedrock InvokeModel API 访问特定地理区域的跨区域推理配置文件资源,以处理源自指定区域的请求。特定地理区域的推理配置文件以区域代码(日本为 “jp”,澳大利亚为 “au”)为前缀。在此示例中,指定的请求区域为 ap-northeast-1 (东京),推理配置文件为 jp.anthropic.claude-sonnet-4-5-20250929-v1:0。第二个语句允许特定地理区域的跨区域推理配置文件访问并调用在特定地理区域推理配置文件将路由到的区域中匹配的基础模型。在此示例中,日本的跨区域推理配置文件可以路由到 ap-northeast-1 (东京) 或 ap-northeast-3 (大阪)。
    { "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "bedrock:InvokeModel*" ], "Resource": [ "arn:aws:bedrock:ap-northeast-1:<your-account-id>:inference-profile/jp.anthropic.claude-sonnet-4-5-20250929-v1:0" ] }, { "Effect": "Allow", "Action": [ "bedrock:InvokeModel*" ], "Resource": [ "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0", "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0" ], "Condition": { "StringLike": { "bedrock:InferenceProfileArn": "arn:aws:bedrock:ap-northeast-1:<your-account-id>:inference-profile/jp.anthropic.claude-sonnet-4-5-20250929-v1:0" } } } ]
    }
  2. 使用跨区域推理配置文件:配置您的应用程序以使用相关的推理配置文件 ID。这适用于 InvokeModelConverse API。

Anthropic Claude Sonnet 4.5 的推理配置文件

区域 推理配置文件 ID
澳大利亚 au.anthropic.claude-sonnet-4-5-20250929-v1:0
日本 jp.anthropic.claude-sonnet-4-5-20250929-v1:0

Anthropic Claude Haiku 4.5 的推理配置文件

区域 推理配置文件 ID
澳大利亚 au.anthropic.claude-haiku-4-5-20251001-v1:0
日本 jp.anthropic.claude-haiku-4-5-20251001-v1:0

示例代码

使用 Converse API(Python)和日本 CRIS 推理配置文件。

import boto3 # 初始化 Bedrock Runtime 客户端
bedrock_runtime = boto3.client(
    service_name="bedrock-runtime",
    region_name="ap-northeast-1"  # 您的源区域
) # 定义推理配置文件 ID
inference_profile_id = "jp.anthropic.claude-sonnet-4-5-20250929-v1:0" # 准备对话
response = bedrock_runtime.converse(
    modelId=inference_profile_id,
    messages=[
            {
                "role": "user",
                "content": [{"text": "What is Amazon Bedrock?"}]
            }
    ],
    inferenceConfig={
            "maxTokens": 512,
            "temperature": 0.7
    }
) # 打印响应
print(f"Response: {response['output']['message']['content'][0]['text']}")

配额管理

在使用 CRIS 时,了解配额如何管理非常重要。对于特定地理区域的 CRIS,配额管理在源区域级别进行。这意味着从源区域请求的配额增加将仅适用于源自该区域的请求。例如,如果您从东京 (ap-northeast-1) 区域请求配额增加,它将仅适用于源自东京区域的请求。同样,来自大阪的配额增加请求仅适用于源自大阪的请求。在请求配额增加时,组织应考虑其区域使用模式,并通过 AWS 服务配额控制台在适当的源区域请求增加。这种区域特定的配额管理允许对资源分配进行更精细的控制,同时保持数据本地处理要求。

请求配额增加

对于日本和澳大利亚的 CRIS 配额增加请求,组织应使用其各自源区域(日本的东京/大阪,澳大利亚的悉尼/墨尔本)的 AWS 服务配额控制台。组织和客户可以搜索与 Claude Sonnet 4.5 或 Claude Haiku 4.5 模型推理令牌(每日和每分钟)相关的特定配额,并根据其在特定区域的工作负载要求提交增加请求。

配额管理最佳实践

要管理您的配额,请遵循以下最佳实践:

  1. 主动请求增加:每个组织根据其账户历史和使用模式获得默认配额分配。这些配额以每分钟令牌 (TPM) 和每分钟请求 (RPM) 来衡量。 对于 Claude Sonnet 4.5 和 Claude Haiku 4.5,配额通常从保守水平开始,可以根据已证明的需求和使用模式进行增加。如果您预计使用量很高,请在部署前通过 AWS 服务配额控制台请求配额增加。
  2. 监控利用率:实施配额使用情况监控,以最大限度地减少达到配额限制的可能性,从而帮助防止服务中断和优化资源分配。AWS 提供了跟踪实时配额利用率的 CloudWatch 指标,使组织能够在使用量接近定义的阈值时设置警报。监控系统应跟踪当前使用情况和历史模式,以识别趋势并预测未来的配额需求。此数据对于规划配额增加请求和优化应用程序行为以在可用限制内运行至关重要。组织还应监控不同时间段的配额使用情况,以识别高峰使用模式并相应地进行规划。
  3. 规模化测试:在生产部署之前,进行负载测试以了解在现实条件下所需的配额。规模化测试要求建立反映生产流量模式的现实场景,包括高峰使用时段和并发用户负载。 在监控响应时间、错误率和配额利用率的同时,实施渐进式负载测试。

重要提示:在计算所需的配额增加时,您需要考虑 令牌燃尽率,即输入和输出令牌如何转换为限制系统的令牌配额使用量的速率。以下模型对输出令牌具有 5 倍的燃尽率(1 个输出令牌消耗您配额中的 5 个令牌):

  • Anthropic Claude Opus 4
  • Anthropic Claude Sonnet 4.5
  • Anthropic Claude Sonnet 4
  • Anthropic Claude 3.7 Sonnet

对于其他模型,燃尽率为 1:1(1 个输出令牌消耗您配额中的 1 个令牌)。对于输入令牌,令牌与配额的比率为 1:1。每次请求的总令牌数计算如下:

输入令牌数 + 缓存写入输入令牌 + (输出令牌数 x 燃尽率)

从 Claude 3.5 迁移到 Claude 4.5

目前使用 Claude Sonnet 3.5 (v1 和 v2) 和 Claude Haiku 3.5 模型的组织应计划分别迁移到 Claude Sonnet 4.5 和 Claude Haiku 4.5。Claude Sonnet 4.5 和 Haiku 4.5 是混合推理模型,代表了比其前身取得了实质性的进步。它们在工具处理方面具有先进的功能,在内存管理和上下文处理方面有所改进。这次迁移提供了一个利用增强功能的机会,同时通过 CRIS 保持遵守数据本地处理要求。

关键迁移注意事项

从 Claude 3.5 到 4.5 的转换涉及除简单模型替换之外的几个关键因素。

  • 性能基准测试应该是您的首要任务,因为与前几代产品相比,Claude 4.5 在代理任务、编码能力和企业工作负载方面表现出显著改进。组织应根据其用例建立标准化的基准测试,以确保新模型满足或超过当前的性能要求。
  • Claude 4.5 引入了多项先进的技术功能。增强的上下文处理支持更复杂的提示优化,要求组织精炼其现有提示以充分利用模型的潜力。该模型支持更复杂的工具集成模式,并在多模态任务中表现出改进的性能。
  • 成本优化是另一个重要考虑因素。组织应进行全面的成本效益分析,包括潜在的配额增加和容量规划要求。

有关更多技术实施指南,组织应参考 AWS 博客文章 从 Amazon Bedrock 上的 Anthropic Claude 3.5 Sonnet 迁移到 Claude 4 Sonnet,其中提供了对迁移到新 Claude Sonnet 4.5 模型同样有效的基本最佳实践。此外,Anthropic 的迁移文档提供了特定于模型的优化策略和迁移到 Claude 4.5 模型的注意事项。

鉴于生成式 AI 模型演进的快速步伐,组织应采取敏捷的迁移流程。行业标准现在预计每六到十二个月进行一次模型迁移,因此制定系统性方法而不是过度优化特定模型版本至关重要。

在全局跨区域推理和 GEO 跨区域推理之间进行选择

Amazon Bedrock 提供两种类型的跨区域推理配置文件,以帮助您在需求旺盛时扩展 AI 工作流。虽然两者都会自动在多个区域之间分配流量,但它们在地理范围和定价模式上有所不同。

对于需要在特定地理边界内处理数据的客户,推荐使用 GEO CRIS,因为它可确保推理处理保留在指定 GEO 的地理边界内。

对于没有数据驻留或跨地理区域限制的客户Global CRIS 可以扩展并路由到受支持的 AWS 商业区域,为 Claude 4.5 模型提供比 GEO CRIS 更高的吞吐量和更低的价格。

结论

在本文中,我们介绍了 Anthropic 的 Claude Sonnet 4.5 和 Claude Haiku 4.5 在 Amazon Bedrock 上可用,并为日本和澳大利亚提供了跨区域推理功能。我们讨论了组织如何在满足本地数据处理要求的同时利用先进的 AI 功能,确保推理请求保留在地理边界内。此新功能推荐用于处理敏感数据的行业,例如金融机构、医疗保健提供商和政府机构。我们还提供了有关如何开始的指南,并涵盖了配额管理策略以及从旧版 Claude 模型迁移到 Claude 4.5 模型的指南。要了解有关 Bedrock 上 Claude Sonnet 4.5 和 Claude Haiku 4.5 定价的更多信息,请参阅 Amazon Bedrock 定价

通过此功能,组织现在可以自信地部署生产应用程序,其中包含 Claude Sonnet 4.5 和 Claude Haiku 4.5,这些应用程序不仅满足性能要求,还满足本地数据处理要求,这标志着在这些国家负责任地部署 AI 技术方面取得了重大进展。


作者简介

Derrick Choo 是 AWS 的高级解决方案架构师,他通过云采用、AI/ML 和生成式 AI 解决方案加速企业数字化转型。他专注于全栈开发和机器学习,设计端到端解决方案,涵盖前端界面、IoT 应用、数据集成和 ML 模型,特别关注计算机视觉和多模态系统。

Melanie Li 博士是 AWS 驻澳大利亚悉尼的高级生成式 AI 专家解决方案架构师,她的重点是与客户合作,利用最先进的 AI/ML 工具构建解决方案。她一直积极参与亚太及日本地区的多个生成式 AI 计划,利用大型语言模型 (LLM) 的力量。在加入 AWS 之前,李博士曾在金融和零售行业担任数据科学家职务。

Saurabh Trikande 是 Amazon Bedrock 和 Amazon SageMaker 推理的高级产品经理。他热衷于与客户和合作伙伴合作,目标是实现 AI 的民主化。他专注于部署复杂 AI 应用、多租户模型推理、成本优化以及使生成式 AI 模型部署更容易等核心挑战。在业余时间,Saurabh 喜欢徒步旅行、学习创新技术、关注 TechCrunch 以及与家人共度时光。

Jared Dean 是 AWS 的首席 AI/ML 解决方案架构师。Jared 与跨行业的客户合作,开发提高效率的机器学习应用。他对所有与 AI、技术和烧烤相关的事物都感兴趣。

Stephanie Zhao 是 AWS 在亚太及日本地区的生成式 AI GTM 和容量主管。她倡导客户的声音,以推动 AWS 在亚太及日本所有区域的生成式 AI 服务(包括 Amazon Bedrock 和 Amazon EC2 GPU)的路线图。在工作之外,她喜欢使用生成式 AI 创意模型为她的柴犬和猫制作肖像。

Kazuki Motohashi 博士是 AWS 日本的 AI/ML GTM 专家解决方案架构师。他在 AI/ML 领域工作了 8 年多,目前支持利用 AWS 生成式 AI/ML 服务开展业务的日本企业客户和合作伙伴。他正在寻找时间玩《最终幻想战略版》,但还没有开始。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区