亚马逊 Bedrock 现已在阿联酋和巴林推出 Anthropic Claude 模型的全球跨区域推理功能-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://aws.amazon.com/blogs/machine-learning/introducing-amazon-bedrock-global-cross-region-inference-for-anthropics-claude-models-in-the-middle-east-regions/

原文作者：Hossam Basudan, Melanie Li, Sam Dabboussi, and Saurabh Trikande

我们很高兴地宣布，通过 Amazon Bedrock 的全球跨区域推理功能，Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 模型现已在中东地区（阿联酋和巴林）的客户中可用。此发布支持中东地区的组织在 Amazon Bedrock 上使用 Anthropic 最新的 Claude 模型，同时受益于跨 AWS 网络的全局、高可用性的推理路由。借助全球跨区域推理，您可以无缝扩展推理工作负载，提高弹性，并降低运营复杂性。

为了帮助您实现 AI 应用的规模化，Amazon Bedrock 提供了跨区域推理配置文件，这是一项强大的功能，组织可以利用它在多个 AWS 区域之间无缝分配推理处理。此功能有助于您在扩展规模时获得更高的吞吐量，并有助于在重负载下保持生成式 AI 应用程序的响应速度和可靠性。当您调用 Amazon Bedrock 中的跨区域推理配置文件时，您的请求会遵循智能路由路径。请求源于您发出 API 调用的源区域，并自动路由到推理配置文件中定义的目的地区域之一。跨区域推理通过受安全保护的 AWS 网络运行，并对传输中的数据进行端到端加密。

关键区别在于，跨区域推理不会更改数据存储的位置——使用跨区域推理时，客户数据不会存储在目的地区域中；客户管理的日志（如模型调用日志）、知识库和存储的配置将完全保留在源区域内。推理请求会通过 Amazon Bedrock 管理的 AWS 全球网络传输，响应会加密返回到源区域的应用程序中。

在本文中，我们将讨论如何在 Amazon Bedrock 中为中东地区的 Anthropic Claude 模型使用全局跨区域推理。我们将引导您了解每个 Anthropic Claude 模型变体的功能、全局跨区域推理的关键优势（包括提高弹性）、您可以实施的实际用例，以及一个代码示例，以帮助您立即开始构建生成式 AI 应用程序。

Amazon Bedrock 上的 Anthropic Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5

最新一代的 Anthropic Claude 模型现已在亚马逊云科技的中东（阿联酋）和中东（巴林）区域的 Amazon Bedrock 上可用。新的 Claude Opus 4.6 为 Amazon Bedrock 客户带来了先进的功能，包括在需要深度推理和可靠性的智能体任务、复杂编码项目和企业级工作流程方面具有行业领先的性能。Claude Sonnet 4.6 在智能性、速度和成本效益之间取得了平衡，适用于生产就绪的应用程序和多步骤任务。Claude Haiku 4.5 专注于低延迟响应，适用于 AI 助手和高容量内容生成等实时用例。通过将这些模型与全局跨区域推理相结合，您可以动态地跨区域扩展 AI 工作负载，同时保持最佳性能。这有助于组织根据其特定要求（无论是优先考虑智能性、速度还是成本）选择合适的模型，同时受益于跨全球基础设施的无缝扩展和提高的可用性。

下表总结了可用的模型及其源区域和目的地区域。

模型	源区域	目的地区域
Anthropic Opus 4.6	`me-central-1` (阿联酋), `me-south-1` (巴林)	商业区域
Anthropic Sonnet 4.6	`me-central-1` (阿联酋), `me-south-1` (巴林)	商业区域
Anthropic Haiku 4.5	`me-central-1` (阿联酋), `me-south-1` (巴林)	商业区域
Anthropic Sonnet 4.5	`me-central-1` (阿联酋), `me-south-1` (巴林)	商业区域
Anthropic Opus 4.5	`me-central-1` (阿联酋), `me-south-1` (巴林)	商业区域

全球跨区域推理的优势

随着生成式 AI 的采用加速，客户对可靠扩展推理工作负载并保持一致性能的需求日益增加。部署大规模生成式 AI 应用程序通常涉及管理区域容量限制、流量高峰和可用性要求。Amazon Bedrock 全球跨区域推理通过允许将推理请求自动路由到预定义全局推理配置文件中的最佳区域来解决这些挑战，有助于提供多项优势：

高峰需求期间的吞吐量增强 – 对于中东地区的组织来说，全局跨区域推理在区域高峰期（如斋月、大型购物活动或高流量工作时间）提供了关键的弹性。系统会自动将请求路由到具有可用容量的区域，跨全球基础设施运行，确保即使在意外流量激增时，您的应用程序也能保持性能。这种动态路由是无缝发生的，并且流量路由完全由 Amazon Bedrock 管理。对于服务于 GCC 和更广泛的 MENAT 地区客户的业务关键型应用程序来说，这意味着可以避免可能影响收入和客户信任的昂贵停机时间或性能下降。
安全的数据传输 – 跨区域操作中传输的数据由 Amazon Bedrock 管理。数据在区域之间传输时是加密的，有助于满足对中东地区组织至关重要的严格安全和数据保护要求。
简化的多区域战略 – 组织不再需要手动设计复杂的跨区域部署。全局跨区域推理有助于在不增加管理多个区域端点的运营开销的情况下，提供企业级的弹性。
支持快速的数字化转型 – 随着中东组织根据国家愿景（如沙特愿景 2030 和阿联酋 AI 战略）加速其数字化转型计划，全局跨区域推理提供了支持雄心勃勃的 AI 项目所需的扩展性，而没有容量限制。
简化的监控 – Amazon CloudWatch 和 AWS CloudTrail 继续在您的中东源区域记录日志条目，从而提供应用程序性能的集中视图。这种简化的可观测性意味着您的团队可以使用熟悉的 AWS 工具监控和管理生成式 AI 应用程序，无论请求在全球何处处理，从而使合规性和运营管理更加直接。
按需配额灵活性 – 全球跨区域推理有助于消除单个区域容量限制的约束。您的工作负载可以动态访问 AWS 全球基础设施中的资源，从而可以无缝处理该地区快速增长的数字经济中常见的高容量应用程序和突发流量高峰。

随着此功能现已可用于中东地区的 Anthropic Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5，该地区的组织可以更有信心地构建和扩展生成式 AI 应用程序，因为他们知道可以获得企业级的弹性和性能。

全局推理用例

Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过全局跨区域推理的可用性，为中东地区的客户解锁了广泛的用例，包括：

需要高可用性和一致性能的企业副驾驶和 AI 助手
编排复杂推理和工具使用的智能体工作流程
用于代码生成、审查和转换的开发人员效率工具
需要弹性扩展的客户参与应用程序
先进的数据分析和文档处理

配额管理

要查看使用全局推理配置文件时的跨区域吞吐量的默认配额，请参阅 Amazon Bedrock 服务配额中关于“全局跨区域模型推理请求/分钟”和“全局跨区域模型推理令牌/分钟”的值。

您可以在源区域中通过服务配额控制台或使用 AWS 命令行界面 (AWS CLI) 命令来请求、查看和管理全局跨区域推理配置文件的配额。

入门

要开始将 Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 或 Claude Haiku 4.5 与全局跨区域推理（例如 me-central-1 区域）结合使用，请完成以下步骤：

验证您的 AWS 身份和访问管理 (IAM) 角色或用户是否具有使用跨区域推理配置文件调用 Amazon Bedrock 模型的必要权限。
使用 Amazon Bedrock API 或 AWS SDK 调用模型：

import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='me-central-1')
model_id = "global.anthropic.claude-sonnet-4-6"
response = bedrock.converse( messages=[{"role": "user", "content": [{"text": "Explain cloud computing in 2 sentences."}]}], modelId=model_id,
)
print("Response:", response['output']['message']['content'][0]['text'])
print("Token usage:", response['usage'])
print("Total tokens:", response['usage']['totalTokens'])

您可以通过 CloudWatch 和 AWS Cost Explorer 监控使用情况、性能和成本，随着需求的增长来扩展您的应用程序。

结论

随着 Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过 Amazon Bedrock 全球跨区域推理的推出，中东地区的客户现在可以在不进行管理区域推理容量的运营开销的情况下，构建高度可扩展、高弹性的生成式 AI 应用程序。我们对此次发布感到兴奋，并期待看到您如何利用这些功能来加速创新，并在整个地区提供有影响力的 AI 驱动体验。要了解更多信息，请参阅 Amazon Bedrock 跨区域推理入门。