目 录CONTENT

文章目录

使用 Foursquare Spatial H3 Hub 和 Amazon SageMaker AI 部署地理空间智能体

Administrator
2025-11-22 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/deploy-geospatial-agents-with-foursquare-spatial-h3-hub-and-amazon-sagemaker-ai/

原文作者:Vikram Gundeti, Aditya Badhwar, and Amit Modi


组织机构一直将地理空间机器学习 (ML) 应用于房产风险评估、灾害响应和基础设施规划等领域。这些系统虽然效果良好,但往往无法扩展到专业用例之外。每一个问题都需要多个地理空间数据集,每个数据集都有自己的模型,甚至自己的工作流程,这使得这些能力仅限于那些能够负担得起投资的大型企业的少数高价值用例。在本文中,您将了解到如何部署地理空间 AI 智能体,它们能够在几分钟内而不是几个月内回答复杂的空间问题。通过结合 Foursquare Spatial H3 Hub 的分析就绪地理空间数据与部署在 Amazon SageMaker AI 上的推理模型,您可以构建智能体,使非技术领域专家能够通过自然语言查询执行复杂的空间分析——而无需 地理信息系统 (GIS) 专业知识或定制数据工程管道。

地理空间智能的采用壁垒

两个技术壁垒阻碍了这些专业地理空间系统获得更广泛的应用。第一,地理空间数据以惊人的格式组合出现——卫星图像存储为 GeoTIFF 光栅、行政边界存储为 Shapefile 矢量、天气模型存储为 NetCDF 网格,以及专有地籍格式的房产记录——每种都需要不同的解析库和定制数据管道。第二,跨空间粒度连接数据集非常棘手:针对单个地址地理编码的房产保险数据必须与 1 公里网格单元的气候风险数据以及汇总到街区组的人口统计数据相结合,这要求组织花费数月时间构建定制处理管道,才能回答第一个业务问题。简而言之,没有一个通用的连接键来组合这些数据集。这意味着组织在没有首先构建数据工程管道来规范化不同格式、实施用于坐标转换和分辨率重采样的空间处理,以及部署专业计算基础设施的情况下,无法试验地理空间智能。

仅仅解决技术壁垒是不够的。早期的系统仍然需要专业 GIS 团队进行 6-12 个月的实施。五个企业需求仍未得到满足:使地理空间分析对非技术领域专家易于访问、展示 AI 如何得出结论、支持灵活的分析、提供交互式的响应时间,以及提供可扩展的成本可预测性。

三项技术的融合以应对采用挑战

解决这些技术和企业壁垒需要一种根本不同的方法。这种架构结合了三种技术来弥补这些差距:

  1. Foursquare Spatial H3 Hub 用于分析就绪数据 – 此服务将无法访问的光栅和矢量地理空间数据转换为分析就绪特征,并索引到 H3 分层网格系统中,采用数据科学家可以使用 Spark、Python 和 DuckDB 等熟悉工具查询的表格格式。包含纬度和经度坐标、城市名称或邮政编码的数据集可以通过在共同的 H3 单元格上连接来轻松丰富,从而消除数月的数​​据准备和专业的 GIS 专长。
  2. 推理模型和智能体 AI 实现自适应工作流 – 像 DeepSeek-R1 和 Llama 3 这样的模型可以分解复杂问题、推理多步工作流,并跨数据源编排操作。它们动态确定要组合哪些数据集并规划分析序列,而这些序列以前需要 GIS 专业知识——将静态、预配置的工作流转变为自适应推理系统。
  3. Amazon SageMaker AI 用于成本效益高的 生成式 AI 推理 – 此 Amazon SageMaker AI 功能提供托管式基础设施,用于使用优化的推理运行时、自动扩展和操作工具部署开源模型。团队可以专注于构建地理空间智能能力,而不是管理底层基础设施。

这三项技术共同使组织能够在不构建专业基础设施的情况下访问分析就绪的地理空间数据、部署自适应推理智能体并运行生产推理。在本文中,我们将演示一个生产地理空间智能体,它将 Foursquare Spatial H3 Hub 与部署在 Amazon SageMaker AI 上的推理模型相结合。

使用 Foursquare Spatial H3 Hub 实现分析就绪的地理空间数据

Foursquare 的 Spatial H3 Hub 通过专有的 H3 索引引擎消除了传统的地理空间采用壁垒。该引擎已将数十个不同的地理空间数据集转换为可供即时分析的 Iceberg 目录,用对分析就绪地理空间特征的即时访问取代了数月的数​​据工程工作。

H3 索引引擎解决了地理空间复杂性的根本原因:历史上限制了地理信息访问的大量格式和坐标系统。该引擎通过将空间数据、光栅图像或矢量数据集索引到全球规模的 H3 分层空间网格中来转换它们。H3 将整个地球划分为嵌套的六边形单元格,创建了一个通用网格系统,其中每个位置都有一个标准化的标识符。该引擎从光栅图像或不同的矢量形状(如人口普查区多边形)中提取数据,并将其转换为表格格式中附加到 H3 单元格 ID 的特征,其中单元格 ID 成为一个通用的连接键,抽象了格式复杂性和坐标系统。保险公司的房产数据、国家海洋和大气管理局 (NOAA) 的气候预测、人口普查人口统计数据和基础设施网络可以组合在一起,因为它们共享这个共同的空间索引。

该引擎还处理了传统上需要 GIS 专业知识的方法论复杂性。它可以将数据索引到任何精度的 H3 单元格,精度从分辨率 0(覆盖大陆的约 1,000 公里六边形)到分辨率 15(覆盖单个建筑的约 1 米六边形)。您可以为每个用例选择适当的分辨率——区域气候分析的分辨率较高,房产级别评估的分辨率较低。当边界没有完美对齐时——例如,一个人口普查区与多个 H3 六边形重叠——引擎通过基于质心的快速近似或基于交集面积的精确比例分配来智能地处理部分重叠。当组合不同尺度的数据集时,它还会自动聚合或解聚数据,消除了传统上耗费 GIS 专家数月时间的手动预处理工作。

建立在此索引基础之上,Foursquare Spatial H3 Hub 提供了一个 Iceberg 目录,其中包含跨能源基础设施、环境条件和自然灾害的数据集,所有这些数据集最初都是不同的光栅和矢量格式,现在已预先索引到分辨率为 8 的 H3 单元格(并可根据需要提供其他分辨率)。您可以使用 SQL、Python、Spark、Snowflake 和 Databricks 等熟悉工具查询此数据,无需专有 GIS 软件。H3 单元格标识符成为与其他任何属性连接起来的简单列值,因此您可以通过将其专有数据与 Foursquare 的 H3 目录连接,快速验证地理空间假设。

用于空间智能的推理模型

DeepSeek-R1 等推理模型改变了 AI 处理地理空间智能的方式。传统的地理空间系统作为静态、专用模型的集合运行,针对洪水风险、野火暴露和地震易损性有单独的模型。每个模型都在特定数据集上训练,无法回答其狭窄领域之外的问题。当需求发生变化或出现新数据时,组织需要进行数月的重新训练。推理模型通过分解复杂问题、规划多步工作流和动态编排跨数据源的操作来改变这种范式。这些系统不是为每个问题要求预训练的模型,而是通过以从未明确编程的方式组合可用数据来推理新颖的场景。当被问及“哪些社区面临复合的气候和经济风险?”时,推理智能体会确定它需要洪水暴露数据、家庭收入等经济指标、房产密度和社区边界,然后通过调用适当的工具和数据源来执行该分析管道。该智能体在概念上理解空间关系:点数据聚合到多边形,网格单元映射到行政边界,邻近性需要适当的距离度量。在每一步,它都会推理接下来应该出现什么信息,并在数据揭示意外模式时进行调整——将地理空间分析从预先编写的查询转变为自适应调查。

在 Amazon SageMaker AI 上部署智能体

分析就绪的地理空间数据和具有推理能力的模型解决了拼图的关键部分,但生产部署带来了新的挑战。地理空间智能体需要持续的推理能力来处理查询、执行推理链、检索数据和生成可视化。组织面临一个选择:使用 GPU 集群、负载均衡器和自动扩展策略构建定制的推理基础设施,或者依赖于成本随使用量不可预测地扩展的商业 大型语言模型 (LLM) API,并且数据治理变得复杂。

Amazon SageMaker AI 提供托管式基础设施,用于在生产环境中部署和运行开源生成式 AI 模型。您可以将来自 Hugging Face 或 Amazon SageMaker AI JumpStart 的模型(包括 DeepSeek-R1、Llama 3 或 Qwen 等推理模型)部署到 SageMaker AI 实时或异步推理端点,而无需管理底层基础设施。Amazon SageMaker AI Inference 负责实例预配,支持 vLLM 和 SGLang 等优化服务运行时,并根据流量模式提供自动扩展。

Amazon SageMaker AI Inference 功能解决了特定于智能体架构的几个操作挑战。处理全天不同查询负载的地理空间智能体受益于基于请求量或自定义指标在 G5、P4d 和 P5 等 GPU 实例上的自动扩展。涉及大地理范围或多数据集连接的空间分析会路由到异步推理端点,允许可能需要 60 秒或更长时间才能完成的查询,而不会超过典型的 API 超时限制,同时为更简单的查询保持响应行为。对于采用多个模型的架构,多容器端点在共享基础设施上托管不同的模型,具有独立的扩展策略和流量路由。与 Amazon CloudWatch 进行监控、AWS 身份和访问管理 (IAM) 进行访问控制以及 Amazon Virtual Private Cloud (Amazon VPC) 进行网络隔离的内置集成简化了操作要求。

Foursquare Spatial H3 Hub 和 Amazon SageMaker AI 一起降低了操作复杂性。数据科学家可以专注于构建智能体能力、定义要为特定问题查询哪些 H3 Hub 数据集、优化空间推理的提示策略,以及优化工具调用模式,而不是管理底层基础设施。组织还可以试验不同的开源模型。以前需要单独的数据工程、模型开发和平台运营团队的此类计划,现在对没有专业基础设施专业知识的小型团队也变得易于访问。

设计 Foursquare 空间智能体

Foursquare 空间智能体架构将部署在 SageMaker AI 上的推理模型与直接查询 Foursquare Spatial H3 Hub 的工具调用功能相结合。该智能体无需人工干预即可编排从自然语言问题到可视化的完整工作流。

智能体工作流

当用户提出关于空间关系(例如“洛杉矶哪些社区面临高洪水风险和经济脆弱性?”)的自然语言问题时,该智能体会执行多步推理过程。推理模型首先分析问题并识别所需信息:洪水风险评分、收入和就业等经济指标以及社区边界。然后,它通过推理数据集描述来确定哪些 H3 Hub 数据集包含相关信息。选择了数据集后,模型会调用 H3 Hub 查询工具,根据 H3 单元格 ID 构造连接数据集的 SQL 查询。执行这些查询后,模型会分析结果以识别空间模式和统计关系。最后,它会生成用于图表显示的 Vega 规范和用于地图显示的 Kepler.gl 规范。

此工作流利用了推理模型进行规划、适应和从错误中恢复的能力。如果初始查询返回意外结果,模型可以改进其方法、选择其他数据集或调整空间操作——这些都是静态、预编程工作流所不具备的能力。

解决企业需求的设计决策

构建生产级地理空间智能体需要解决通过部署分析确定的五个企业需求。三个关键的设计决策说明了该架构如何平衡可访问性、透明度和灵活性。

保险承保人了解洪水风险和房产暴露情况,但他们不编写 SQL 或 Python。该智能体架构通过接受自然语言问题并将其转换为适当的 H3 Hub 查询,使地理空间分析易于访问。推理模型会解释“脆弱社区”或“高风险区域”等领域特定术语,并将这些概念映射到相关的数据集和分析操作。这消除了领域专家必须向数据团队提交分析请求的瓶颈,从而实现了自助探索。

领域专家还需要了解智能体如何得出结论,特别是在分析影响业务决策时。该智能体可以在每一步记录其推理过程:考虑了哪些数据集以及原因、计划了哪些空间操作、执行了哪些查询以及如何解释结果。每个可视化都包含元数据,显示了哪些 H3 单元格和源数据集有助于分析。这种透明度意味着用户可以验证智能体的分析方法并了解结论背后​​的数据来源。如果保险承保人看到某处房产的风险评估很高,他们可以追溯推理链,查看它如何结合了联邦紧急事务管理局 (FEMA) 的洪水暴露数据、州林业数据中的野火风险以及当地评估员记录中的房产特征——从而增强对 AI 生成的见解的信心。实施使用结构化日志记录来捕获推理步骤,使智能体的决策过程可检查和可调试,而不是一个黑匣子。

预构建的仪表板可以满足已知问题,但在分析人员需要探索变体时就会失败。该智能体架构通过使用工具调用动态组合分析来提供灵活性。推理模型不是为每种情况预先定义工作流,而是根据特定问题确定查询哪些 H3 Hub 数据集以及如何组合它们。这使得该智能体能够在无需为每种变体进行新的工程工作的情况下处理未预料到的分析问题。该智能体使用 Llama 3 和 DeepSeek-R1 等模型支持的函数调用 API 与 H3 Hub 进行交互。模型会收到指定可用数据集、查询参数和返回格式的工具描述,然后在推理过程中构建适当的工具调用。SageMaker AI 端点处理推理,而定制的应用程序逻辑管理工具执行和结果组装。

SageMaker AI 部署架构

Foursquare 空间智能体部署在 SageMaker AI 实时推理端点上,其配置针对生产地理空间工作负载进行了优化。该部署使用 G5 实例(如 g5.2xlarge 用于开发和 g5.12xlarge 用于生产),为通常用于智能体推理的 7B–70B 参数范围内模型的成本效益高的 GPU 推理。基于 InvocationsPerInstance 指标的目标跟踪扩展策略可在可变负载下保持响应时间,同时在低流量期间最大限度地降低成本。涉及大地理范围或多数据集连接的空间分析会路由到异步推理端点,允许可能需要 60 秒或更长时间才能完成的查询,而不会超出典型 API 超时限制,同时为更简单的查询保持响应行为。

CloudWatch 指标跟踪部署的推理延迟、错误率和令牌吞吐量。自定义指标记录推理链深度、每次查询的工具调用次数和数据集访问模式,从而实现智能体性能的持续优化。这种部署架构提供了生产级的可靠性,同时为试验不同的模型和提示策略保持了灵活性。

Foursquare 空间智能体实战

下面的演示展示了保险、银行和城市规划等行业的组织如何利用此功能在几分钟内回答复杂的空间问题——将过去跨季度的时间缩短为非技术领域专家可以访问的交互式工作流。在保险风险评估中,该智能体通过在不同空间分辨率和格式下,使用 H3 单元格 ID 可查询的洪水风险、火灾危险严重程度、犯罪率和 FEMA 国家风险指数数据集,计算综合风险评分,来预测洛杉矶地区哪些区域可能会看到保险费增加。承保人以自然语言提出问题,智能体处理数据集选择、空间连接、风险聚合和地图可视化,而无需 GIS 专业知识。

对于银行业务市场分析,该智能体提供了洛杉矶银行网络规划的 360 度视图。它将包括人口、收入和年龄分布的人口统计数据与医疗机构位置、犯罪统计数据和兴趣点相结合,以识别服务不足的市场和扩张机会。此分析为分支机构选址、产品定位和金融普惠计划提供了数据驱动的决策依据。以前,收集这些数据集并执行空间分析需要 GIS 专家数周的时间。现在,该智能体通过对话式交互在几分钟内提供结果。

对于城市基础设施规划,该智能体帮助亚利桑那州钱德勒市规划未来十年的可持续城市发展。它结合了人口增长预测、住房开发模式、平均收入趋势和基础设施数据(包括建筑物、电线和蜂窝塔)——所有这些都已索引到 H3 单元格。城市规划者通过提出“哪些地区将经历人口增长但缺乏足够的基础设施?”等问题来探索情景。该智能体推理分析要求,执行适当的空间查询,并生成显示需要投资的基础设施差距的可视化。

地理空间智能的民主化

Foursquare Spatial H3 Hub、推理模型和 Amazon SageMaker AI 共同消除了壁垒。组织现在可以在不构建专业基础设施的情况下,访问标准化的地理空间数据,部署具有工具调用功能的推理智能体,并运行生产推理。

要部署地理空间 AI 智能体:

  • 访问 Foursquare Spatial H3 Hub 以获取分析就绪的数据集。
  • 使用 SageMaker JumpStart 或 Hugging Face 在 Amazon SageMaker AI 上部署推理模型。
  • 构建智能体能力,通过工具调用将模型连接到 H3 Hub 数据集。

关于作者

Vikram Gundeti 目前担任 Foursquare 的首席技术官 (CTO),负责领导公司地理空间平台的[技术]战略、决策和研究。在加入 Foursquare 之前,Vikram 曾在亚马逊担任首席工程师,他是 Amazon Alexa 团队的创始工程师之一,在那里留下了自己的印记。

Amit Modi 是 Amazon SageMaker AI 的产品管理高级经理,专注于模型运营 (ModelOps) 和推理。他对企业采用模式的分析以及本文所述的 SageMaker 部署方法的 [设计] 源于与企业客户的合作。

Aditya Badhwar 是 AWS 的一名高级解决方案架构师,常驻纽约。他与客户合作,就各种 AWS 服务提供技术协助和架构指导。在加入 AWS 之前,Aditya 在多家大型企业的软件工程和架构角色中工作了 16 年多。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区