跨境金融的云架构：合规、延迟与成本

云选择会影响研究质量

大多数公司选云是基础设施决策——哪家便宜、哪家 SDK 好用。跨境投资研究不是这样。我们面对的约束是：中国的数据主权法规决定数据能存在哪里；中国数据源到全球计算节点之间的物理延迟决定信号能多快被处理；三个司法管辖区不同的定价结构决定成本怎么分配。

这三个约束互相冲突。合规要求数据留在境内，延迟要求计算靠近数据源，成本要求把非关键负载推到最便宜的区域。我们的云架构本质上是在三个约束之间做持续的权衡。

数据主权：PIPL / DSL 的实际约束

三部法律划定了红线：个人信息保护法（PIPL）管个人数据出境，数据安全法（DSL）管”重要数据”分级，网络安全法管关键信息基础设施。对 KSINQ 的直接影响是——中国市场数据中涉及个人信息或被归类为重要数据的部分，不能简单地扔到海外服务器上跑模型。

跨境数据传输评估已经是常规合规动作，不是”将来可能要做”的事。2024 年以来，国家网信办对数据出境的执法频率明显上升。我们的架构按”监管只会收紧”来设计——如果明天新增一类数据被划为”重要数据”，架构不需要重构，只需要调整路由规则。

三云分工

三家云各有一个清晰的角色。不是冗余备份，是功能分工。

AWS：主计算层。 核心研究工作流跑在 AWS 上，原因有三个：全球区域覆盖最广（我们需要靠近数据源的计算节点）；Bedrock 原生集成 Claude（省掉一层 API 网关的延迟）；Data Exchange 提供结构化金融数据集，补充我们通过 MCP 接入的数据源。→ 关于模型如何在 AWS 上编排，详见多模型编排

Azure：企业集成层。 不是主计算平台。金融行业的现实是研究报告以 Word 到达，沟通走 Outlook 和 Teams。Azure 解决的是”最后一公里”——把分析管道的输出转成机构客户能直接用的格式，通过他们已有的渠道分发。Azure OpenAI Service 的价值不在模型本身，而在数据驻留保证和审计日志——这两样在直接调 OpenAI API 时拿不到。

GCP：大规模筛选。 跑板块级筛选——跨数千家公司的批量计算——BigQuery 的按查询量付费模型在这个场景下比 AWS 便宜。Vertex AI 做少量微调实验，但这是次要用途。

跨境延迟：摄取和推理的分离

一个具体场景：北京时间上午 10:00，信号检测系统在 A 股数据里发现异常。从这一刻起，分析工作流需要拉上下文、跑模型、出结论——在信号变陈旧之前。中国数据源到计算层每多 100ms 往返延迟，就是分析师没有的时间。

解决办法是把两件事拆开。

数据摄取是延迟敏感的。 频繁访问的中国市场数据缓存在与中国数据提供商低延迟连接的区域节点。A 股行情、QDII 溢价这类高频数据不走跨洋链路。

分析推理是吞吐量敏感的。 Claude 跑深度分析时，输入是已经组装好的上下文包，不是实时数据流。这意味着推理可以在任何有足够 Claude 容量的区域运行，不受数据源地理位置的约束。

这个分离的好处是两边可以独立优化——摄取层追求最低延迟，推理层追求最大吞吐，互不干扰。

成本架构

跑前沿模型做研究很贵。一次完整的深度研究工作流——上下文组装、多模型分析、三重审核——消耗的计算资源不是小数目。每天多个工作流跑下来，成本管理是架构级问题，不是运维细节。

三个控制杠杆：

模型路由。 不是所有任务都需要最贵的模型。路由逻辑把非关键任务分配给成本更低的模型，把前沿模型容量留给分析核心。→ 路由的具体逻辑见多模型编排

计算调度。 不赶时间的工作——事后分析、贝叶斯先验更新、历史回测——批量推到云计算定价最低的时段跑。亚太白天是 AWS 的非高峰窗口，我们把批处理塞进去。

数据缓存。 公司基本面数据季度才变一次，没必要每天重新查询。维持本地缓存，减少对 MCP 数据源的冗余 API 调用。→ 数据层的缓存策略详见数据基础设施

原则很简单：影响研究质量的地方花钱，其他地方压到最低。

架构的约束决定架构的形状

单独看，这里没有什么惊人的技术决策——任何有经验的云架构师都能设计每一块。难的是在跨境合规约束下让它们同时工作：数据不能随便出境，延迟不能太高，成本不能失控，三个云的计费模型完全不同。

这套架构是约束的产物，不是技术偏好的产物。如果我们只在一个司法管辖区运营，大概率用单云就够了。跨境研究的现实逼出了多云编排，而合规要求决定了编排的具体形状。