研究基础设施

模型层

多模型整合，一个研究大脑

六家模型供应商，统一编排成一个协作的研究系统。推理、视觉解析、数学验证、文本预处理——不同认知任务路由到最擅长的模型，输出汇入同一条分析管线。

Meta Llama 4 (Scout / Maverick)

开源。通用本地推理，数据主权保障。MoE 架构、超长上下文，敏感金融数据在本地实例运行——无 API 调用、无数据外传、完整审计轨迹。API 中断时的备用推理引擎。

DeepSeek-R1 / V3

开源。纯强化学习训练的推理模型，数学推理达到 o1 水平。本地部署用于量化验证：估值模型审计、统计假设检验、情景概率计算（V4 预览版进一步扩展上下文窗口）。

Google Gemma 4

开源。轻量高效本地模型，预处理、分类和嵌入。新闻初筛、情绪标注、元数据提取——将预算集中在分析核心，预处理交给高性价比模型。

OpenAI GPT-5.5 / o3

闭源。o3 推理模型处理多步数学验证：期权定价、概率加权情景分析、敏感性计算。GPT-5.5 负责多模态解析——嵌入图表的财报演示、扫描的监管文件。计算和解析，不是写作。

Claude (Opus 4.8 / Sonnet 4.6)

闭源。主力推理引擎，extended thinking 让推理链可审计。1M token 上下文一次处理完整年报加多份卖方报告。关键分析决策节点的精度保障。

Mistral Medium 3.5

开放权重。欧洲合规场景首选，多语言能力强。单一 dense 模型融合推理、多模态与代码能力，256K 上下文，适合中等复杂度的批量分析任务。

深度阅读

数据层

AI 直接与市场数据对话

通过 MCP 协议，AI 自主查询数据源。四层去噪清洗确保到达推理模型的数据干净、对齐、无泄漏。

AKShare + MCP

中国市场数据核心——A 股、港股、期货、基金、宏观指标。开源、API 原生，通过 MCP 协议让 AI 实时查询。

Cross-Market Data Layer

全球股票、固收、衍生品、ESG 数据。跨境估值对比需要标准化来自不同会计准则和交易日历的数据。

Data Denoising Pipeline

四层清洗：随机矩阵理论去噪协方差 → 退市偏差修正 → 异常值检测（区分闪崩和坏数据）→ 跨境时间对齐。

Anti-Leakage & Normalization

严格时点纪律：系统只用每个历史时刻可知的信息。跨境会计准则标准化（CAS vs GAAP vs IFRS），模糊案例标记人工审查。

Research Ingestion

自动采集卖方报告、新闻、论文、社交信号。解析、去重、标记元数据，向量化以供语义检索。

Workflow Orchestration

将模型、数据源和工具串联成可复制的自动化研究管道。每个工作流是有向无环图——信号检测触发上下文组装，上下文供给多模型分析。

深度阅读

云基础设施

研究跑在哪：多云部署

跨境金融对云架构有特殊要求：数据主权合规、跨区域延迟优化和多云冗余。

Amazon Web Services

全球基础设施主力。Bedrock 托管 Claude 部署、Data Exchange 接入机构级市场数据、跨区域数据冗余。

Google Cloud Platform

BigQuery 大规模市场数据分析和回测。Vertex AI 自定义模型训练。Cloud Run 无服务器部署 MCP 服务器。

Cloudflare

边缘优先部署。Pages 全球静态内容分发，Workers 边缘计算，R2 对象存储无出站费。面向公众的研究平台完全运行在 Cloudflare 边缘网络。

自动化部署与基础设施即代码

每次代码变更触发：构建验证、内容合规扫描、视觉回归测试、分阶段部署。环境配置版本控制、可审计、可复现。60 秒内回滚到任何历史状态。

深度阅读

→ 跨境金融的云架构：合规、延迟与成本

协作层

专业分工，互相质疑

单个 AI 无法处理完整的研究生命周期。九个生产级 agent 各司其职——分析、写作、质疑、核查、合规审查——每个在隔离上下文中运行。

计划-执行-验证循环

每个研究任务遵循三阶段循环。规划阶段多轮审查，执行阶段并行加速，验证阶段确定性质量门。没有通过全部三个阶段的输出不会到达发布。

角色隔离

分析 agent 可访问数据但不能发布。合规 agent 可标记违规但不能修改分析。编辑 agent 可优化语言但不能改变结论。关注点分离防止未经检查的错误传播。

对抗性审查

每个看多论点都有专门的 agent 构建看空案例——不是象征性反对，是系统性拆解。分析师必须用证据回应每个对抗性论点，论点才能推进。

自我改进记忆

每个错误被记录为永久规则。下次 session 加载累积规则后再开始工作。经过数周，错误率可测量地下降——作为显式约束编码的机构记忆。

判断层

随证据进化的观点

每个论点以先验概率和证伪条件起步。新证据通过贝叶斯推断更新信心。过期论点自动衰减。不是发了就忘——系统性地追踪、更新和退役。

先验赋值

每个新论点以显式概率进入系统——不是"看多"或"看空"，而是校准的信心水平。你不能持有一个观点而不量化你对它的信心。

证据累积

新数据不替换论点——更新论点。每次更新记录证据、推理和调整幅度。论点成为一份带有完整证据历史的活文档。

证伪触发

每个论点在发布前必须定义自己的死亡条件——预先承诺的退出标准。如果你无法表述什么会证明你是错的，你的论点不够严谨到可以发布。

信心衰减

没有近期证据的论点靠惯性运行。系统自动降低其信心，标记需要重新审视。防止僵尸论点——六个月前有效但未经新数据检验的观点。

验证层

未经验证，不予信任

单一模型的输出永远不是最终结论。每个分析结论在获得发布资格前，必须通过对抗性审查、跨模型验证、来源独立性检查和量化压力测试。

模型分歧检测

两个模型分析同一问题得出不同结论时，系统标记分歧供人工裁决。模型分歧是信息，不是噪音。

来源独立性检查

三条支持证据可能看起来很强——直到你发现它们来自同一来源。系统追踪证据来源，标记非独立的证据集群。

量化压力测试

关键假设被扰动，系统报告敏感性区间。高敏感性结论收到鲁棒性警告。低敏感性结论获得更高信心。

共识偏差映射

当内部论点与卖方共识显著偏离时，系统自动触发复审。最好的独立研究来自理解了的分歧，不是意外的分歧。

认知架构

思维 × 模型映射

模型中立不是不挑剔。每种思维方式有最适合它的计算形态。我们用多模型不是为了省钱——是因为不同的认知任务需要不同的计算架构。

认知模式	核心问题	模型分配	选择原因
贝叶斯推断	新证据应该让信心更新多少？	Claude Opus 4.8	最长上下文保留完整先验-后验链
因果推理	A 导致了 B，还是只是碰巧一起出现？	Claude Opus 4.8 + o3	Claude 构建因果叙事；o3 验证反事实数学
证伪	什么条件下这个论点会死？	Claude Sonnet 4.6	专职对手需要速度和数量，不需要最大深度
信息论	这条新数据到底带来了多少信息增量？	Embedding Models	向量距离衡量新颖度——远 = 高信息增益
计量经济学	这个统计关系在控制变量后还成立吗？	o3 / o4-mini	纯数学——回归、IV、假设检验
行为金融	市场共识是理性的还是被情绪驱动的？	Gemma 4 + Claude	Gemma 4 大规模扫描情绪；Claude 判断偏差是否可操作
复杂系统	微观行为如何涌现为宏观模式？	Claude Opus 4.8	必须同时持有多层——个股、行业、宏观、地缘
蒙特卡洛模拟	各种结果的概率分布长什么样？	o3 + Llama 4 / DeepSeek-R1	o3 算概率；Llama 在本地跑大批量敏感数据模拟
对抗性思维	如果有人攻击我的论点，最弱环节在哪？	两个 Claude 实例对抗	一个构建论点，一个拆解——互不可见中间推理
元认知	我们自己的分析过程有什么系统性偏差？	机构记忆协议	不是模型推理——系统级累积错误模式自我修正

知识谱系

每个设计决策都有思想根源

这不是参考文献列表。这是知识基因图谱——我们系统中的每一个设计决策都可以追溯到一个具体的思想传统。

Popper (1934) → 证伪主义 → Popperian Exit Protocol

每个论点必须定义自己的死亡条件

Bayes (1763) → Black-Litterman (1992) → 贝叶斯更新 → Bayesian Belief Network

观点没有对错之分；它们是概率

Pearl (2009) → 因果图 → Causal Chain Visualizer

学术根基

每个系统组件背后都有经过同行评审的学术传统。以下是塑造我们分析框架的核心文献。

贝叶斯传统

Bayes (1763) → Black-Litterman (1992) → Tetlock (2015)。从原始概率定理到投资组合的观点融合，再到校准预测的操作方法论——论点追踪系统的数学根基。

因果推断

Granger (1969) → Rubin (1974) → Pearl (2009)。从时间序列因果性到潜在结果框架到因果图——区分"相关"与"因果"的全套方法论。

证伪与科学方法

Popper (1934) → Lakatos (1978) → Mayo (2018)。可证伪性作为划界标准，研究纲领的韧性，以及如何设计真正有检验力的统计测试。

风险与不确定性

Knight (1921) → Markowitz (1952) → Taleb (2007, 2012)。从风险与不确定性的根本区分，到均值-方差优化，到肥尾风险和反脆弱性——压力测试不可谈判。

认知与行为

Simon (1955) → Miller (1956) → Kahneman (1979, 2011)。有限理性、工作记忆极限、系统性认知偏差——人类和 AI 共享的认知约束，也是系统架构的设计依据。

AI 与计算

Shannon (1948) → Vaswani (2017) → Anthropic MCP (2024)。从信息论到 Transformer 到 RAG 到 Constitutional AI 到模型上下文协议——技术栈每一层的学术源头。

数据工程

Codd (1970) → Fama-French (1992) → Wickham (2014)。关系数据模型、金融研究的数据清洗标准、整洁数据原则——跨市场数据层的学术骨架。

Agentic AI 与金融智能体

MemGPT (2023) → TradingAgents (2024) → FactorMAD (2025)。从双层记忆架构到多智能体交易模拟到因子挖掘辩论——验证了 AI 辅助判断而非替代判断的定位。

查看完整文献列表 →

资产类别

超越股票——全谱系资产覆盖

只覆盖股票的投资研究遗漏了一半的画面。我们的分析基础设施延伸到衍生品、固收、外汇和结构化产品——每个都有专门匹配的模型和领域特定的分析框架。

期货与衍生品

商品期货、股指期货、利率期货和互换。监控期限结构动态——正向价差、反向价差、展期收益——作为结构性信号。追踪现货与期货基差、仓单、航运数据，区分投机性持仓和基本面供需变化。

期权分析

隐含波动率曲面、偏度动态、期限结构和波动率套利信号。超越 Black-Scholes——应用 Heston 随机波动率和跳跃扩散框架捕捉肥尾风险。波动率曲面本身作为数据源：偏度变化信号机构对冲需求，期限结构倒挂信号近期事件风险定价。

固收与票据

国债、公司债、商业票据、同业存单。收益率曲线建模为分析骨架——分解为水平、斜率和曲率因子。信用利差分析叠加基本面评估与 CDS 隐含违约概率。对于中国债市，追踪央行公开市场操作、MLF/LPR 动态。

外汇

G10 和新兴市场货币对、NDF 和货币互换。三层分析：短期（持仓、情绪、资金流）、中期（利差、套息、政策分化）、结构性（PPP、经常账户、储备货币动态）。对 USD/CNY 专门监控央行中间价信号和离岸在岸价差。

跨资产相关性

最有价值的信号往往不在单一资产内，而在资产之间。持续监控股债相关性、商品-货币联动、信用-股票背离。体制检测算法识别相关性结构崩溃——这些转换期是最高确信度论点机会集中的地方。

结构化产品

可转债、ABS、CLO 和挂钩票据。分解为组成部分——可转债同时是债券、看涨期权和信用工具。建模现金流瀑布，分析提前偿付风险、优先劣后和触发事件。对中国市场追踪消费贷款证券化、RMBS 发展和 SPV 监管框架。

与基础设施提供方合作

这个研究栈，把你们的能力放进真实生产负载里跑

上面每一层——模型编排、MCP 数据接入、多云部署——都不是演示，它每天产出公开发表的市场研究。我们想找的是能提供算力与模型资源的基础设施伙伴：你们拿到真实负载下的评测与署名落地，我们拿到把研究做得更深的资源。

真实工作负载，可观测

推理调用、上下文长度、多模型路由、跨区域延迟——都发生在持续运行的研究管线里，而不是基准测试脚本里。

面向外部读者的展示窗口

研究成果公开发表、署名留痕。模型和云能力的落地效果，由独立读者直接评判，而不是内部指标。

具体的接入与反馈

关于资源接入、模型评测、或把你们的能力接进这条管线的合作方式，我们愿意进行具体的技术对话。

联系我们 → [email protected]

数十年产业认知，编码进 AI 原生基础设施

多模型整合，一个研究大脑

Meta Llama 4 (Scout / Maverick)

DeepSeek-R1 / V3

Google Gemma 4

OpenAI GPT-5.5 / o3

Claude (Opus 4.8 / Sonnet 4.6)

Mistral Medium 3.5

AI 直接与市场数据对话

AKShare + MCP

Cross-Market Data Layer

Data Denoising Pipeline

Anti-Leakage & Normalization

Research Ingestion

Workflow Orchestration

研究跑在哪：多云部署

Amazon Web Services

Google Cloud Platform

Cloudflare

自动化部署与基础设施即代码

专业分工，互相质疑

计划-执行-验证循环

角色隔离

对抗性审查

自我改进记忆

随证据进化的观点

先验赋值

证据累积

证伪触发

信心衰减

未经验证，不予信任

模型分歧检测

来源独立性检查

量化压力测试

共识偏差映射

思维 × 模型映射

每个设计决策都有思想根源

学术根基

贝叶斯传统

因果推断

证伪与科学方法

风险与不确定性

认知与行为

AI 与计算

数据工程

Agentic AI 与金融智能体

超越股票——全谱系资产覆盖

期货与衍生品

期权分析

固收与票据

外汇

跨资产相关性

结构化产品

这个研究栈，把你们的能力放进真实生产负载里跑

真实工作负载，可观测

面向外部读者的展示窗口

具体的接入与反馈