六家模型供应商,统一编排成一个协作的研究系统。推理、视觉解析、数学验证、文本预处理——不同认知任务路由到最擅长的模型,输出汇入同一条分析管线。
开源。通用本地推理,数据主权保障。MoE 架构、超长上下文,敏感金融数据在本地实例运行——无 API 调用、无数据外传、完整审计轨迹。API 中断时的备用推理引擎。
开源。纯强化学习训练的推理模型,数学推理达到 o1 水平。本地部署用于量化验证:估值模型审计、统计假设检验、情景概率计算(V4 预览版进一步扩展上下文窗口)。
开源。轻量高效本地模型,预处理、分类和嵌入。新闻初筛、情绪标注、元数据提取——将预算集中在分析核心,预处理交给高性价比模型。
闭源。o3 推理模型处理多步数学验证:期权定价、概率加权情景分析、敏感性计算。GPT-5.5 负责多模态解析——嵌入图表的财报演示、扫描的监管文件。计算和解析,不是写作。
闭源。主力推理引擎,extended thinking 让推理链可审计。1M token 上下文一次处理完整年报加多份卖方报告。关键分析决策节点的精度保障。
开放权重。欧洲合规场景首选,多语言能力强。单一 dense 模型融合推理、多模态与代码能力,256K 上下文,适合中等复杂度的批量分析任务。
通过 MCP 协议,AI 自主查询数据源。四层去噪清洗确保到达推理模型的数据干净、对齐、无泄漏。
中国市场数据核心——A 股、港股、期货、基金、宏观指标。开源、API 原生,通过 MCP 协议让 AI 实时查询。
全球股票、固收、衍生品、ESG 数据。跨境估值对比需要标准化来自不同会计准则和交易日历的数据。
四层清洗:随机矩阵理论去噪协方差 → 退市偏差修正 → 异常值检测(区分闪崩和坏数据)→ 跨境时间对齐。
严格时点纪律:系统只用每个历史时刻可知的信息。跨境会计准则标准化(CAS vs GAAP vs IFRS),模糊案例标记人工审查。
自动采集卖方报告、新闻、论文、社交信号。解析、去重、标记元数据,向量化以供语义检索。
将模型、数据源和工具串联成可复制的自动化研究管道。每个工作流是有向无环图——信号检测触发上下文组装,上下文供给多模型分析。
跨境金融对云架构有特殊要求:数据主权合规、跨区域延迟优化和多云冗余。
全球基础设施主力。Bedrock 托管 Claude 部署、Data Exchange 接入机构级市场数据、跨区域数据冗余。
BigQuery 大规模市场数据分析和回测。Vertex AI 自定义模型训练。Cloud Run 无服务器部署 MCP 服务器。
边缘优先部署。Pages 全球静态内容分发,Workers 边缘计算,R2 对象存储无出站费。面向公众的研究平台完全运行在 Cloudflare 边缘网络。
每次代码变更触发:构建验证、内容合规扫描、视觉回归测试、分阶段部署。环境配置版本控制、可审计、可复现。60 秒内回滚到任何历史状态。
单个 AI 无法处理完整的研究生命周期。九个生产级 agent 各司其职——分析、写作、质疑、核查、合规审查——每个在隔离上下文中运行。
每个研究任务遵循三阶段循环。规划阶段多轮审查,执行阶段并行加速,验证阶段确定性质量门。没有通过全部三个阶段的输出不会到达发布。
分析 agent 可访问数据但不能发布。合规 agent 可标记违规但不能修改分析。编辑 agent 可优化语言但不能改变结论。关注点分离防止未经检查的错误传播。
每个看多论点都有专门的 agent 构建看空案例——不是象征性反对,是系统性拆解。分析师必须用证据回应每个对抗性论点,论点才能推进。
每个错误被记录为永久规则。下次 session 加载累积规则后再开始工作。经过数周,错误率可测量地下降——作为显式约束编码的机构记忆。
每个论点以先验概率和证伪条件起步。新证据通过贝叶斯推断更新信心。过期论点自动衰减。不是发了就忘——系统性地追踪、更新和退役。
每个新论点以显式概率进入系统——不是"看多"或"看空",而是校准的信心水平。你不能持有一个观点而不量化你对它的信心。
新数据不替换论点——更新论点。每次更新记录证据、推理和调整幅度。论点成为一份带有完整证据历史的活文档。
每个论点在发布前必须定义自己的死亡条件——预先承诺的退出标准。如果你无法表述什么会证明你是错的,你的论点不够严谨到可以发布。
没有近期证据的论点靠惯性运行。系统自动降低其信心,标记需要重新审视。防止僵尸论点——六个月前有效但未经新数据检验的观点。
单一模型的输出永远不是最终结论。每个分析结论在获得发布资格前,必须通过对抗性审查、跨模型验证、来源独立性检查和量化压力测试。
两个模型分析同一问题得出不同结论时,系统标记分歧供人工裁决。模型分歧是信息,不是噪音。
三条支持证据可能看起来很强——直到你发现它们来自同一来源。系统追踪证据来源,标记非独立的证据集群。
关键假设被扰动,系统报告敏感性区间。高敏感性结论收到鲁棒性警告。低敏感性结论获得更高信心。
当内部论点与卖方共识显著偏离时,系统自动触发复审。最好的独立研究来自理解了的分歧,不是意外的分歧。
模型中立不是不挑剔。每种思维方式有最适合它的计算形态。我们用多模型不是为了省钱——是因为不同的认知任务需要不同的计算架构。
| 认知模式 | 核心问题 | 模型分配 | 选择原因 |
|---|---|---|---|
| 贝叶斯推断 | 新证据应该让信心更新多少? | Claude Opus 4.8 | 最长上下文保留完整先验-后验链 |
| 因果推理 | A 导致了 B,还是只是碰巧一起出现? | Claude Opus 4.8 + o3 | Claude 构建因果叙事;o3 验证反事实数学 |
| 证伪 | 什么条件下这个论点会死? | Claude Sonnet 4.6 | 专职对手需要速度和数量,不需要最大深度 |
| 信息论 | 这条新数据到底带来了多少信息增量? | Embedding Models | 向量距离衡量新颖度——远 = 高信息增益 |
| 计量经济学 | 这个统计关系在控制变量后还成立吗? | o3 / o4-mini | 纯数学——回归、IV、假设检验 |
| 行为金融 | 市场共识是理性的还是被情绪驱动的? | Gemini 3.5 Flash + Claude | Gemini 大规模扫描情绪;Claude 判断偏差是否可操作 |
| 复杂系统 | 微观行为如何涌现为宏观模式? | Claude Opus 4.8 | 必须同时持有多层——个股、行业、宏观、地缘 |
| 蒙特卡洛模拟 | 各种结果的概率分布长什么样? | o3 + Llama 4 / DeepSeek-R1 | o3 算概率;Llama 在本地跑大批量敏感数据模拟 |
| 对抗性思维 | 如果有人攻击我的论点,最弱环节在哪? | 两个 Claude 实例对抗 | 一个构建论点,一个拆解——互不可见中间推理 |
| 元认知 | 我们自己的分析过程有什么系统性偏差? | 机构记忆协议 | 不是模型推理——系统级累积错误模式自我修正 |
这不是参考文献列表。这是知识基因图谱——我们系统中的每一个设计决策都可以追溯到一个具体的思想传统。
每个系统组件背后都有经过同行评审的学术传统。以下是塑造我们分析框架的核心文献。
Bayes (1763) → Black-Litterman (1992) → Tetlock (2015)。从原始概率定理到投资组合的观点融合,再到校准预测的操作方法论——论点追踪系统的数学根基。
Granger (1969) → Rubin (1974) → Pearl (2009)。从时间序列因果性到潜在结果框架到因果图——区分"相关"与"因果"的全套方法论。
Popper (1934) → Lakatos (1978) → Mayo (2018)。可证伪性作为划界标准,研究纲领的韧性,以及如何设计真正有检验力的统计测试。
Knight (1921) → Markowitz (1952) → Taleb (2007, 2012)。从风险与不确定性的根本区分,到均值-方差优化,到肥尾风险和反脆弱性——压力测试不可谈判。
Simon (1955) → Miller (1956) → Kahneman (1979, 2011)。有限理性、工作记忆极限、系统性认知偏差——人类和 AI 共享的认知约束,也是系统架构的设计依据。
Shannon (1948) → Vaswani (2017) → Anthropic MCP (2024)。从信息论到 Transformer 到 RAG 到 Constitutional AI 到模型上下文协议——技术栈每一层的学术源头。
Codd (1970) → Fama-French (1992) → Wickham (2014)。关系数据模型、金融研究的数据清洗标准、整洁数据原则——跨市场数据层的学术骨架。
MemGPT (2023) → TradingAgents (2024) → FactorMAD (2025)。从双层记忆架构到多智能体交易模拟到因子挖掘辩论——验证了 AI 辅助判断而非替代判断的定位。
只覆盖股票的投资研究遗漏了一半的画面。我们的分析基础设施延伸到衍生品、固收、外汇和结构化产品——每个都有专门匹配的模型和领域特定的分析框架。
商品期货、股指期货、利率期货和互换。监控期限结构动态——正向价差、反向价差、展期收益——作为结构性信号。追踪现货与期货基差、仓单、航运数据,区分投机性持仓和基本面供需变化。
隐含波动率曲面、偏度动态、期限结构和波动率套利信号。超越 Black-Scholes——应用 Heston 随机波动率和跳跃扩散框架捕捉肥尾风险。波动率曲面本身作为数据源:偏度变化信号机构对冲需求,期限结构倒挂信号近期事件风险定价。
国债、公司债、商业票据、同业存单。收益率曲线建模为分析骨架——分解为水平、斜率和曲率因子。信用利差分析叠加基本面评估与 CDS 隐含违约概率。对于中国债市,追踪央行公开市场操作、MLF/LPR 动态。
G10 和新兴市场货币对、NDF 和货币互换。三层分析:短期(持仓、情绪、资金流)、中期(利差、套息、政策分化)、结构性(PPP、经常账户、储备货币动态)。对 USD/CNY 专门监控央行中间价信号和离岸在岸价差。
最有价值的信号往往不在单一资产内,而在资产之间。持续监控股债相关性、商品-货币联动、信用-股票背离。体制检测算法识别相关性结构崩溃——这些转换期是最高确信度论点机会集中的地方。
可转债、ABS、CLO 和挂钩票据。分解为组成部分——可转债同时是债券、看涨期权和信用工具。建模现金流瀑布,分析提前偿付风险、优先劣后和触发事件。对中国市场追踪消费贷款证券化、RMBS 发展和 SPV 监管框架。
上面每一层——模型编排、MCP 数据接入、多云部署——都不是演示,它每天产出公开发表的市场研究。我们想找的是能提供算力与模型资源的基础设施伙伴:你们拿到真实负载下的评测与署名落地,我们拿到把研究做得更深的资源。
推理调用、上下文长度、多模型路由、跨区域延迟——都发生在持续运行的研究管线里,而不是基准测试脚本里。
研究成果公开发表、署名留痕。模型和云能力的落地效果,由独立读者直接评判,而不是内部指标。
关于资源接入、模型评测、或把你们的能力接进这条管线的合作方式,我们愿意进行具体的技术对话。