研究基础设施

数十年产业认知,编码进 AI 原生基础设施

我们不只是使用 AI——我们把创始团队几十年的产业认知,编码进基础模型、实时市场数据和专有贸易情报之间的连接层。以下是技术栈的工作方式。

模型层

多模型整合,一个研究大脑

六家模型供应商,统一编排成一个协作的研究系统。推理、视觉解析、数学验证、文本预处理——不同认知任务路由到最擅长的模型,输出汇入同一条分析管线。

Meta Llama 4 (Scout / Maverick)

开源。通用本地推理,数据主权保障。MoE 架构、超长上下文,敏感金融数据在本地实例运行——无 API 调用、无数据外传、完整审计轨迹。API 中断时的备用推理引擎。

DeepSeek-R1 / V3

开源。纯强化学习训练的推理模型,数学推理达到 o1 水平。本地部署用于量化验证:估值模型审计、统计假设检验、情景概率计算(V4 预览版进一步扩展上下文窗口)。

Google Gemma 4

开源。轻量高效本地模型,预处理、分类和嵌入。新闻初筛、情绪标注、元数据提取——将预算集中在分析核心,预处理交给高性价比模型。

OpenAI GPT-5.5 / o3

闭源。o3 推理模型处理多步数学验证:期权定价、概率加权情景分析、敏感性计算。GPT-5.5 负责多模态解析——嵌入图表的财报演示、扫描的监管文件。计算和解析,不是写作。

Claude (Opus 4.8 / Sonnet 4.6)

闭源。主力推理引擎,extended thinking 让推理链可审计。1M token 上下文一次处理完整年报加多份卖方报告。关键分析决策节点的精度保障。

Mistral Medium 3.5

开放权重。欧洲合规场景首选,多语言能力强。单一 dense 模型融合推理、多模态与代码能力,256K 上下文,适合中等复杂度的批量分析任务。

数据层

AI 直接与市场数据对话

通过 MCP 协议,AI 自主查询数据源。四层去噪清洗确保到达推理模型的数据干净、对齐、无泄漏。

AKShare + MCP

中国市场数据核心——A 股、港股、期货、基金、宏观指标。开源、API 原生,通过 MCP 协议让 AI 实时查询。

Cross-Market Data Layer

全球股票、固收、衍生品、ESG 数据。跨境估值对比需要标准化来自不同会计准则和交易日历的数据。

Data Denoising Pipeline

四层清洗:随机矩阵理论去噪协方差 → 退市偏差修正 → 异常值检测(区分闪崩和坏数据)→ 跨境时间对齐。

Anti-Leakage & Normalization

严格时点纪律:系统只用每个历史时刻可知的信息。跨境会计准则标准化(CAS vs GAAP vs IFRS),模糊案例标记人工审查。

Research Ingestion

自动采集卖方报告、新闻、论文、社交信号。解析、去重、标记元数据,向量化以供语义检索。

Workflow Orchestration

将模型、数据源和工具串联成可复制的自动化研究管道。每个工作流是有向无环图——信号检测触发上下文组装,上下文供给多模型分析。

云基础设施

研究跑在哪:多云部署

跨境金融对云架构有特殊要求:数据主权合规、跨区域延迟优化和多云冗余。

Amazon Web Services

全球基础设施主力。Bedrock 托管 Claude 部署、Data Exchange 接入机构级市场数据、跨区域数据冗余。

Google Cloud Platform

BigQuery 大规模市场数据分析和回测。Vertex AI 自定义模型训练。Cloud Run 无服务器部署 MCP 服务器。

Cloudflare

边缘优先部署。Pages 全球静态内容分发,Workers 边缘计算,R2 对象存储无出站费。面向公众的研究平台完全运行在 Cloudflare 边缘网络。

自动化部署与基础设施即代码

每次代码变更触发:构建验证、内容合规扫描、视觉回归测试、分阶段部署。环境配置版本控制、可审计、可复现。60 秒内回滚到任何历史状态。

协作层

专业分工,互相质疑

单个 AI 无法处理完整的研究生命周期。九个生产级 agent 各司其职——分析、写作、质疑、核查、合规审查——每个在隔离上下文中运行。

计划-执行-验证循环

每个研究任务遵循三阶段循环。规划阶段多轮审查,执行阶段并行加速,验证阶段确定性质量门。没有通过全部三个阶段的输出不会到达发布。

角色隔离

分析 agent 可访问数据但不能发布。合规 agent 可标记违规但不能修改分析。编辑 agent 可优化语言但不能改变结论。关注点分离防止未经检查的错误传播。

对抗性审查

每个看多论点都有专门的 agent 构建看空案例——不是象征性反对,是系统性拆解。分析师必须用证据回应每个对抗性论点,论点才能推进。

自我改进记忆

每个错误被记录为永久规则。下次 session 加载累积规则后再开始工作。经过数周,错误率可测量地下降——作为显式约束编码的机构记忆。

判断层

随证据进化的观点

每个论点以先验概率和证伪条件起步。新证据通过贝叶斯推断更新信心。过期论点自动衰减。不是发了就忘——系统性地追踪、更新和退役。

先验赋值

每个新论点以显式概率进入系统——不是"看多"或"看空",而是校准的信心水平。你不能持有一个观点而不量化你对它的信心。

证据累积

新数据不替换论点——更新论点。每次更新记录证据、推理和调整幅度。论点成为一份带有完整证据历史的活文档。

证伪触发

每个论点在发布前必须定义自己的死亡条件——预先承诺的退出标准。如果你无法表述什么会证明你是错的,你的论点不够严谨到可以发布。

信心衰减

没有近期证据的论点靠惯性运行。系统自动降低其信心,标记需要重新审视。防止僵尸论点——六个月前有效但未经新数据检验的观点。

验证层

未经验证,不予信任

单一模型的输出永远不是最终结论。每个分析结论在获得发布资格前,必须通过对抗性审查、跨模型验证、来源独立性检查和量化压力测试。

模型分歧检测

两个模型分析同一问题得出不同结论时,系统标记分歧供人工裁决。模型分歧是信息,不是噪音。

来源独立性检查

三条支持证据可能看起来很强——直到你发现它们来自同一来源。系统追踪证据来源,标记非独立的证据集群。

量化压力测试

关键假设被扰动,系统报告敏感性区间。高敏感性结论收到鲁棒性警告。低敏感性结论获得更高信心。

共识偏差映射

当内部论点与卖方共识显著偏离时,系统自动触发复审。最好的独立研究来自理解了的分歧,不是意外的分歧。

认知架构

思维 × 模型映射

模型中立不是不挑剔。每种思维方式有最适合它的计算形态。我们用多模型不是为了省钱——是因为不同的认知任务需要不同的计算架构。

认知模式核心问题模型分配选择原因
贝叶斯推断新证据应该让信心更新多少?Claude Opus 4.8最长上下文保留完整先验-后验链
因果推理A 导致了 B,还是只是碰巧一起出现?Claude Opus 4.8 + o3Claude 构建因果叙事;o3 验证反事实数学
证伪什么条件下这个论点会死?Claude Sonnet 4.6专职对手需要速度和数量,不需要最大深度
信息论这条新数据到底带来了多少信息增量?Embedding Models向量距离衡量新颖度——远 = 高信息增益
计量经济学这个统计关系在控制变量后还成立吗?o3 / o4-mini纯数学——回归、IV、假设检验
行为金融市场共识是理性的还是被情绪驱动的?Gemini 3.5 Flash + ClaudeGemini 大规模扫描情绪;Claude 判断偏差是否可操作
复杂系统微观行为如何涌现为宏观模式?Claude Opus 4.8必须同时持有多层——个股、行业、宏观、地缘
蒙特卡洛模拟各种结果的概率分布长什么样?o3 + Llama 4 / DeepSeek-R1o3 算概率;Llama 在本地跑大批量敏感数据模拟
对抗性思维如果有人攻击我的论点,最弱环节在哪?两个 Claude 实例对抗一个构建论点,一个拆解——互不可见中间推理
元认知我们自己的分析过程有什么系统性偏差?机构记忆协议不是模型推理——系统级累积错误模式自我修正
知识谱系

每个设计决策都有思想根源

这不是参考文献列表。这是知识基因图谱——我们系统中的每一个设计决策都可以追溯到一个具体的思想传统。

Popper (1934) 证伪主义 Popperian Exit Protocol
每个论点必须定义自己的死亡条件
Bayes (1763) → Black-Litterman (1992) 贝叶斯更新 Bayesian Belief Network
观点没有对错之分;它们是概率
Pearl (2009) 因果图 Causal Chain Visualizer
相关性不是因果性
Tetlock (2015) 校准预测 Prior Calibration + Evidence Accumulation
渐进更新,永远不要全押
Taleb (2007) 肥尾分布 敏感性与体制分析
你的模型能扛住一只黑天鹅吗?
Kahneman (1979) 认知偏差 Red Team Analysis + Contrarian Alpha
你确定这不是确认偏误吗?
Shannon (1948) 信息论 Signal-to-Noise Filtering
这条数据到底携带了多少新信息?
Miller (1956) 工作记忆极限 Cognitive Load Optimization
人类和 AI 都有工作记忆的天花板
Black & Scholes (1973) → Heston (1993) 衍生品定价 Multi-Model Pricing Engine
每个金融工具分解为风险因子;每个风险因子都有最适合它的模型
Brown / OpenAI (2024) 推理时算力扩展 Extended Thinking for Research
推理时多花算力,比训练时多花算力更有效
Ng (2024) Agentic 设计模式 Plan-Execute-Verify Architecture
反思、工具使用、规划、多智能体协作
TradingAgents / FactorMAD (2024-2025) 多智能体辩论 Adversarial Review Pipeline
多空辩论,而非单一模型共识
Olah et al. / Anthropic (2024) 机械可解释性 Model Trust Infrastructure
通过稀疏自编码器提取数百万可解释特征
Amodei (2025) 可解释性紧迫性 Extended Thinking Audit Trail
如果看不到模型怎么思考,就不能信任它的结论
学术文献

学术根基

每个系统组件背后都有经过同行评审的学术传统。以下是塑造我们分析框架的核心文献。

贝叶斯传统

Bayes (1763) → Black-Litterman (1992) → Tetlock (2015)。从原始概率定理到投资组合的观点融合,再到校准预测的操作方法论——论点追踪系统的数学根基。

因果推断

Granger (1969) → Rubin (1974) → Pearl (2009)。从时间序列因果性到潜在结果框架到因果图——区分"相关"与"因果"的全套方法论。

证伪与科学方法

Popper (1934) → Lakatos (1978) → Mayo (2018)。可证伪性作为划界标准,研究纲领的韧性,以及如何设计真正有检验力的统计测试。

风险与不确定性

Knight (1921) → Markowitz (1952) → Taleb (2007, 2012)。从风险与不确定性的根本区分,到均值-方差优化,到肥尾风险和反脆弱性——压力测试不可谈判。

认知与行为

Simon (1955) → Miller (1956) → Kahneman (1979, 2011)。有限理性、工作记忆极限、系统性认知偏差——人类和 AI 共享的认知约束,也是系统架构的设计依据。

AI 与计算

Shannon (1948) → Vaswani (2017) → Anthropic MCP (2024)。从信息论到 Transformer 到 RAG 到 Constitutional AI 到模型上下文协议——技术栈每一层的学术源头。

数据工程

Codd (1970) → Fama-French (1992) → Wickham (2014)。关系数据模型、金融研究的数据清洗标准、整洁数据原则——跨市场数据层的学术骨架。

Agentic AI 与金融智能体

MemGPT (2023) → TradingAgents (2024) → FactorMAD (2025)。从双层记忆架构到多智能体交易模拟到因子挖掘辩论——验证了 AI 辅助判断而非替代判断的定位。

资产类别

超越股票——全谱系资产覆盖

只覆盖股票的投资研究遗漏了一半的画面。我们的分析基础设施延伸到衍生品、固收、外汇和结构化产品——每个都有专门匹配的模型和领域特定的分析框架。

期货与衍生品

商品期货、股指期货、利率期货和互换。监控期限结构动态——正向价差、反向价差、展期收益——作为结构性信号。追踪现货与期货基差、仓单、航运数据,区分投机性持仓和基本面供需变化。

期权分析

隐含波动率曲面、偏度动态、期限结构和波动率套利信号。超越 Black-Scholes——应用 Heston 随机波动率和跳跃扩散框架捕捉肥尾风险。波动率曲面本身作为数据源:偏度变化信号机构对冲需求,期限结构倒挂信号近期事件风险定价。

固收与票据

国债、公司债、商业票据、同业存单。收益率曲线建模为分析骨架——分解为水平、斜率和曲率因子。信用利差分析叠加基本面评估与 CDS 隐含违约概率。对于中国债市,追踪央行公开市场操作、MLF/LPR 动态。

外汇

G10 和新兴市场货币对、NDF 和货币互换。三层分析:短期(持仓、情绪、资金流)、中期(利差、套息、政策分化)、结构性(PPP、经常账户、储备货币动态)。对 USD/CNY 专门监控央行中间价信号和离岸在岸价差。

跨资产相关性

最有价值的信号往往不在单一资产内,而在资产之间。持续监控股债相关性、商品-货币联动、信用-股票背离。体制检测算法识别相关性结构崩溃——这些转换期是最高确信度论点机会集中的地方。

结构化产品

可转债、ABS、CLO 和挂钩票据。分解为组成部分——可转债同时是债券、看涨期权和信用工具。建模现金流瀑布,分析提前偿付风险、优先劣后和触发事件。对中国市场追踪消费贷款证券化、RMBS 发展和 SPV 监管框架。

与基础设施提供方合作

这个研究栈,是你们能力的真实生产负载

上面每一层——模型编排、MCP 数据接入、多云部署——都不是演示,它每天产出公开发表的市场研究。我们想找的是能提供算力与模型资源的基础设施伙伴:你们拿到真实负载下的评测与署名落地,我们拿到把研究做得更深的资源。

01

真实工作负载,可观测

推理调用、上下文长度、多模型路由、跨区域延迟——都发生在持续运行的研究管线里,而不是基准测试脚本里。

02

面向外部读者的展示窗口

研究成果公开发表、署名留痕。模型和云能力的落地效果,由独立读者直接评判,而不是内部指标。

03

具体的接入与反馈

关于资源接入、模型评测、或把你们的能力接进这条管线的合作方式,我们愿意进行具体的技术对话。