大模型驱动的认知型Alpha挖掘——量化投资的新范式

2025-12-20 11:12:54 / Admin / 44 Views

量化投资领域正迎来一场由大模型驱动的深刻变革。

来自香港大学和Grace Investment Machine（GIM）的研究团队提出了一个名为CogAlpha的框架，该成果已入选ACL 2026主会推荐Oral。一句话概括其核心理念：不再让大模型只充当“写公式的助手”，而是将其打造为一个会分工、会反思、会迭代、还会自己改代码的“研究员团队”，去自动挖掘Alpha信号。

量化投资的核心挑战在于挖掘有效的Alpha因子——那些能够预测股票未来走势的信号。然而，市场噪声太大，数据维度太高，真正有用的信号少之又少。传统方法各有局限：人手搓因子速度太慢；遗传编程容易在局部最优解中打转，产出一堆经济意义不强的公式；深度学习虽然预测能力强，但可解释性差，换个市场或周期就不一定稳定。

CogAlpha的第一个关键突破，是把Alpha从“公式”升级为“代码”。用公式表达因子，表达能力受限；一旦换成Python代码，因子的搜索空间被彻底打开——大模型不再只是吐出一个数学表达式，而是能写出带注释、带逻辑、能执行、能检查的候选因子程序。

在此基础上，研究团队为CogAlpha搭建了一套“研究组织架构”——一个7层、21个智能体的探索体系。这7层并非随意划分，而是按照量化研究的思考逻辑，从宏观到微观逐层拆解：第一层分析市场结构与周期切换；第二层盯极端风险和崩盘前兆；第三层研究价量关系与流动性；第四层看趋势延续与短期反转；第五层处理回撤结构与多尺度复杂性；第六层做状态门控，让信号按市场状态决定是否激活；第七层负责K线形态与多因子合成。这不是让一个大模型闷头想因子，而是让一整个分工明确的研究团队同时从不同角度挖掘信号。

更接近人类研究流程的是CogAlpha的迭代进化机制。系统先生成一批候选Alpha，检查代码能否运行、逻辑有无问题，然后用IC、RankIC、ICIR、RankICIR和互信息MI五个指标做筛选，将优秀的候选因子进行变异、交叉和进化，不断淘汰表现差的，保留更有潜力的。筛选分两档：超过同代65分位的算合格因子，超过80分位的算精英，后者进入下一轮演化。

为了防止系统越来越保守、最后只会围着几个套路打转，研究团队还设计了多样化提示策略。

在来自中美港三个市场的5个数据集上，CogAlpha稳定跑赢了21个基线方法。在CSI300指数10天预测任务上，年化超额收益达到16.39%，信息比率1.8999。

这一成果标志着因子挖掘正从传统遗传规划的盲目搜索，迈入大模型驱动的认知型、可解释的新阶段。AI的价值不是直接荐股，而是把一个投资想法变成可复现、可检验、可迭代的研究流程。未来的因子挖掘可能是认知型的——利用大模型在稀疏的Alpha丛林中高效导航，从单一因子的发现转向因子协同与动态生命周期管理，不再执着于追求复杂公式，而是追求逻辑的稳健与可控。

热线电话

公司地址

Contact

大模型驱动的认知型Alpha挖掘——量化投资的新范式