量化投资领域正迎来一场由大模型驱动的深刻变革。
来自香港大学和Grace Investment Machine(GIM)的研究团队提出了一个名为CogAlpha的框架,该成果已入选ACL 2026主会推荐Oral。一句话概括其核心理念:不再让大模型只充当“写公式的助手”,而是将其打造为一个会分工、会反思、会迭代、还会自己改代码的“研究员团队”,去自动挖掘Alpha信号。
量化投资的核心挑战在于挖掘有效的Alpha因子——那些能够预测股票未来走势的信号。然而,市场噪声太大,数据维度太高,真正有用的信号少之又少。传统方法各有局限:人手搓因子速度太慢;遗传编程容易在局部最优解中打转,产出一堆经济意义不强的公式;深度学习虽然预测能力强,但可解释性差,换个市场或周期就不一定稳定。
CogAlpha的第一个关键突破,是把Alpha从“公式”升级为“代码”。用公式表达因子,表达能力受限;一旦换成Python代码,因子的搜索空间被彻底打开——大模型不再只是吐出一个数学表达式,而是能写出带注释、带逻辑、能执行、能检查的候选因子程序。
在此基础上,研究团队为CogAlpha搭建了一套“研究组织架构”——一个7层、21个智能体的探索体系。这7层并非随意划分,而是按照量化研究的思考逻辑,从宏观到微观逐层拆解:第一层分析市场结构与周期切换;第二层盯极端风险和崩盘前兆;第三层研究价量关系与流动性;第四层看趋势延续与短期反转;第五层处理回撤结构与多尺度复杂性;第六层做状态门控,让信号按市场状态决定是否激活;第七层负责K线形态与多因子合成。这不是让一个大模型闷头想因子,而是让一整个分工明确的研究团队同时从不同角度挖掘信号。
更接近人类研究流程的是CogAlpha的迭代进化机制。系统先生成一批候选Alpha,检查代码能否运行、逻辑有无问题,然后用IC、RankIC、ICIR、RankICIR和互信息MI五个指标做筛选,将优秀的候选因子进行变异、交叉和进化,不断淘汰表现差的,保留更有潜力的。筛选分两档:超过同代65分位的算合格因子,超过80分位的算精英,后者进入下一轮演化。
为了防止系统越来越保守、最后只会围着几个套路打转,研究团队还设计了多样化提示策略。
在来自中美港三个市场的5个数据集上,CogAlpha稳定跑赢了21个基线方法。在CSI300指数10天预测任务上,年化超额收益达到16.39%,信息比率1.8999。
这一成果标志着因子挖掘正从传统遗传规划的盲目搜索,迈入大模型驱动的认知型、可解释的新阶段。AI的价值不是直接荐股,而是把一个投资想法变成可复现、可检验、可迭代的研究流程。未来的因子挖掘可能是认知型的——利用大模型在稀疏的Alpha丛林中高效导航,从单一因子的发现转向因子协同与动态生命周期管理,不再执着于追求复杂公式,而是追求逻辑的稳健与可控。