殷乐:量化因子体系与基本面研究的深度结合
(来源:建榕量化研究)
会议:开源证券2025年度策略会
议程:量化投资与资产配置论坛
日期:2024年11月13日
地点:上海浦东香格里拉酒店
主办:开源证券金融工程魏建榕团队
主题演讲:量化因子体系与基本面研究的深度结合
特邀嘉宾:殷乐,中庚基金量化投资部总监
发言实录:
大家好,感谢开源证券金融工程团队魏建榕博士的邀请!今天能够有机会与大家交流,感到非常荣幸。我今天汇报的主题是“量化因子体系与基本面研究的深度结合”。
首先,我们来探讨一下量化因子体系与基本面研究在方法论上的差异。实际上,这两种方法论各自的优势与劣势都非常明显,并且与其自身的特性有着天然的关系。量化因子体系是一种从定价出发的分析方法,从最初的CAPM模型到后来的FamaFrench模型,再到当前的多因子框架,量化因子体系始终聚焦于股票定价的研究。而基本面研究在定价方面通常比较依赖估值指标,如通过市盈率(P/E)、市净率(P/B)、市值和折现现金流(DCF)来对股票进行定价,相对而言在定价方面,量化因子体系天然更具有优势。其次,量化因子体系的覆盖度更高。尽管量化因子体系的信噪比可能并不高,但至少每天都能覆盖全市场5000只股票并进行定价,这是基本面研究所无法比拟的。基本面研究通常受限于研究资源,无法覆盖整个市场。然后,量化因子体系在中小市值股票中的优势也比较明显。许多中小市值股票的业务波动较大,且股价与基本面之间的关系不如大盘股明确,导致基本面研究往往无法给出较为明确的结论。而量化因子体系能够更有效地捕捉这些股票的价格波动。此外,量化因子体系在交易层面也更有优势。我们利用大量的Level2数据计算量价因子,这使得量化因子体系在把握短期交易和市场微结构分析方面优于基本面研究。
当然对于基本面研究而言,也具有许多非常明显的优势,比如对公司深度研究的能力、对行业趋势、商业模式、公司治理结构和永续增长潜力的判断等,这些都是难以有效量化的领域。因此,基本面研究在这些方面的表现更为出色。此外,基本面研究的另一个优势在于其较长的持有时间和较低的换手率,这对于减少组合的频繁交易和降低交易成本也非常有帮助。
对于这些挑战,量化团队的一种做法是与基本面研究人员合作,探讨行业的逻辑,并试图将这些逻辑通过量化的语言定量的刻画出来。然而我们认为这种方法可能会事倍功半,对于这些领域,我们可能并没有足够的数据和专业能力去将其量化。
总结来说,量化因子体系和基本面研究各有其独特的优势。我们需要充分了解并利用自身的优势,尽量避免用自己的短板去挑战对手的长处。对于那些难以量化但又至关重要的领域,我们战略上需要高度重视,但战术上可以选择放弃直接量化建模的方式,而是通过一种结构化的方式将基本面研究的成果纳入到量化的因子体系中,从而实现1+1大于2的效果。
既然要实现量化因子体系与基本面研究的深度结合,首先需要构建一套相对完备的量化因子体系。目前我们的因子库包含约300多个底层因子,这些因子按照逻辑关系被分为八个大类。整个因子库在持续迭代更新中,每年大约会有5%至10%的因子被替换或更新。底层因子通过加权的IC(信息系数)和IR(信息比率)方法进行合成,形成大类因子,大类因子经过正交化处理后,再等权合成为最终的预测信号。最终,我们的线性因子框架在实盘运行中,月均IC大约为0.15,表现为一个比较高的IC。
从大类因子来看,偏向基本面的大类因子的IC值通常在0.05到0.1之间,而偏向量价的大类因子的IC值通常都能超过0.1。在这个框架中,我想特别提到的是公司治理因子。这个因子属于低频因子,但其月均IC能达到0.08,并且与其他因子的相关性非常低。该因子是基于公司的财务附注数据构建的,由于数据来源不同,它与其他因子的相关性天然较低,并且数据更新频率为每年3至4次,因此它的换手率也非常低。总体来说,这个因子在我们因子体系中的边际增量作用非常显著。
接下来,我们进入第二部分,讨论如何将基本面研究的成果融入到我们已有的量化因子体系中。我们在公司内部搭建了一个数据库,该数据库记录了所有行业研究员反馈研究成果的动作,包括模拟组合的调整、晨会的点评、内部工作群的点评、周报、月报、季报、调研报告、深度报告等所有我们能够收集到的研究员反馈研究成果的渠道。例如,当研究员调整模拟组合时,我们会在数据库中留下一条记录;当研究员在晨会点评某支股票时,我们同样也会记录下来。对于这些动作,我们会根据其类型和重要性赋予不同的分值,例如模拟组合的调整幅度、研究员晨会的推荐强度等。对同一只股票在过去一个月内,涉及不同维度的得分汇总,并进行时间加权处理,赋予较近的观点更高的权重,我们能够得到一个结构化后的内部研究员因子。我们公司大约有20多位行业研究员,每位研究员同时跟踪30只左右的股票,因此整个因子化的范围大约能同时覆盖600只股票。
我们将结构化后的内部研究员因子与量化因子进行合成。在合成过程中,我们并没有采用简单的等权合成,而是采用了非线性的合成方式。这主要是因为,内部研究因子的覆盖度相对较低,直接等权合成容易丢失有效信息。如果感兴趣的话,大家可以尝试用一些简单的非线性激活函数,来测试合成后的效果。需要注意的是,量化因子和内部研究因子的值每天都会更新,量化因子每天随着行情数据、财务数据和一致预期数据的变化而变化,内部研究员因子也会实时的根据研究员的组合调整、推荐股票或观点更新而变化。因此,最终我们会在每日更新这两套因子的基础上,形成当天最终的收益预测。通过实际验证,合成后的效果也相当不错。以下展示了在5%跟踪误差下,我们用这两套因子分别构建的相对于沪深300指数的超额收益。
蓝色曲线代表我们使用纯量化线性模型时的超额收益,大约年化超额8%。红色曲线则是在该线性模型基础上,结合了内部研究因子的非线性叠加后所得到的超额收益,年化超额提升约3%至11%。更为重要的是,经过这种合成,不仅超额收益得到提升,同时超额收益的波动率和回撤也有所降低,减少了大约1%的超额波动和回撤。这表明我们在量化线性模型中成功引入了一个高质量差异化的阿尔法来源。虽然我们的线性模型一直在持续更新和迭代,但当框架已经趋于完善时,再进行改进会变得非常困难,而内部研究员因子为我们提供了一个高质量的差异化的阿尔法来源。尤其在一些量化模型集体遭遇回撤时,这样的差异化的阿尔法尤为珍贵,例如在2021年9月的那一轮回撤中,我们的量化模型也未能幸免,超额收益回撤幅度约为5%,然而当加入内部研究因子后,这一回撤幅度显著降低。此外,在今年年初的市场剧烈波动中,叠加了内部研究员因子后,回撤控制也更加平稳,这一次和质量因子在这段时间的抗跌有关,内部研究员因子天然偏向更高质量的股票,正好帮助我们在量化因子回撤较大时,平滑了整个组合的表现。
为了能在事前保证内部研究员因子的有效性和竞争优势,我们认为,核心在于公司层面自上而下的推动。没有公司层面自上而下的支持,量化投研团队和基本面投研团队之间的壁垒难以打破,研究部的研究成果难以准确高效地转化成量化可使用的因子。此外,公司自身的研究风格和特点也是成功的关键,中庚采用的是高周转、高覆盖的研究模式,研究员能同时覆盖约600只股票,这与一些专注于少数核心股票池的研究方法有所不同。尽管中庚的研究员数量不算最多,但我们通过更加广泛的覆盖和更加快速的周转,能确保因子的全面性和及时性,这与量化因子的特点高度契合。因此,我们相信,在这种制度和流程的保障下,我们可以在事前保障内部研究员因子的质量,并将其准确、高效地转化为量化信号,持续优化我们的策略表现。
接下来,介绍一下我们运用这套框架在实盘运行的几个产品的表现。首先来看一下我们历史上实盘时间最长的一个产品,这个产品自2019年2月底始运行,至今已实现约60%的绝对收益,年化收益率大约9%,同时将最大回撤和波动率控制在6%的水平上。产品的结构非常清晰:30%的资金投资于500指增,其余50%的资金用于构建纯中性对冲策略,构建指增+对冲的组合。通过这种设计,产品有效的实现了“进可攻退可守”的效果。具体来说,在牛市阶段,权益敞口为产品提供了良好的收益弹性,而在熊市阶段,由于对冲策略的保护,产品帮助客户避免了亏损。因此,尽管市场经历了多次波动,产品始终保持了年度正收益的目标。在2019年至2021年的牛市和结构性牛市中,产品实现了超过10%的收益,在2022年的熊市中,也获得了2%的收益,在2023年和2024年的震荡行情中,每年也能获得5%的收益,并且净值在持续创出新高,创新高的最长时间不超过9个月。这意味着,通过这样的策略,客户不仅能获得类似权益资产的收益,而且其波动和回撤也能有效控制在权益资产的四分之一左右,类似二级债基的水平,是非常好的绝对收益类产品。
第二个产品是一款更加纯粹的中性对冲产品,产品成立于2022年2月,成立以来实现了接近6%的年化收益,不仅在债券牛市中跑赢了全债指数,同时最大回撤也控制在了4%以内,成功的实现了绝对收益的目标。这款产品主要是针对高净值客户的,在今年这样一个中性对冲策略比较难做的年份,该产品也是经历了两次比较大的压力测试。第一次是在今年初市值因子大幅波动时,产品因为严格控制了在市值因子上的暴露,将最大回撤控制在了2%以内,并在3月份很快就完全修复了年初的回撤;第二次是在9月底基差的快速上升中,产品将最大回撤控制在了3.7%以内,并很快在10月份再次完全修复了这轮回撤。第二次压力测试主要是因为我们在9月底观察到基差快速上升,因此提前将对冲仓位降至50%左右,同时在10月8号基差升水达到最高时,迅速将对冲仓位加回至80%,在基差的快速回落的过程中充分获利。在今年这样一个比较复杂的环境下,年初至今依然实现了5%的绝对收益。
最后,我们还有一款灵活配置型的产品,该产品成立于2023年6月,至今净值已超过1.3。这款产品类似于灵活配置型基金,具有较高的自由度,能够根据市场情况灵活调整敞口,在同期灵活配置型产品中的排名也非常靠前。在这款产品中,我们大量运用了深度学习的策略,不刻意控制波动和回撤,追求最大的弹性。以上就是我今天的汇报,欢迎大家和我们团队的同事做进一步的深入交流,谢谢。
(全文结束)
(纪要整理:张广年)
风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。
做「开源」的量化研究
tobeaquant,tobeopen-minded.
更多交流,欢迎联系:
开源证券金融工程团队|魏建榕张翔傅开波高鹏苏俊豪胡亮勇王志豪 盛少成苏良何申昊陈威蒋韬