量化交易学习笔记

学习网站:

量化投资

所谓量化投资,简单地说就是利用数学、统计学、信息技术的量化投资方法来管理投资组合。量化投资的优势在于纪律性、系统性、及时性、准确性和分散化。

  • 利用计算机强大的计算能力
  • 以数学模型为思维,以历史数据为基础,以数学模型建模,统计学分析,编程设计为工具
  • 制定大概率获利的交易策略

量化投资的原理:

  • 将每次赚钱概率提高到50%以上。也许从每次投资来看,成功的概率略微超过50%并不是很出彩,但是很多次加起来,投资所靠的“运气”就可能被变成风险有限的高额投资回报。
  • 如果每次交易赔钱的概率超过50%,但是每次赔的数量都很小,相对而言如果每次赚钱的概率虽然小于50%,但是赚的数目都很大的话,成功的概率也有可能超过50%。经过多次交易之后,只要盈利交易多于亏损交易,总体交易结果就是盈利的。

与传统投资相比,优势有:

  • 历史规律中发现概率优势作为投资基础
  • 计算机运算能力保证分析广度
  • 克服来自人性中的弱点

现代资产定价理论:

资本资产定价模型,资产的期望收益率由两部分构成:

套利定价模型

量化策略

在证券交易中,策略是指当预先设定的事件或信号发生时,就采取相应的交易动作。通常来讲,一般所谓的量化策略是指整个交易过程完全实现为计算机程序,从数据接收、处理到交易执行都是由计算机程序自动完成。

策略的生命周期:一个策略往往会经历产生想法、实现策略、检验策略、运行策略、策略失效几个阶段。

  • 产生想法:任何人任何时间都可能产生一个策略想法,可以根据自己的投资经验,也可以根据他人的成功经验。
  • 实现策略:产生想法到实现策略是最大的跨越。获取数据并清洗,处理手段有:处理缺失值,处理极值,标准化,中性化,正交化等手段。
  • 检验策略:策略实现之后,需要通过历史数据的回测模拟交易的检验,这也是实盘前的关键环节,筛选优质的策略,淘汰劣质的策略。
  • 实盘交易:投入资金,通过市场检验策略的有效性,承担风险,赚取收益。
  • 策略失效:市场是千变万化的,需要实时监控策略的有效性,一旦策略失效,需要及时停止策略或进一步优化策略。

实现过程

量化策略的类型

  1. 多因子模型
  2. ALPHA策略
  3. 指数增强策略 可以理解为,小部分资金购买成分股内跑输指数的股票 + 大部分资金购买成分股内跑赢指数的股票 => 指数增强收益构成

量化选股因子

哪些因子可能成为选择股票的依据?这主要依赖于金融经济逻辑和市场经验。总的来说,因子的来源有三方面:

  • 公司层面因子 来自于公司的微观结构,与公司的生产经营息息相关,一般来自公司的财务指标,反映了公司的盈利、运营、债务和成长状况。这些因子主要有:

    • 价值类因子,如PE、PB
    • 成长类因子,如ROE、净利润增长率
    • 规模类因子,如净利润、营业收入
    • 情绪类因子,如预测未来12个月的利润增长率
    • 质量类因子,如资产负债率、应收账款周转率
  • 外部环境因子 政治法律、宏观经济、社会习俗和技术发展等外部环境对一个行业和企业来说都是非常重要的。比较重要并且容易量化的外部环境因子主要是:

    • 宏观环境因子,如经济增长率、利率等
    • 行业环境,如行业集中度等。
  • 市场表现因子 主要体现的是股票在交易过程中的价格和交易量。这些因子主要有动量和反转类因子、资金流向和各种技术类指标等。

量化择时

择时交易就是利用某种方法来判断大势的走势情况,是上涨还是下跌或者是盘整。

在实际的操盘中,我们利用择时更主要的目的是为了控制最大回撤,而不是期望利用择时获得最大化的收益。

  • 因此大盘整体处在相对历史地位或安全点位,我们可以考虑不择时,充分利于资金的有效率,从而去追求收益的最大化;
  • 当大盘已经处在相对高点或者已经超出个人主观判断的顶部位置,就应该尽量采用择时交易,通过择时,仓位的控制来避免资金受到市场突如其来的大波动冲击。

择时具体的说当然有很多方法,分别有趋势择时、有效资金模型、牛熊线等8种择时方法,但不管哪种择时,总结为四句话:“强者恒强,过强转弱;弱者恒弱,过弱转强”,其起源来自于中国古代的朴素哲学思想:“水满则溢,月圆则亏”。

趋势择时是投资者运用最多,也是最容易在市场中获利,并限制损失的择时方法。最常见的趋势性择时指标是MA、MACD、DMA、TRIX、PE/PB。

  • 双均线(MA)指天数不同的移动平均线。如图,蓝色的是5天均线,紫色的是10天均线。

  • DMA(平均线差指标)是股市分析技术中的一种中短期指标。

    • DMA=MA1-MA2 (MA1为短期(S日)的移动均线; MA2为长期(L日)移动均线
    • AMA =DMA/M 为DMA的M日移动平均线
    • DMA向上交叉其平均线AMA时,买进;DMA向下交叉其平均线AMA时,卖出;DMA与股价(指数)产生背离时的交叉信号,可信度较高。

  • TRIX (三重指数平滑移动平均指标)根据移动平均线理论,对一条平均线进行三次平滑处理,再根据这条移动平均线的变动情况来预测股价的长期趋势。

    • TRIX由下向上交叉其MATRIX时,买入;
    • TRIX由上向下交叉其MATRIX时,卖出;
  • PE (市盈率) 指在一个考察期(通常为12个月的时间)内,股票的价格和每股收益的比例。通常用于评估股价水平是否合理的指标之一,PE高的时候卖出,PE低的时候买入。

量化评估

  • 年化收益率:年化收益率是把当前收益率(日收益率、周收益率、月收益率)换算成年收益率来计算的,是一种理论收益率,并不是真正的已取得的收益率。
  • 最大回撤率:在选定周期内任一历史时点往后推,产品净值走到最低点时的收益率回撤幅度的最大值。可用来描述买入产品后可能出现的最糟糕的情况,最大回撤是越低越好。

  • 贝塔比率(Beta) 相当于业绩评价基准收益的总体波动性,例如衡量策略的系统性风险:

    • Beta为1,策略和市场(参照沪深300指数)同进退
    • Beta为1.1,市场上涨10%时,策略上涨11%;市场下滑10%时,策略下滑11%
    • Beta为0.9,市场上涨10%时,策略上涨9%;市场下滑10%时,策略下滑9%。
    • 如果是牛市,股市兴兴向荣,个股、大盘狂涨,那就要选择Beta值大的策略;
    • 如果是熊市,经济下行压力大,就应该选择Beta值小的策略,这样就可以比较好的控制风险,确保资金的安全。
  • 阿尔法比率(Alpha) 实际收益和按照Beta系数计算的期望收益之间的差额。代表策略多大程度上跑赢了预期的收益率

  • 夏普比率 代表投资人每多承担一分风险,可以拿到几分报酬;该比率越高,策略承担单位风险得到的超额回报率越高。

单因子模型、多因子合成与多因子策略实现

单因子测试

分组回测: 回测方法:分位数

  1. 对股票按因子大小排序,将股票池均分为N个组合,或者对每个行业内进行均分。
  2. 个股权重一般选择等权,行业间权重一般与基准(例如沪深300)的行业配比相同,此时的组合为行业中性。
  3. 通过分组累积收益图,就可以简单的知道因子是否和收益率有单调递增或递减的关系。

回测方法:多空组合

  1. 按照因子大小对股票排序,将股票池均分为N个组合。
  2. 同时做多/做空因子值的最大/最小组,看多空组合累积收益图是否有明显稳定的线性趋势。

回测方法:回归法

  1. 将第T期的因子暴露度向量与T+1期的股票收益向量进行线性回归,所得到的回归系数即为因子在第T期的因子收益率,同时还能得到该因子收益率在本期回归中的显著度水平t值。一般t值绝对值要大于2时因子比较有效。
  2. 在某截面期上的个股的因子暴露度(Factor Exposure)即指当前时刻个股在该因子上的因子值。

公式:

IC信息系数评价

概念:

  1. 信息系数(Information Coefficient, 简称IC),表示所选股票的因子值与股票下期收益率的截面相关系数,通过IC值可以判断因子值对下期收益率的预测能力。
  2. IC值能够很好地反映因子的预测能力,IC越高,就表明该因子在该起对股票收益的预测能力越强。

标准:

  1. 通常IC大于3%或者小于-3%,则认为因子比较有效。
  2. 常见的IC有两种,一是Normal IC(类比皮尔森相关系数概率),另一个是Rank IC(类比斯皮尔曼相关系数)。

IC衰退

概念:

  1. 因子有效性是具有失效性的,IC作为度量因子有效性的主要指标,其稳定性值得关注。
  2. 因子IC衰退,使用过观察随着滞后时间的延长,因子有效性降低的速度。
  3. 研究发现,很多因子具有相对稳定的半衰期,即因子有效性降低为一半所需要的时间,因而可以通过观察半衰期的长短判断该因子的稳定情况。

计算方法:

  1. 计算每期的因子暴露值和滞后i期的收益率间的IC值,其中i = 1,2,3…,12
  2. 分别对因子每隔i期的信息系数计算均值

IR信息比率

概念:IR信息比率是IC的均值除以标准差,也就是IC值在回测时间段的信息比率。可以评估因子的Alpha超额收益获取能力,并且是更稳定的获取能力。 IR信息比率 = IC(mean)/IC(std)

应用:鉴于IC的重要性,在多因子的因子加权中常采用因子最近N个月(默认为12)的IC均值加权,通常结果会优于等权法。

多因子合成与多因子策略实现

合成逻辑:

等权构建:

IC均值加权:

IC_IR加权:

comments powered by Disqus