本书首先介绍了将大数据集应用于机器学习的基础知识和因子投资的基本理论;之后,本书介绍了监督学习模式下可用于预测金融变量的几个基本机器学习算法,包括惩罚性线性回归、支持向量机等;接下来,本书介绍了将这些机器学习算法应用于金融领域的实战方法和细节;最后,本书讨论了一系列与机器学习和因子投资相关的进阶话题,包括模型的黑箱问题、因果关系问题和无监督学习算法等。
本书适合金融机构从业者以及金融类专业学生系统了解因子投资的理论与方法,以及机器学习算法在因子投资领域的应用。
第1章符号与数据
1.1符号
1.2数据集
第2章简介
2.1背景
2.2投资组合构建流程
2.3机器学习不是“魔杖”
第3章因子投资与资产定价异象
3.1简介
3.2异象检验
3.3因子还是特征
3.4热门话题:动量、择时和ESG
3.5与机器学习的联系
3.6代码练习
第4章数据预处理
4.1认识你的数据
4.2缺失值
4.3异常值检测
4.4特征工程
4.5打标签
4.6处理持续性问题
4.7扩展
4.8代码和结果
4.9代码练习
第5章惩罚性线性回归和稀疏对冲最小方差组合
5.1惩罚性线性回归
5.2稀疏对冲最小方差组合
5.3预测性回归
5.4代码练习
第6章树模型
6.1简单决策树
6.2随机森林
6.3提升树:Adaboost
6.4提升树:特别梯度提升(extremegradientboosting)算法
6.5讨论
6.6代码练习
第7章神经网络
7.1原始感知机
7.2多层感知机
7.3其他实际问题
7.4关于基础多层感知机的代码示例和注释
7.5循环神经网络
7.6其他常用架构
7.7代码练习
第8章支持向量机
8.1用SVM进行分类
8.2用SVM进行回归
8.3实践
8.4代码练习
第9章贝叶斯方法
9.1 贝叶斯框架
9.2贝叶斯采样
9.3贝叶斯线性回归
9.4 朴素贝叶斯分类器
9.5贝叶斯加性回归树
第10章验证和调参
10.1学习参数
10.2验证
10.3寻找好的参数
10.4关于验证的简短讨论
第11章集成模型
11.1线性集成
11.2堆叠集成
11.3扩展
11.4代码练习
第12章投资组合回测
12.1基本设定
12.2将信号转化为投资组合的权重
12.3绩效评估
12.4常见错误和问题
12.5非平稳性:预测是困难的
12.6第一个例子:一个完整的回测
12.7第二个例子:过拟合
12.8代码练习
第13章可解释性
13.1全局模型
13.2局部模型
第14章两个关键概念:因果关系和非平稳性
14.1因果关系
14.2处理不断变化的环境
第15章无监督学习
15.1预测变量的相关性问题
15.2主成分分析和自编码器
15.3k-means聚类
15.4最近邻方法
15.5代码练习
第16章强化学习
16.1理论布局
16.2维度灾难
16.3策略梯度
16.4简单案例
16.5结束语
16.6练习
附录1变量说明
附录2练习答案
附录3Python代码(扫书中二维码获取)
参考文献(扫书中二维码获取)
[法]纪尧姆·科克雷(Guillaume Coqueret)
法国里昂商学院的金融和数据科学副教授,主要研究方向是机器学习工具在金融经济学中的应用。
[法]托尼·吉达(Tony Guida)
法国RAM Active Investments公司执行董事,machineByte智库主席,著有Big Data and Machine Learning in Quantitative Investment一书。
译者简介
周亮
金融工程博士,毕业于清华大学,在国内外金融学核心期刊上发表学术论文80余篇。现任湖南财政经济学院讲师,在多家私募证券基金担任顾问。
周凡程
理学硕士,毕业于国防科技大学,在机器学习和量化投资领域有着丰富的理论研究和实践经验,目前主要从事投资组合管理的研发工作。