科技>计算机>数据库
量化投资:数据挖掘技术与实践(MATLAB版)(含CD光盘1张)

量化投资:数据挖掘技术与实践(MATLAB版)(含CD光盘1张)"

作者:卓金武周英
ISBN:9787121259265
定价:¥88.0
字数:685千字
页数:420
出版时间:2015-05
开本:16(185*235)
版次:01-01
装帧:
出版社:电子工业出版社
简介

内 容 简 介 全书内容分为三篇。第一篇(基础篇)主要介绍数据挖掘与量化投资的关系,以及数据挖掘的概念、实现过程、主要内容、主要工具等内容。第二篇(技术篇)系统介绍了数据挖掘的相关技术及这些技术在量化投资中的应用,主要包括数据的准备、数据的探索、关联规则方法、数据回规方法、分类方法、聚类方法、预测方法、诊断方法、时间序列方法、智能优化方法等内容。第三篇(实践篇)主要介绍数据挖掘技术在量化投资中的综合应用实例,包括统计套利策略的挖掘与优化、配对交易策略的挖掘与实现、数据挖掘在股票程序化交易中的综合应用,以及基于数据挖掘技术的量化交易系统的构建。

前言

前 言 量化投资交易策略的业绩稳定,市场规模和份额不断扩大,得到越来越多投资者的认可。中国金融业飞速发展,尤其是2010年股指期货的推出,使得量化投资和对冲基金逐步进入国内投资者的视野。2012年丁鹏博士所著的《量化投资——策略与技术》出版后,更是推动了量化投资技术在国内的普及。目前,量化投资、对冲基金已经成为中国资本市场最热门的话题之一,各投资机构纷纷开始着手打造各自的量化投资精英团队。 量化投资是将投资理念及策略通过具体指标、参数的设计,融入到具体的模型中,用模型对市场进行不带任何情绪的跟踪,简单而言,就是用数量化的方法对股票、期货等投资对象进行估值,选取适合的对象进行投资。目前,量化投资的书籍主要集中在模型和策略及工具的使用上,但关于如何产生这些量化模型、量化策略的书籍的确非常少。金融市场瞬息万变,为了更好地进行量化投资,我们要不断去验证既有模型的有效性,同时要想在金融行业保持自己的竞争力,又必须不断开发新的模型,而验证模型、开发模型,所谓量化投资的主要内容,都需要数据的支撑。另一方面,金融领域是数据资源保存最好、最为丰富的行业,在金融领域已经积累了大量的数据,同时每天还在产生大量的交易数据、价格数据等数据信息。这些数据资源正好为量化投资提供了很好的数据基础,那么问题的关键就是如何利用金融业丰富的数据资源更好地进行量化投资。 数据挖掘技术是从数据中挖掘有用知识的一门系统性的技术,刚好解决了数据利用的问题,所以数据挖掘与量化投资便很自然地结合在一起。但数据挖掘在国内也是一个新领域,所以还没有关于量化投资与数据挖掘相结合的相关书籍。另外,目前关于数据挖掘的几本书基本都是译著,由于语言和文化的差异,国内读者读起来相对吃力。在这样的背景下,能有一本书介绍如何利用数据挖掘技术进行量化投资还是很好的。 巧合的是,笔者在MathWorks平时的工作职责之一是支持金融客户,相当比例是关于量化投资的,二是支持其他商业客户的数据挖掘,所以对这两个领域都有一定的了解。在一次研讨会上,丁鹏博士与笔者讨论了数据挖掘在量化投资中应用的话题,感觉这是个非常好的课题,建议笔者写一本这样的书。笔者对这个课题也非常感兴趣,于是就有了这本书的开始。 虽然笔者之前写过一本《MATLAB在数学建模中的应用》(在MATLAB相关书籍中也算是有影响力的书,2013年当当网自然科学类图书中销量排名Top20),具有一些写作经验。但写这本书确实还是相当费劲。因为金融从业者大多比较务实,所以本书的一个写作原则就是内容一定要务实。数据挖掘中涉及很多方法,这些方法的理论往往比较难,对于金融从业者来说,这些方法的思想和应用最重要,理论不是关注的重点。所以对于本书中介绍的每个方法,尽量介绍清楚方法的思想、实现步骤,并以案例形式提供方法实现的MATLAB程序,这样读者就可以直接借鉴书中的程序,很快将书中的技术转化为自己的实际操作工具。但笔者查阅了大量的参数书和网络资料,发现数据挖掘中的这些方法,很少有这样的程序,所以笔者花费了大量的时间和精力去编写这些方法的程序。这样做也特别符合当代人的学习习惯,现在社会信息实在是太丰富了,对读者来说,一本好书应该能让大家快速掌握这本书的精华。为了早点写好本书,在写书期间,笔者将几乎全部工作和生活之余的时间全部投入到写书中去,每个晚上,每个周末,每次带孩子去练习跆拳道的时候都在写书。虽然看似很辛苦,但确实很有成就感,是这份成就感给了我执着的动力和快乐,最终完成了此书。总之,写书的过程是“痛并快乐着”! 本书内容 全书内容分为三篇。 第一篇(基础篇)主要介绍一些基本概念和知识,包括数据挖掘与量化投资的关系,数据挖掘的概念、实现过程、主要内容、主要工具等内容。 第二篇(技术篇)是本书的主体,系统介绍了数据挖掘的相关技术及这些技术在量化投资中的应用实例。这部分又分为如下三个层次: (1)数据挖掘前期的一些技术,包括数据的准备(收集数据、数据质量分析、数据预处理等)和数据的探索(衍生变量、数据可视化、样本选择、数据降维等)。 (2)数据挖掘的核心六大类方法,包括关联规则、回归、分类、聚类、预测和诊断。对于每类方法,则详细介绍了其包含的典型算法,包括基本思想、应用场景、算法步骤、MATLAB实现程序、应用案例。同时,对每类方法还介绍了一个在量化投资中的应用案例,以强化这些方法在量化投资中的实用性。 (3)数据挖掘中特殊的实用技术,包含两章内容,一是关于时序数据挖掘的时间序列技术,二是关于优化的智能优化方法。这个层次也是数据技术体系中不可或缺的技术。时序数据是数据挖掘中的一类特殊数据,并且金融数据往往都具有时序性,所以针对该类特殊的数据类型,又介绍了时间序列方法。另外,数据挖掘离不开优化,量化投资也离不开优化,所以又以一章智能优化方法介绍两个比较常用的优化方法,遗传算法和模拟退火算法。 第三篇(实践篇)主要介绍数据挖掘技术在量化投资中的综合应用实例,包括统计套利策略的挖掘、配对交易策略的挖掘、基于数据挖掘技术的股票程序化交易,最后一章——基于数据挖掘技术的量化交易系统,则给出了集成主流数据挖掘技术的量化投资系统的框架,读者可以利用该框架,依据书中介绍的数据挖掘技术,结合自己的情况,开发出属于自己的量化交易系统,从而轻松实现从理论到实践这一跨越,更好地利用数据挖掘技术在量化投资的领域乘风破浪,不断创造佳绩。 本书特色 综观全书,可发现本书的特点鲜明,主要表现在: (1)方法务实,学以致用。本书介绍的方法都是数据挖掘中的主流方法,都经过实践的检验,具有较强的实践性。对于每种方法,本书基本都给出了完整、详细的源代码,这对于读者来说,具有非常大的参考价值,很多程序可供读者直接套用并加以学习,并可以直接转化为自己的量化投资实战工具。 (2)知识系统,易于理解。本书的知识体系应该是当前数据挖掘书籍中最全、最完善的,不仅包含详细的数据挖掘流程、数据准备方法、数据探索方法,还包含六大类数据挖掘主体方法、时序数据挖掘方法、智能优化方法。正因为有完整的知识体系,读者读起来才有很好的完整感,从而更利于理解数据挖掘的知识体系,这对于学习是非常有帮助的。 (3)结构合理,易于学习。在讲解方法时,由浅入深,循序渐进,让初学者知道入门的切入点,让专业人员又有值得借鉴的“干货”。基础篇、技术篇和实践篇的结构部署也让本书独树一帜,让读者在学习数据挖掘和量化投资的过程中有一个循序渐进的过程,使读者在短时间内成为一位数据挖掘高手,同时成为一位量化投资高手。 (4)案例实用,易于借鉴。绝大多数实例都是量化投资领域的实例,所以综观全书,本书都在有意引导读者思考如何让数据挖掘在量化投资中产生更实际的价值。 (5)主线明晰,脉络分明。本书涉及知识面宽广,以数据挖掘和量化投资为中心,辐射银行、债券、营销、零售等领域和学科。为了与书稿主线保持一致,这些所涵盖的领域虽然只是略微带过,但是从侧面折射出数据挖掘技术真的广泛服务于社会各个领域。在现代社会,某学科单打独斗的时代已经过去了,本书在无形之中已经树立了一个意识:各学科的知识之间是相通的,运用知识的最高境界是各学科知识的大融合。 (6)理论与实践相得益彰。对于本书的每个方法,除理论的讲解,都配有一个典型的应用案例,读者可以通过案例加深对理论的理解,同时理论也让案例的应用更有信服力。技术的介绍都是以实现实例为目地,同时提供大量技术实现的源程序,方便读者学习,注重实践和应用,秉承笔者务实、切近读者的写作风格。 (7)内容独特,趣味横生。很多方法和内容是同类书籍所没有的,这无疑增强了本书的新颖性和趣味性。 (8)文字简介、明了,易于阅读。在本书编写过程中,在保证描述精准的前提下,摒弃那些刻板、索然无味的文字,让文字充满活力,更易于阅读。 读者对象 从事投资工作的专业人士,包括证券、基金、私募、信托、银行、保险等领域的从业者。 从事数据挖掘、数据分析、数据管理工作的专业人士。 金融、经济、管理、统计等专业的教师和学生。 从事量化投资或数据挖掘方向研究的科研工作者。 希望学习MATLAB的工程师或科研工作者。因为本书的代码都是用MATLAB编写的,所以对于希望学习MATLAB的读者来说,也是一本很好的参考书。 致专业人士 对于从事量化投资的专业人士来说,书中的数据挖掘技术是值得借鉴的技术,至少会有助于挖掘或启发策略。书中的实例都具有一定的实战背景,含有一些从数据挖掘层面的策略,大家可以尝试将这些技术和策略融入自己的思想和策略中,以让自己的策略更强大。另外,对于书中介绍的各方法的理论,如果您有很好的数学或计算机背景,且有时间或感兴趣,可以认真看,否则,理论部分可以直接跳过。但是每种方法的思想,应用场景一定要领悟,这样当遇到合适的场景后,就可以马上想到用哪种方法,然后直接借鉴书中的代码就可以轻松将这些方法应用到自己的量化投资实践中。 对于从事数据挖掘的专业人士来说,大家可以关注整个数据挖掘知识体系和数据挖掘的流程,因为本书的数据挖掘知识体系应该是当前数据挖掘数据中体系最全、最完善的。另外,数据挖掘流程也介绍得很详细,具有很强的操作性。此外,书中的算法案例和综合应用案例,也算是本书的特色,值得借鉴。 致教师 本书系统地介绍了数据挖掘设计的理论、方法和案例,可以作为金融、经济、管理、统计等学科的本科专业教材或研究生教材。相比一般的数据挖掘教材,量化投资更容易激发学生的学习兴趣,兴趣是最好的老师,这对开展教学是非常有利的。 书中的内容虽然系统,但也相对独立,教师可以根据课程的学时安排和专业方向的侧重,选择合适的内容进行课堂教学,其他内容则可以作为参考章节。授课部分,一般会包含第一篇的两章和第二篇的前8章,总共10章内容,而如果课时较多,则可以增加其他章节,包括后面商业案例的学习。 在进行课程备课的过程中,如果您需要书中的一些电子资料作为课件或授课支撑材料,可以直接给笔者发邮件(70263215@qq.com)说明您需要的材料和用途,笔者会根据具体情况,为您提供力所能及的帮助。 致学生 作为21世纪的大学生,无论是什么专业背景,都有必要学习数据挖掘和量化投资,原因有二: 一是21世纪的信息非常丰富,很多都以数据形式存在,学习并掌握数据挖掘技术,有助于我们从更深层次了解这个社会,也更有助于我们每人从事的工作。 二是无论从事什么工作,具有一定的投资意识和投资能力都是一个近乎必备的技能。21世纪是和平而充满竞争的时代,失业对每个人来说都有可能发生,当我们失业的时候怎么办?如果懂得投资,那么至少让自己生活得很好是没有问题的。特别喜欢一句话“喜欢做一名宽客,是因为可以自己掌握命运”,这里的宽客就是指从事量化投资的人士。 所以,读者无论现在学习什么专业,都应好好读一下这本书或同类的书籍。相信读者一定会因为曾学习过数据挖掘和量化投资而备感欣慰! 致谢 本书的编写出版得到了中国量化投资学会、电子工业出版社等单位的帮助,在此对这些单位表示感谢。特别感谢丁鹏博士在百忙之中指导本书的编写并为本书写序!在本书的编写过程中,中科院金属所的王恺博士,MathWorks的敖国强博士、陈小挺博士,上海交通大学的李牧芳等好友和同事对本书书稿进行了校对并给出修改建议,电子工业出版社的李冰老师全程指导本书的编写,在此向他们表示感谢! 由于时间仓促,加之作者水平有限,所以疏漏之处在所难免。在此,诚恳地期待得到广大读者的批评指正。 卓金武 2015年3月 上海

目录

目 录 第一篇 基础篇 第1章 绪论 2 1.1 量化投资与数据挖掘的关系 2 1.1.1 什么是量化投资 2 1.1.2 量化投资的特点 3 1.1.3 量化投资的核心——量化模型 5 1.1.4 量化模型的主要产生方法——数据挖掘 7 1.2 数据挖掘的概念和原理 8 1.2.1 什么是数据挖掘 8 1.2.2 数据挖掘的原理 10 1.3 数据挖掘在量化投资中的应用 11 1.3.1 宏观经济分析 11 1.3.2 估价 13 1.3.3 量化选股 14 1.3.4 量化择时 14 1.3.5 算法交易 15 1.4 本章小结 16 参考文献 16 第2章 数据挖掘的内容、过程及工具 17 2.1 数据挖掘的内容 17 2.1.1 关联 17 2.1.2 回归 19 2.1.3 分类 20 2.1.4 聚类 21 2.1.5 预测 22 2.1.6 诊断 24 2.2 数据挖据过程 25 2.2.1 数据挖掘过程概述 25 2.2.2 挖掘目标的定义 26 2.2.3 数据的准备 26 2.2.4 数据的探索 28 2.2.5 模型的建立 30 2.2.6 模型的评估 34 2.2.7 模型的部署 35 2.3 数据挖掘工具 36 2.3.1 MATLAB 36 2.3.2 SAS 37 2.3.3 SPSS 38 2.3.4 WEKA 40 2.3.5 R 41 2.3.6 工具的比较与选择 42 2.4 本章小结 43 参考文献 44 第二篇 技术篇 第3章 数据的准备 47 3.1 数据的收集 47 3.1.1 认识数据 47 3.1.2 数据挖掘的数据源 49 3.1.3 数据抽样 50 3.1.4 量化投资的数据源 51 3.1.5 从雅虎获取交易数据 53 3.1.6 从大智慧获取财务数据 56 3.1.7 从Wind获取高质量数据 57 3.2 数据质量分析 59 3.2.1 数据质量分析的必要性 59 3.2.2 数据质量分析的目的 60 3.2.3 数据质量分析的内容 60 3.2.4 数据质量分析的方法 61 3.2.5 数据质量分析的结果及应用 66 3.3 数据预处理 67 3.3.1 为什么需要数据预处理 67 3.3.2 数据预处理的主要任务 68 3.3.3 数据清洗 69 3.3.4 数据集成 73 3.3.5 数据归约 74 3.3.6 数据变换 74 3.4 本章小结 77 参考文献 77 第4章 数据的探索 78 4.1 衍生变量 79 4.1.1 衍生变量的定义 79 4.1.2 变量衍生的原则和方法 80 4.1.3 常用的股票衍生变量 80 4.1.4 评价型衍生变量 85 4.1.5 衍生变量数据收集与集成 87 4.2 数据的统计 88 4.2.1 基本描述性统计 89 4.2.2 分布描述性统计 90 4.3 数据可视化 90 4.3.1 基本可视化方法 91 4.3.2 数据分布形状可视化 92 4.3.3 数据关联情况可视化 94 4.3.4 数据分组可视化 95 4.4 样本选择 97 4.4.1 样本选择的方法 97 4.4.2 样本选择应用实例 98 4.5 数据降维 100 4.5.1 主成分分析(PCA)基本原理 100 4.5.2 PCA应用案例:企业综合实力排序 103 4.5.3 相关系数降维 106 4.6 本章小结 107 参考文献 108 第5章 关联规则方法 109 5.1 关联规则概要 109 5.1.1 关联规则提出背景 109 5.1.2 关联规则的基本概念 110 5.1.3 关联规则的分类 112 5.1.4 关联规则挖掘常用算法 113 5.2 Apriori算法 113 5.2.1 Apriori算法的基本思想 113 5.2.2 Apriori算法的步骤 114 5.2.3 Apriori算法的实例 114 5.2.4 Apriori算法的程序实现 117 5.2.5 Apriori算法的优缺点 120 5.3 FP-Growth算法 121 5.3.1 FP-Growth算法步骤 121 5.3.2 FP-Growth算法实例 122 5.3.3 FP-Growth算法的优缺点 124 5.4 应用实例:行业关联选股法 124 5.5 本章小结 126 参考文献 127 第6章 数据回归方法 128 6.1 一元回归 129 6.1.1 一元线性回归 129 6.1.2 一元非线性回归 133 6.1.3 一元多项式回归 138 6.2 多元回归 138 6.2.1 多元线性回归 138 6.2.2 多元多项式回归 142 6.3 逐步归回 145 6.3.1 逐步回归的基本思想 145 6.3.2 逐步回归步骤 146 6.3.3 逐步回归的MATLAB方法 147 6.4 Logistic回归 149 6.4.1 Logistic模型 149 6.4.2 Logistic回归实例 150 6.5 应用实例:多因子选股模型的实现 153 6.5.1 多因子模型的基本思想 153 6.5.2 多因子模型的实现 154 6.6 本章小结 157 参考文献 157 第7章 分类方法 158 7.1 分类方法概要 158 7.1.1 分类的概念 158 7.1.2 分类的原理 159 7.1.3 常用的分类方法 160 7.2 K-近邻(KNN) 161 7.2.1 K-近邻原理 161 7.2.2 K-近邻实例 163 7.2.3 K-近邻特点 166 7.3 贝叶斯分类 167 7.3.1 贝叶斯分类原理 167 7.3.2 朴素贝叶斯分类原理 167 7.3.3 朴素贝叶斯分类实例 170 7.3.4 朴素贝叶斯特点 170 7.4 神经网络 171 7.4.1 神经网络的原理 171 7.4.2 神经网络的实例 173 7.4.3 神经网络的特点 174 7.5 逻辑斯蒂(Logistic) 175 7.5.1 逻辑斯蒂的原理 175 7.5.2 逻辑斯蒂的实例 175 7.5.3 逻辑斯蒂的特点 175 7.6 判别分析 176 7.6.1 判别分析的原理 176 7.6.2 判别分析的实例 177 7.6.3 判别分析的特点 177 7.7 支持向量机(SVM) 178 7.7.1 SVM的基本思想 178 7.7.2 理论基础 179 7.7.3 支持向量机的实例 182 7.7.4 支持向量机的特点 182 7.8 决策树 183 7.8.1 决策树的基本概念 183 7.8.2 决策树的建构的步骤 184 7.8.3 决策树的实例 187 7.8.4 决策树的特点 188 7.9 分类的评判 188 7.9.1 正确率 188 7.9.2 ROC曲线 191 7.10 应用实例:分类选股法 193 7.10.1 案例背景 193 7.10.2 实现方法 194 7.11 延伸阅读:其他分类方法 197 7.12 本章小结 197 参考文献 198 第8章 聚类方法 199 8.1 聚类方法概要 200 8.1.1 聚类的概念 200 8.1.2 类的度量方法 201 8.1.3 聚类方法的应用场景 203 8.1.4 聚类方法的分类 204 8.2 K-means方法 205 8.2.1 K-means的原理和步骤 205 8.2.2 K-means实例1:自主编程 206 8.2.3 K-means实例2:集成函数 208 8.2.4 K-means的特点 212 8.3 层次聚类 212 8.3.1 层次聚类的原理和步骤 212 8.3.2 层次聚类的实例 214 8.3.3 层次聚类的特点 217 8.4 神经网络聚类 217 8.4.1 神经网络聚类的原理和步骤 217 8.4.2 神经网络聚类的实例 218 8.4.3 神经网络聚类的特点 219 8.5 模糊C-均值(FCM)方法 219 8.5.1 FCM的原理和步骤 219 8.5.2 FCM的应用实例 220 8.5.3 FCM算法的特点 221 8.6 高斯混合聚类方法 222 8.6.1 高斯混合聚类的原理和步骤 222 8.6.2 高斯聚类的实例 224 8.6.3 高斯聚类的特点 225 8.7 类别数的确定方法 225 8.7.1 类别的原理 225 8.7.2 类别的实例 227 8.8 应用实例:股票聚类分池 229 8.8.1 聚类目标和数据描述 229 8.8.2 实现过程 229 8.8.3 结果及分析 231 8.9 延伸阅读 233 8.9.1 目前聚类分析研究的主要内容 233 8.9.2 SOM智能聚类算法 234 8.10 本章小结 235 参考文献 235 第9章 预测方法 236 9.1 预测方法概要 236 9.1.1 预测的概念 236 9.1.2 预测的基本原理 237 9.1.3 量化投资中预测的主要内容 238 9.1.4 预测的准确度评价及影响因素 239 9.1.5 常用的预测方法 240 9.2 灰色预测 241 9.2.1 灰色预测原理 241 9.2.2 灰色预测的实例 243 9.3 马尔科夫预测 246 9.3.1 马尔科夫预测的原理 246 9.3.2 马尔科夫过程的特性 247 9.3.3 马尔科夫预测的实例 248 9.4 应用实例:大盘走势预测 252 9.4.1 数据的选取及模型的建立 252 9.4.2 预测过程 253 9.4.3 预测结果与分析 254 9.5 本章小结 255 参考文献 256 第10章 诊断方法 257 10.1 离群点诊断概要 257 10.1.1 离群点诊断的定义 257 10.1.2 离群点诊断的作用 258 10.1.3 离群点诊断方法分类 260 10.2 基于统计的离群点诊断 260 10.2.1 理论基础 260 10.2.2 应用实例 262 10.2.3 优点与缺点 264 10.3 基于距离的离群点诊断 264 10.3.1 理论基础 264 10.3.2 应用实例 265 10.3.3 优点与缺点 267 10.4 基于密度的离群点挖掘 267 10.4.1 理论基础 267 10.4.2 应用实例 268 10.4.3 优点与缺点 270 10.5 基于聚类的离群点挖掘 270 10.5.1 理论基础 270 10.5.2 应用实例 271 10.5.3 优点与缺点 273 10.6 应用实例:离群点诊断量化择时 273 10.7 延伸阅读:新兴的离群点挖掘方法 275 10.7.1 基于关联的离群点挖掘 275 10.7.2 基于粗糙集的离群点挖掘 276 10.7.3 基于人工神经网络的离群点挖掘 276 10.8 本章小结 277 参考文献 277 第11章 时间序列方法 279 11.1 时间序列的基本概念 279 11.1.1 时间序列的定义 279 11.1.2 时间序列的组成因素 280 11.1.3 时间序列的分类 281 11.1.4 时间序列分析方法 282 11.2 平稳时间序列分析方法 283 11.2.1 移动平均法 283 11.2.2 指数平滑法 284 11.3 季节指数预测法 285 11.3.1 季节性水平模型 285 11.3.2 季节性趋势模型 286 11.4 时间序列模型 286 11.4.1 ARMA模型 286 11.4.2 ARIMA模型 287 11.4.3 ARCH模型 288 11.4.4 GARCH模型 289 11.5 应用实例:基于时间序列的股票预测 289 11.6 本章小结 293 参考文献 293 第12章 智能优化方法 294 12.1 智能优化方法概要 295 12.1.1 智能优化方法的概念 295 12.1.2 在量化投资中的作用 295 12.1.3 常用的智能优化方法 295 12.2 遗传算法 297 12.2.1 遗传算法的原理 297 12.2.2 遗传算法的步骤 298 12.2.3 遗传算法实例 306 12.2.4 遗传算法的特点 307 12.3 模拟退火算法 309 12.3.1 模拟退火算法的原理 309 12.3.2 模拟退火算法步骤 310 12.3.3 模拟退火算法实例 313 12.3.4 模拟退火算法的特点 319 12.4 应用实例:组合投资优化 320 12.4.1 问题描述 320 12.4.2 求解过程 320 12.5 延伸阅读:其他智能方法 321 12.5.1 粒子群算法 321 12.5.2 蚁群算法 323 12.6 本章小结 325 参考文献 325 第三篇 实践篇 第13章 统计套利策略的挖掘与优化 327 13.1 统计套利策略概述 327 13.1.1 统计套利的定义 327 13.1.2 统计套利策略的基本思想 327 13.1.3 统计套利策略挖掘的方法 328 13.2 基本策略的挖掘 329 13.2.1 准备数据 329 13.2.2 探索交易策略 329 13.2.3 验证交易策略 330 13.2.4 选择最佳的参数 331 13.2.5 参数扫描法 334 13.2.6 考虑交易费 335 13.3 高频交易策略及优化 337 13.3.1 高频交易的基本思想 337 13.3.2 高频交易的实现 339 13.4 多交易信号策略的组合及优化 341 13.4.1 多交易信号策略 341 13.4.2 交易信号的组合优化机理 343 13.4.3 交易信号的组合优化实现 344 13.5 本章小结 347 参考文献 348 第14章 配对交易策略的挖掘与实现 349 14.1 配对交易概述 350 14.1.1 配对交易的定义 350 14.1.2 配对交易的特点 350 14.1.3 配对选取步骤 351 14.2 协整检验的理论基础 352 14.2.1 协整关系的定义 352 14.2.2 EG两步协整检验法 353 14.2.3 Johansen协整检验法 353 14.3 配对交易的实现 355 14.3.1 协整检验的实现 355 14.3.2 配对交易函数 356 14.3.3 协整配对中的参数优化 359 14.4 延伸阅读:配对交易的三要素 360 14.4.1 配对交易的前提 360 14.4.2 配对交易的关键 360 14.4.3 配对交易的假设 360 14.5 本章小结 361 参考文献 361 第15章 数据挖掘在股票程序化交易中的综合应用 362 15.1 程序化交易概述 362 15.1.1 程序化交易的定义 362 15.1.2 程序化交易的实现过程 363 15.1.3 程序化交易的分类 365 15.2 数据的处理及探索 366 15.2.1 获取股票日交易数据 366 15.2.2 计算指标 369 15.2.3 数据标准化 375 15.2.4 变量筛选 377 15.3 模型的建立及评估 379 15.3.1 股票预测的基本思想 379 15.3.2 模型的训练及评价 379 15.4 组合投资的优化 381 15.4.1 组合投资的理论基础 381 15.4.2 组合投资的实现 385 15.5 程序化交易的实施 389 15.6 本章小结 389 参考文献 390 第16章 基于数据挖掘技术的量化交易系统 392 16.1 交易系统概述 393 16.1.1 交易系统的定义 393 16.1.2 交易系统的作用 393 16.2 DM交易系统总体设计 394 16.2.1 系统目标 394 16.2.2 相关约定 395 16.2.3 系统结构 395 16.3 短期交易子系统 396 16.3.1 子系统功能描述 396 16.3.2 数据预处理模块 396 16.3.3 量化选股模块 397 16.3.4 策略回测模块 397 16.4 中长期交易子系统 398 16.4.1 子系统功能描述 398 16.4.2 导入数据模块 398 16.4.3 投资组合优化模块 399 16.5 系统的拓展与展望 401 16.6 本章小结 401 参考文献 402

作者简介

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个