
本书主要分两部分,第一部分为第 1 章到第 7 章,主要针对财务管理、金融、投资领域需要用到的 SAS 语法进行介绍;第二部分为第 8 章到第 17 章,主要针对财务实践研究中会使用的研究方法进行介绍。本书的第二部分中提供了标准化的宏语法,在第 8 章中提供了 stat 以及 correlation 两个宏语法,读者仅需将文档准备好,输入文档名称,希望进位到小数点后几位及要分析的变项名称,宏语法就能够直接将叙述统计表以及相关系数表自动生成出来,第 9 章提供了 npar 及 ttest,可以快速地检定两群体的中位数以及均值检定,第 10 章提供了 Jagaseesh and Titman 的动能投资策略的语法,而 11 章到 15 章的各个回归模型,也有相对应的宏语言提供给读者进行实践分析用,第 16 章则针对短期及长期事件研究法做了详细的介绍,最后在第 17 章则介绍了如何使用财务数据构建出 Fama and French 的 5 因子报酬率。
12 年前,笔者于中国台湾东华大学攻读企业管理系硕士班,当时完全没有编程基础就必须学习动能投资策略(见本书 10.3 节与 10.4 节)的语法,当时就一股脑儿一行一行运行程序,一行一行修改,在暑假期间,每天盯着电脑的日志文件 6 个钟头,每天与同门见面讲的话就是,“你的程序跑得如何?” 当时觉得研究财务金融研究的人好苦,为了做好财务金融研究,不得不去接触大学到研究生前期都不会接触的统计软件,因为是研究生,所以这些东西要自己学;因为要完成论文,这些东西拼死拼活也得学好,也因此开始了我学 SAS 的路。 10 年前开始攻读博士后,要引领硕士生修习 SAS,也因此要接触更多的研究方法,更多的研究语言,当时很多语法都是 20 世纪 90 年代的前人留下来的语法,程序确实能够顺利运行,但是有一个问题,运行速度慢。当时跟我合作的老师这么问,“煜恩,为什么程序这么慢,却没有人要去改善呢?”, 当时我没有答案,但当年我指导一名硕士生,请他把编程改好,从而运行结果会比较快时,他这么回答,“学长,我没有时间去改程序,我还是把结果跑出来,自己再动手 key 到 word 感觉会比较快。”于是我得到答案了,大家都知道运行慢,可是没人有勇气去修改这些程序,因为不知道会花多少时间才能修改完,而就算完成以后速度变快,自己也毕业了,以后也用不上了,那又如何能期待硕士生修改这些语法呢? 于是我开始撰写一本讲义,专门为我师门“恶魔党”写的 SAS 攻略,最早命名为“SAS 在财务研究上的应用:恶魔党的私传秘籍,”最初的版本仅有 129 页,内容上以财务领域常常涉及的语言为主,之后接触到 SQL 语言以及 SAS 中的 Output Delivery System (ODS)的功能,更进一步开启了笔者将实践表格输出到 EXCEL 的机缘,于是在本书的第 9 章到第 17 章所呈现的 SAS 语法,都能将实验结果整理成可发表的论文格式,并且将其输出到 EXCEL 文档,可以节省人工输入结果的时间,我想如果这本书可以帮助读者节省进行实验的时间,不管是学生、研究者都能够把时间花在更有生产力的工作上。 虽然本书主要针对 SAS 在财务研究上的编程,但是 SAS 在运用上不仅限于财务研究分析,SAS除了是一个优良的统计软件外,还是一家国际公司,其主要为公司以大数据的思维逻辑构建适合的数据库,并且提供良好的分析模组,其运用层面包含商业智能分析、客户智能、数据管理、决策管理器、绩效管理、风险管理、供应链管理,而由于 SAS 本身最早起源于大型数据库的分析,因此在大数据背景下,还具备了云分析以及文本分析等功能,对于各行各业都起着重要的功用,其目前运用的行业包含了教育、医疗保健、制造业、媒体分析、旅游与运输业、汽车行业、电信业、零售业、资本市场、银行业以及保险业等相关行业,在美国,如果取得了 SAS 的 Base 以及 Advance 的国际证照,一般而言都能取得 10 万美元以上的年薪。而在大数据时代背景下,金融行业面临着微信钱包、余额宝等手机理财侵蚀传统银行业提供的投资理财服务,又面临 P2P 网贷来抢占传统消费金融贷款以及企业金融贷款的业务,在此情况下,金融业将由传统人力为主的服务转向数据挖掘的服务,在理财上,需要了解什么样的客户会希望接受人力服务的理财规划,或者是提供相关的理财材料供其选择;在借贷上,需要快速地了解该名客户未来违约的可能性,这些都是需要进行数据收集规划,并且进行分析,而 SAS 公司这几年来为大型银行提供其数据挖掘以及消费者信用分析的定制化服务,在全球 100 强银行中,有 99 家银行使用 SAS 的产品服务,应运而生的是,该 99 家银行产生了对于专精 SAS 的金融从业人员的需求,而这样的趋势现象也在我国逐渐蔓延。在我国,SAS 自从 2013 年开始举办汇丰杯中国高校数据分析大赛,除了提供高额奖项外,也提供了企业招才的机会,以 2015 年的赛事为例,SAS 还邀请了毕马威、京东金融、中信银行、丰田汽车金融(中国)有限公司、交通银行太平洋信用卡中心、南方航空电子商务部、广汽汇理汽车金融有限公司、奇瑞徽银汽车金融股份有限公司、包商银行、平安银行、京东方、光大银行等企业作为大赛的颁 奖者,且这些企业也提供参赛同学实习以及未来工作的机会,这说明中国金融行业已经开始运用 SAS作为公司数据分析的主要工具,而 SAS 更是未来金融业学生必备的工作技能。 最后,在进行分析的过程中,我常提醒自己,“如果数据站在你这边,就引用数据;如果理论站在你这边,就引用理论;如果两者都背离你而去,你不是发现了新的异象,就是做错了,而放弃是在做错的时候才做的决定。”也希望各位读者,在进行研究分析时,共勉之。 林煜恩 2016 年 3 月 19 日于吉林大学匡亚明楼
第 1 章 SAS 入门介绍 ...... 1 1.1 SAS 的基本接口介绍 2 1.2 SAS 语法的基础架构 2 1.3 如何输入数据 ............ 4 1.4 如何输出数据 .......... 13 1.5 总结 15 第 2 章 SAS 数据的运算与函数 .......... 16 2.1 四则运算 .................. 17 2.2 统计函数 .................. 18 2.3 随机函数 .................. 21 2.4 时间函数 .................. 22 2.5 文本变量的处理 ...... 26 2.6 总结 30 第 3 章 数据与变量的产生和选取 ...... 31 3.1 利用 SAS 产生数据 . 32 3.2 保留、删除变量 ...... 36 3.3 保留、删除观测值 .. 38 3.4 抽样方法 .................. 38 3.5 总结 43 第 4 章 数据的排序、分组与转置 ...... 44 4.1 数据的排序(proc sort) ................ 45 4.2 数据的分组(proc rank) ............... 49 4.3 数据的转置 .............. 53 4.4 总结 57 SAS 在财务研究中的应用 X 第 5 章 数据的合并 .......... 58 5.1 垂直合并 .................. 60 5.2 水平合并 .................. 65 5.3 总结 72 第 6 章 SAS 的数据库管理 ................... 73 6.1 文档的复制、删除与保留(proc datasets) ............ 74 6.2 结构化查询语言 ...... 78 6.3 总结 91 第 7 章 宏语法(%MACRO) ............. 92 7.1 基础宏语法 .............. 93 7.2 进阶宏语法 .............. 96 7.3 宏语法撰写技巧 .... 107 7.4 总结 ........................ 111 第 8 章 描述统计 ............. 112 8.1 常见的描述统计量 113 8.2 相关系数 ................ 121 8.3 个人化表格宏解析 126 8.4 趋势图基础语法介绍 .................... 129 8.5 离群值的处理(winsorize) ......... 140 8.6 总结 ........................ 144 第 9 章 两群体差异性检定 .................. 145 9.1 均值检定 ................ 146 9.2 中位数检定 ............ 151 9.3 两群体检定宏进阶用法 ................ 154 9.4 总结 ........................ 156 第 10 章 投资组合与报酬率检定 ....... 157 10.1 投资组合股票数目与风险 .......... 158 10.2 有效边界有效边界的绘制 .......... 164 10.3 初探动能投资策略 ...................... 168 10.4 再探动能投资策略(Jagadeesh and Titman, 1993; 2001) ............ 177 10.5 Newey and West 的调整语法 ...... 185 10.6 总结 ...................... 190 G 目 录 XI 第 11 章 基础回归语法(PROC REG) ................. 191 11.1 回归语法介绍 ...... 192 11.2 格式化回归模型输出 .................. 201 11.3 Fama-MacBeth 回归模型 ............ 212 11.4 总结 ...................... 222 第 12 章 回归语法的应用(PROC REG) ............ 223 12.1 移动窗口(moving window) .... 224 12.2 共同基金绩效评估:移动窗口的应用 ................ 229 12.3 滚动法(Rolling) ...................... 234 12.4 Where 语法有妙招 ...................... 239 12.5 结构性改变 .......... 241 12.6 分段回归(piecewise regression) ....................... 246 12.7 总结 ...................... 254 第 13 章 PANEL DATA(PROC PANEL、PROC TSCSREG) .................... 255 13.1 固定效应与随机效应的估计方法 ........................ 256 13.2 Panel data 的实践流程 ................. 261 13.3 格式化 Panel data 模型输出 ........ 264 13.4 总结 ...................... 267 第 14 章 罗吉斯模型(PROC LOGISTIC) .......... 268 14.1 Logit model(logistic regression) ....................... 269 14.2 Conditional logistic regression ..... 276 14.3 Multinomial logistic regression .... 280 14.4 分类与概率转换 .. 287 14.5 总结 ...................... 291 第 15 章 TOBIT 模型(PROC LIFEREG) ........... 292 15.1 受限数据(censored data)与截断数据(truncated data) ........... 293 15.2 格式化 Tobit 模型输出 ............... 300 15.3 总结 ...................... 302 第 16 章 事件研究法(EVENT STUDY) .............. 303 16.1 短期事件研究法 .. 304 16.2 日历期间投资组合法 .................. 312 16.3 买进持有异常报酬率:配对投资组合法 ............ 318 SAS 在财务研究中的应用 XII 16.4 买进持有异常报酬率:配对样本法 ..................... 326 16.5 总结 ...................... 335 第 17 章 特殊议题 .......... 336 17.1 均值抽样分配 ...... 337 17.2 拔靴法(Bootstrap method) ...... 339 17.3 构建五因子与动能因子报酬率 ... 347 17.4 总结 ...................... 356
林煜恩(1981-),汉族,吉林大学商学院讲师,研究领域为行为金融学、投资组合、公司治理、公司理财和企业社会责任,长期针对CRSP、COMPUSTAT、IBES、TEJ、CSMAR等财务数据库分析,并针对这些数据库设计了完整的SAS编程并进行财务实证研究,作者Email:sas@jlu.edu.cn。