必考知识点,CFA一级数量分析-常见概率分布-下_TRIB:SFRC价格

“人的一切痛苦,本质上都是对自己无能的愤怒。”

文:蓝兔子读难NOTES

图:配图来源于网络

编码:0008

因为篇幅的限制,我们上一篇文章只说了一半,在这一篇文章中,我们会继续进行常见的概率分布内容的分享。可以说,在常见概率分布这一大章内容里面,最重要的内容就在接下来要说的里面,一个是正态分布(normaldistribution),另一个是t分布(student‘st-distribution),其也是掌握后面章节内容的关键知识点。

连续概率分布与正态分布

具体连续概率分布的定义我们在上一篇文章中已经进行过解释,这里就不再赘述。我们直接来看一个连续均匀分布(continuousuniformdistribution)的PDF图形:

因为每一个可能的结果发生的概率是相等的,所以其PDF曲线为一条水平线。这里需要强调说明一下,由于连续随机变量可以有无数多个可能,因此针对某一确定的结果,我们近似的认为其发生的概率为0,因此在分析连续随机变量相关问题时,我们应该取区间分析,而不能对点进行分析。

又因为任何一个随机事件,其所有可能的结果的概率和为1,所以上图中,该条直线的y轴坐标为1/(b-a)。当我们对区间(a,b)中任何一段子区间进行分析时,可以利用简单的几何原理算出相应的面积(概率)。

接下来,就是重中之重的正态分布,正态分布几乎存在于我们生活的方方面面,无论是班上同学的考试成绩,还是班上同学的身高体重,基本上都逃离不了正态分布的“上帝诅咒”,而且同一个目标对象的数量(样本量)越是多,越是重复的厉害,那么就越正态。看看下面这两幅图,看看你是否能找到小正态的影子。

请别告诉我这是人为的,即便是人为的,为何偏偏就是这个样子。那到底是哪个样子呢,请看下图:

正态分布虽然如上帝的“祝福”般占据了我们生活的方方面面,但是我们只需要把它当作一个工具即可,一把扳手,我们不需要知道它是怎么生产出来的,我们只需要了解他的一些性质即可:

其PDF完全由均值和方差刻画,通常记为N(均值,方差);其图形对称,偏度为0,越中间概率越大,越两端概率越小;如之前内容所讲,正态分布的峰度为3,超额峰度为0;服从正态分布的随机变量线性组合后还符合正态分布;标准正态分布概率区间几个特殊值经常用要记住,如下图(90%对应1.65个标准差,虽然图中没标,但也很重要)。

接下来的内容是标准化的正态分布。如前文所言,正态分布表示为N(均值,方差),尽管正态分布存在于我们生活的方方面面,但是这方方面面的正态分布却也各不相同,且由于正态分布的PDF比较复杂,我们很难通过表达式去计算出其某区间的概率,更不可能给每一个参数不同的正态分布都列一个表格去查。

好在前辈们也纠结过这个问题,并且找到了解决方案:他们把标准正态分布的结果列成一张表,并提供一种把非标准正态分布转换为标准正态分布的办法,再拿这个分布去查表。

标准正态分布表示为N(0,1),其中0为均值,1为方差,任何非标准正态分布都可以进行转换,转换后即可查标准正态分布的表得到相应的值。为了便于理解,举个例子:

已知某公司股票的某参数符合正态分布,其均值为10,方差为9,即服从N(10,9),问随机抽取该股票参数中的某个值,该值小于5的概率,即F(5)。

虽然其服从正态分布,但不是标准正态分布,所以没法直接查表,需要先进行转换,转换的方法就是:

(X-μ)/σ====即=====>>(5-10)/3

即查标准正态分布的F((5-10)/3)即可。

查表要注意,1、查表会不会,不会的同学看看书,这里就不解释了;2、查得的是累积概率,可能需要再次进行换算。

标准正态分布也被称为z分布或者u分布。

亏空风险(shortfallrisk):指资产的收益低于最低可接受水平的概率,亏空风险是一个概率。这个最低可接受水平(shortfalllevel)用Rl表示。

罗伊的第一安全比例(Roy'ssafety-firstratio|SFration):

SFRatio=/标准差

从其公式上来看,第一安全比例代表的是每份超额风险所获得的收益,这里的超额指的是投资收益相对于最低要求收益的超额。注意与夏普比率区分,夏普比率的超额是指投资收益相对于无风险收益超额。

同夏普比率一样,每单位风险获得的收益肯定是越多越好,所以怎么根据SFratio选择组合你懂的。

对数正态分布与t分布

接下来是另一个非常重要的分布,学生t分布(studentt-distribution),不要觉得名字奇怪,之所以叫这个名字,只是因为发表的人给自己取了个这么样的笔名而已。就像正态分布也叫高斯分布一样,只是名字而已。

不过说到正态分布和t分布,他们不仅仅是名字都是发表者用的名字而已,他们还有很多的相似之处。怎么个相似法呢,先看图:

我们之前说过,正态分布的样本数量越多,就越正态分布。以考试成绩为例,一个班50个同学的数据肯定没有全校同学的数据那么“正态”。但是如果反过来,班上只有40个同学,或者只有10个同学,他们的成绩还符合正态分布吗?不难想象,当我们数据量越小时,越容易受到极端值的影响,当数据量太少时,就会和正态分布出现偏差。

我们有一位伟大的同学,叫做“Student”,同我们一样,他也发现了这个现象,但是和我们不一样的是,人家找到了小样本的解决方案,后来被命名成t分布。t分布具有如下性质:

图形如上图所示,当自由度增大时,图形逐步接近于正态分布;图形完全由自由度(degreesoffreedom|df)刻画;相比于正态分布,t分布图形有低峰肥尾巴特质,因此峰度>3;这里说明一下,峰态虽然叫做“峰”态,但他看的不是峰有多高,而是尾巴有多肥。

下面是对数正态分布(lognormaldistribution),虽然正态分布占据了我们生活的方方面面,但是他却有一个问题:他的取值范围在正负无穷的范围内,而我们的资产,或者说股票的价格,不可能为负,所以导致其不能用于衡量资产的价格。因此,我们引入了对数正态分布(具体的过程比较有意思,但是这里不说),如下图:

其有如下特点:

非负性,符合资产股票的价格定义域,偏度为正,所以一般用正态分布来衡量资产的风险,而用对数正态分布来衡量资产的价格。

最后还有一个知识点,叫做多元分布(multivariatedistribution),这里大家不用详细了解,只知道多元分布就像多元方程一样,里面有多个元素。考试一般问你需要几个参数才能刻画出这个多元分布,只要记住以下内容就OK:

每一个元需要两个参数来刻画:一个均值,一个方差;每两个元之间需要一个相关系数来刻画,nC2;所以,假设有n元,需要的参数就是2*n+nC2,掏出你的计算器吧!

模拟

模拟就是通过事前对事情进行彩排,来预测和发现事情的发展方向,比如去面试前,你会进行一个模拟面试,考虑会有哪些问题,如何应对。

模拟有两种,以面试为例,很多人都有面试过,自己可能也面试过多次,面试的常见套路,问题基本上就那些,你模拟的时候,你就能知道大概会问哪些问题,虽然每次面试不一样,但是大差不差,你可以假设一种情景来分析,如果问这个问题怎么样,如果问那个问题怎么样。这就是蒙特卡罗模拟(MonteCarlosimulation),我们也称之为情景模拟,对解决如果咋的咋的(whatif)问题很有效。实际上,你就需要先假设这么一个如果(通常假设其符合某一分布),但是其缺陷是,你一旦假设都错了,那你就全盘皆输。而且这种计算费电脑。

还有一个叫做历史模拟(historicalsimulation),就是根据历史数据来模拟,比如搜集某个地方某一天过去100年的天气情况来预测以后的天气情况,由于其依赖历史数据,所以不能进行情景分析,如果(whatif)气象局搞了场人工降雨呢?而且时代在进步,万事万物都是在变,没有什么是一成不变的,所以历史模拟也存在问题。还有就是,你选的这段历史数据万一碰巧选到特殊的一段了,比如模拟经济发展,你刚好选到二战那一段呢?所以,我们通常进行样本外测试(outofsampletest),把数据拿到样本外的历史数据去试试,排除数据选择问题(是那一段时间独有的)。

兔纸的相关文章

CFA一级数量分析-货币的时间价值

CFA一级数量分析-数理统计基础与收益

CFA一级数量分析-概率论基础

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金宝趣谈

SAND李四占咏春诗集篇_:

七绝.赏春李四占绿遍田园翠豫南,雨丝柔润柳如烟。村游四月家乡美,谢了梨花赏牡丹。七绝.春愁李四占梨花纷雨落清明,柳绿桃红任踏青。四月春愁何日了,征程待启复作工.

[0:31ms0-4:138ms