首页
关于我们
新闻中心
咨询服务
培训服务
软件服务
资源共享
加入我们
Resource
资源共享
《董事会》专栏
出版专著
张宏亮博士Blog
当前位置:首页> 资源共享 > 张宏亮博士Blog
只有真正做过风险量化分析才会知道
更新日期:2025-03-17  浏览:158

如果你真正做过风险量化分析,那么你会知道使用软件定义概率分布、执行模拟计算只是建立量化分析模型的一个步骤。在这之前,还有很多数据分析等基础工作需要完成。 

建立风险量化模型不是“空穴来风”。每一个输入变量的概率分布都不是随意指定的,概率分布的设定建立在对变量的分布特征有着深入理解的基础之上。
 
那么,如何理解一个变量的分布特征呢?
 
我们在进行风险量化分析之前,需要收集有关变量的相关数据,对变量数据集进行统计分析,认识变量的统计特征,以及寻找变量之间的相关关系。也就是说,风险量化分析不仅仅是进行蒙特卡罗模拟,还需要广泛使用到统计分析方法。这反过来要求风险量化分析软件在具备蒙特卡罗模拟功能之外还需要具备统计分析等相关功能。
 
对变量数据集进行统计分析不是一个一次性工作,而是不断从多个角度、多个侧面对数据集运用多种分析方法进行探索分析的“重复性”工作。例如,拿到一个数据集,我们需要: 
  • 运用统计分析、直方图等方法去理解变量的分布特征。
  • 运用相关性分析、散点图和箱形图等方法去寻找变量间的相关关系。
  • 运用统计推断对变量进行判断论证,例如新的销售方法是否能将平均销售量提高20%呢?
  • 有些时候用到回归分析方法去建立变量间方程,解释变量并进行预测。
  • 如果变量具有时间序列特性,还需要建立时间序列模型去对它未来走势进行趋势预测。
  • 有时需要验证变量数据是否符合正态分布,因为许多统计分析方法都对变量的正态性有要求。
针对变量进行的探索性统计分析,一般要在不同的分析方法之间进行多次的、重复性切换式分析,一般分析方法(次数)在10 种(次)以上,包括各种统计分析(摘要统计、直方图、箱形图、相关分析、散点图、正态性检验)、回归分析或时间序列分析,有时还会对变量进行一定的转换后再重新进行多轮分析。
 
例如,下面这张图是我对一组“老忠实间歇泉(Old Faithful Geyser)”数据的分析。这里,我使用 Drisk 软件对该数据集进行了多方面的探索分析。从图片最下方的红框可以看到,针对这组数据进行了共 10 次(种)不同的分析,从开始初步探索变量的分布特征,到后面建立回归方程解释它的变化,再到最后对它的未来变化趋势进行预测。通过这些分析,又为后面的风险量化建模提供了数据基础和依据。
 
 
如果真正做过风险量化分析,那么就会意识到拥有一个“合适”风险量化分析软件是多么的重要。一个合适的软件,能够大幅提高你的分析效率,帮助你快速、准确掌握变量特征,这为后面的风险量化分析打下坚实基础。
 
Excel是一个非常优秀的数据分析平台,特别是它的“工作表(sheet)”设计非常适合数据分析。例如,从上面 Drisk 的分析结果可以看到,每个分析放在一个工作表上,10次分析结果分别存放于不同的工作表上,非常容易查看和理解。当你在不同的工作表间进行切换观察时,非常便于对同一个数据集的不同方面进入深入认识,并产生新的洞察理解,而这些新的理解又会触发新的分析,新的分析结果又会存放于新的工作表中。
 
Drisk软件充分利用了Excel的工作表功能,每一个分析都会在Excel文件中产生一个新的工作表,并将分析结果存放于该工作表中。这样,一个Excel文件中包含多种不同的数据分析结果,非常方便查看、回忆、理解数据分析结果。