精算大数据应用实践 (下篇)
大数据时代,精算师如何继续突破
January 2023Photo: iStock.com/ismagilov
近年来,随着新技术的不断更迭,大数据的概念和体系不断完善,对大数据的应用也更加深入和广泛。各行业、领域在数字化转型以及大数据融合应用中不断创新和突破,比如利用大数据改进现有业务流程、扩展出新的业务形态等等。对于精算师而言,在大数据下能够使用的数据量更大、数据维度更丰富,我们可以更好地发挥精算作用,有助于提高风险管理能力,更好地服务消费者。
本文下篇介绍全文第二部分精算大数据应用的第三及第四个步骤,以及第三部分对未来精算大数据应用工作提出一些思考和展望。
建模及模型性能评估
在精算大数据应用中,不仅局限于传统的精算模型构建,也包括使用各类机器学习算法、知识图谱等建模方式。需根据场景目标选择适合的建模方法,并通过一系列的检验指标以及多种可视化的模型评估指标进行模型迭代优化,最终得到效果良好、结果稳定且具备一定泛化能力的模型。以机器学习建模为例:
- 算法选择:机器学习算法的选择需要结合不同的建模目标进行选取,例如解决分类或回归问题。与其他IT人员建模的区别是,精算人员更为关注建模过程的合理性以及结果的科学性,需要判断模型变量影响是否符合业务规则和逻辑,因此要求特征以及模型具备很强的可解释性。在前期建模实践中,我们通常会将多种算法结合使用,先使用高维特征处理能力较强的非线性算法,筛选有效特征、确定模型结构,再使用可解释性较强的广义线性模型进行训练和预测,从而兼顾模型效果与规则的可解释性。
- 变量选择:入模变量一般通过训练集进行筛选,验证集进行调优,需要综合考虑多种因素,主要包括特征重要性、变量之间的相关性影响、变量的可解释性以及One-Way等可视化评价指标的表现情况等等,同时还要考虑变量的暴露数情况,以确保变量影响的稳定性。对于影响不显著或者因暴露数较少而不稳定的变量,需要考虑剔除。对于从精算原理或业务逻辑上判断其影响方向与业务实质相悖的变量,需要重点分析找到相关影响因素,并调整变量形式(比如通过加入交叉影响变量等方式)重新进入模型参与训练,但需要注意过拟合风险。此外,由于寿险合同期限较长,部分变量在长时间跨度上可能存在较大的分布差异,因此还需要对模型进一步泛化验证,通过推移时间窗口调整变量系数,从而使模型具备一定的泛化能力,更好地反映未来的趋势变化情况。
- 模型评估:回归模型和分类模型具有不同的评价方法和评估指标,例如回归模型常用的均方误差指标等,分类模型常用的ROC曲线、Lift图等。在实际运用中,需要结合模型算法、业务需求以及专业经验等科学选择评估指标,合理定义单项指标的评价水平与边界,确定各评价指标的相对重要性或权重,从而综合评估模型效果。除常用的评价指标外,还应从模型结果合理性等方面综合评价,例如通过不同维度下的Lift Curve衡量预测值与实际值的偏差程度;或者计算Lift提升度,衡量分类模型对坏样本的预测能力相比随机选择的倍数等。此外,还需要依赖于专家经验对预测结果进一步做合理性分析,以确保符合精算原理和业务逻辑。
- 迭代优化:机器学习模型构建与模型评估是个反复迭代的过程,需要根据评价指标不断地进行算法调整、超参数调整以及特征调整。通常一个模型要经过几十次的调优才能基本确定,工作重复量较大,整套建模流程耗时较长。因此,我们在前期实践中结合建模流程研发了自动化工具,主要应用于模型迭代优化的过程,能够极大地提升建模效率。
应用落地
应用落地是精算大数据实践中最困难的一步,需要统筹考虑应用场景及适合的落地应用形式,要结合实际业务开展需求,整合模型结果以及业务规则和逻辑,将专业、复杂的分析逻辑转化成可应用、可落地的形式,内嵌于业务流程之中。在应用落地过程中往往需要其他业务条线以及IT研发等人员的协助和配合。
不断提高精算技术应用水平,推动创新融合
随着寿险产品逐步向差异化、定制化的方向发展,以及寿险经营要求更加的精细化和专业化,未来对精算大数据的应用将会更加深入和广泛。精算人员需要始终秉持开放心态,积极推动精算与大数据等其他科学技术的进一步融合,发挥“1+1>2”的效果。
需要重视综合能力培养,加强专业应用
对于未来精算大数据应用,一方面是要在现有业务流程、管理模式等基础上开展有益创新,更好地提供精算服务。比如,在风险量化方面,利用多维数据及相应分析手段,对保险风险进行深入研究,探索在更细维度上运用精算工具进行风险计量的一些方法,为精准定价、差异化风险管理提供精算基础。再如,通过与大数据深度关联,对长期利率趋势进行更多维的影响因素研究,辅助公司资产负债管理。另一方面,除了对现有服务模式的改进以外,也需要对新的管理模式以及其他相关应用领域进行拓展和创新。
要始终保持对风险的科学认知
寿险提供的是长期风险保障,其经营实质是风险管理。大数据则为我们提供了一种很好的度量风险的方法和手段,数据底层的改变会使精算模型有所不同,但精算最基本的逻辑没有发生变化,大数据的相关应用并不是对保险原理和基本规律的颠覆,而是帮助更好地实现保险和精算本质。因此在精算师不断加强应用深度、拓宽应用领域的同时,必须把握寿险本质,遵循精算逻辑进行合理融合与创新。在大数据应用下,数据维度大幅提升,更加需要精算师去权衡和优化信息维度,降低冗余信息干扰,绝不能盲目地追求模型的复杂性与大算力,要考虑价值链条的各相关环节,基于精算原理统筹不同模型和业务规则,构建完整的逻辑闭环,从而保证大数据的应用不偏离业务本质。同时,还需要结合业务实际情况开展相关分析,以确保应用结果的科学性、合理性和可用性。
本文主要基于公司在精算大数据方面的工作实践情况进行整理,特别鸣谢利明光先生、侯晋女士的悉心指导和大力支持,感谢李祥烨先生参与讨论。
以上陈述及评论仅为作者个人观点,不代表北美精算师协会(SOA)或其相关雇主言论和观点。
Copyright © 2023 by the Society of Actuaries, Chicago, Illinois.