精算模型10 非参数模型0 精算数据、非参数建模的思路概述
精算模型10 非參數模型0 精算數據、非參數建模的目標概述
- 數據類型
- 完整數據
- 非完整數據
- 數據分析目標
這是精算模型的第十部分,精算的非參數統計模型,從這一部分開始我們討論精算建模的統計方法。在討論統計方法的選擇與應用之前,我們必須要明確精算的數據是什么樣子的(數據類型),以及我們希望通過分析這些數據得到什么結論(分析目標),所以在正式介紹方法之前,這一講簡單介紹一下精算數據以及精算數據分析的目標。
數據類型
完整數據
如果對某個分布采樣的取值沒有限制,那么這樣得到的樣本數據就是完整數據(complete data)。假設要調查車險賠付數據,如果不存在免賠額與保單限額,且保險人全額支付保單損失,這樣得到的數據就是完整數據。免賠額、保單限額、非全額支付會造成數據刪失與截斷,樣本數據就不再是完整數據了。
如果完整數據能夠得到每一個觀測值的真實精確值,這樣的數據就叫完整個體數據(complete individual data);但是如果總體分布是實數,數據觀測與記錄一定是有誤差的,這時可以考慮用記錄觀測值的區間,并且當數據過于稠密的時候,也可以考慮對觀測值進行分組,并只記錄觀測值的組別,這樣的數據叫分組數據。
非完整數據
造成數據非完整的情況有兩種,截斷與刪失。
在我們對某個總體進行采樣時,超出某個范圍的數據我們只記錄范圍不記錄精確值,這種記錄方式得到的數據叫做刪失數據(censored data);如果超出某個范圍的數據我們不記錄,這樣得到的數據叫截斷數據(truncated data)。
更詳細地分下類,小于某個下界的數據我們只記錄范圍不記錄精確值,這種記錄方式得到的數據叫做左刪失數據;大于某個上界的數據我們只記錄范圍不記錄精確值,這種記錄方式得到的數據叫做右刪失數據。小于某個下界的數據我們不記錄,這樣得到的數據叫做左截斷數據;大于某個上界的數據我們不記錄,這樣得到的數據叫做右截斷數據。
在精算中,最常見的非完整數據類型是左截斷數據與右刪失數據。前面提到的免賠額就造成左截斷,存在賠償限額的造成右刪失。
最后強調一個概念,缺失數據(missing data)是因為某些因為某個數據沒有被記錄下來,它既可能是完整數據,也可能是非完整數據,因為數據完整與否取決于記錄方式,而數據是否缺失則取決于數據是否有記錄。
數據分析目標
精算的非參數模型想要解決的問題是,如何根據已有的數據,估計總體分布情況。比如已知一群20歲的肥胖、無心腦血管疾病但經常熬夜的個體的死亡年齡,如何構建這個群體的生存函數、并根據生存函數估計剩余壽命等。
根據前文討論的數據類型,后續我們將討論下面這些方法:
-
經驗分布函數方法
- 完整個體數據的經驗分布函數
- 分組數據的卵形線與直方圖
- 非完整數據生存函數估計:Kaplan-Meier方法、Greenwood近似與對數轉換的置信區間
- 非完整數據危險率函數估計:Nelson-Aalen估計
-
核密度估計方法
總結
以上是生活随笔為你收集整理的精算模型10 非参数模型0 精算数据、非参数建模的思路概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 精算模型1 一元生存分析3 条件概率与截
- 下一篇: UA SIE545 优化理论基础4 对偶