广义Pareto分布(generalized Pareto distribution,GPD)变点是指其超出量发生质变的点,具体表现为一个或多个参数的变化.本文将极端暴雨数据的三参数GPD变点检测问题表示为假设检验问题,通过极大似然比检验统计量解决.尽管不可能得到检验统计量的精确分布,但通过证明GPD变点的极限性质和检验统计量的渐近收敛定理,可得到它的极限分布.同时,利用GPD变点检测模型,对深圳55年的月最大暴雨数据进行了分析.结果发现20世纪80年代是深圳气象学的一个变点,这与最小超阈值(narrowest over threshold,NOT)方法所得结果一致.除此之外,本文方法的优势在于它统一了变点检测前后的分析框架.在此框架下,通过对变点的分析,发现GPD变点之前的极值指数为负.结合降雨量与重现期的关系可得,重现期小于百年的暴雨强度较之前有所减弱.该点之后,极值指数为正,百年以上重现期的暴雨灾害程度较之前严重且极端降雨现象较之前频繁.实证结果表明,GPD变点模型能够较好地捕获传统GPD模型所不能捕捉的内在规律,较好地弥补了传统GPD模型的不足.
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输入进行实验,在全部80个目标类别上获得了91.95%的平均识别率,实现了页面级的端到端的水书古籍文字的准确定位与识别.实验结果表明,Faster-RCNN模型在目前的数据集上能很好地实现水书手写文字的检测与识别,文中采用的数据扩增方式能明显提升水书手写文字的识别率,为水书文化的保护和传承提供了新思路,对于解决实际应用场景中的水书文字识别问题具有重要意义.
暂无评论