覆盖北京全市、90%准确率的蚊虫叮咬指数是这样测出来的(2)
市气象服务中心高级工程师姜江告诉记者,基于蚊虫与气象因素的关系,他们开始尝试通过导入气象要素的各种数值,来推算蚊虫的密度。多元回归、支持向量机、随机森林、K最近邻分类算法和渐进梯度回归树,这些略显晦涩的专业名词都是他们采用的计算预测方法。姜江说,他们前后用了5种机器学习方法,并将5种算法的预测结果进行综合平均,从而精确地利用气象因素对北京各区“蚊虫叮咬指数”做出预测。“因为每种模型捕捉到的特征不一样,所以取了综合平均值。”
姜江解释,气象因素主要是通过两个方面对蚊虫造成影响。一是直接影响。比如,一场大暴雨过后,如果蚊虫的虫卵或者成虫被雨水冲走,蚊虫密度就会在很短的时间内大幅下降。另一方面是间接影响,即气象因素并不直接针对蚊虫本身作用,而是通过影响蚊虫的生存环境从而导致蚊虫密度发生变化。比如前期的气温、降雨量大小会影响蚊虫本身的成长速度以及蚊虫的分布情况,这是长期的、间接的影响。同时,还要考虑蚊虫生长周期的气象要素影响。因为蚊虫从出生到成蚊叮咬大概要两周时间,前期的气象要素非常关键。
准确率
最高90% 后续将优化
从今年6月1日起,姜江他们开始每天出一份全市平均16个区的蚊虫叮咬预报,做准确率检验。一个多月下来,他们发现预报准确率虽然有一定的波动,但是最好的时候可以达到80%至90%上下。
姜江说,蚊虫监测的数据样本虽然有10年,但是数据量其实并不足够大,所以研究出来的模型动态也处于一个实时更新的状态,将在后续运用中不断优化,来进一步提高预报准确率。“蚊虫密度综合来说还是比较复杂,像植被的变化、水体的更改、人为的活动等,都会造成一定程度的影响。”
在未来的研究中,专业技术人员将考虑加入更多具体的数据,比如人口密度的数据、水体环境的数据等。尤其是在分区预报中,虽然每个区的气象要素和蚊虫密度数据不同,但各个区的人口密度、植被、水体等都是不一样的,要把更多的相关要素数据加进去,才能使得预测结果更加精准。
此外,蚊虫的变化有一个自身的曲线,其中会有很多“噪音”,比如突发情况等,后续研究中如果能把类似的“噪音”完全剔除掉,才会是一个比较稳定的模型状态,计算出来的结果才会更精准。
由于这项预测工作刚起步,数据量还远远不够大,需要积攒案例,积累经验,只有见识过的情况越来越多,才能更好地分析原因得出结论,进一步提高预报的准确率。未来,当数据能够进一步精确,或者说准确率足够高的话,它的应用范围也有望进一步扩大,如给物业部门或者做病虫害消杀的单位做参考。
新趋势
气象服务更贴近百姓需求
以往,人们对于气象预报的了解,停留在预估温度、风力、雨雪等天气情况。此次,北京气象服务增加“蚊虫叮咬指数”,更好地贴合了百姓的日常生活需求。
张勇表示,“蚊虫叮咬指数”的发布,将蚊虫密度从“主动监测”向“及时预报”转变,对于“天气预报”气象服务来说,既扩大了内容,又显得更加精细化和专业化,也使得生活信息服务更能满足老百姓的日常需求。做好蚊虫叮咬指数的预报工作,对防止和控制蚊媒传染病也具有较大的参考意义。蚊媒传染病已经位列全球传染病的前列,全球每年都有很多人因此失去生命,通过更好的预测来加强对蚊媒传染病的控制,对人类的安全健康都有意义。