气象数据挖掘研究第32卷第16期2022年8月武汉理工大学学报JOURNALOFWUHANUNIVERSITYOFTECHNOLOGYVol.32No.16Aug.2022DOI:10.3963/j.issn.167124431.2022.16.027气象数据挖掘研究马廷淮1,穆强1,田伟1,李德泉2(1.南京信息工程大学计算机与软件学院,南京210044;2.国家气象信息中心,北京100081)摘要:分析了数据挖掘在气象业务中的必要性,总结了数据挖掘在气象预报、气候预测和气象灾害预报中的应用情况,阐述了数据挖掘可以在时空分析、关联分析、降维分析、分类预测4个方面在气象业务中应用,并结合气象应用提出了气象数据挖掘研究的重点。关键词:数据挖掘;气象数据;气象应用:TP311文献标识码:A:167124431(2022)1620220205ResearchonMeteorologicalDataMiningMATing2huai1,MUQiang1,TIANWei1,LIDe2quan2(1.SchoolofComputerandSoftware,Nan激ngUniversityofInformationScienceTechnology,Nan激ng210044,China;2.NationalMeteorologicalInformationCenter,Bei激ng100081,China)Abstract:Thenecessityofmeteorologicaldatamininghasbeenemphasized.Datamininginweatherforecast,climatepre2dictionandmeteorologicaldisasterpredictions’applicationsaresummarized.Atlast,spatial2temporalanalysis,associationruleanalysis,dimensions2decreasinganalysis,classifyandpredictionarediscussedinmeteorologicaldatamining.Theemphasisofmeteorologicaldataminingispresented.Keywords:datamining;meteorologydata;meteorologicalapplication收稿日期:2022204223.基金项目:中国气象局软科学项目(GQR2022036)和江苏省高校自然科学基金(08KJD520228).作者简介:马廷淮(19742),男,博士,教授.E2mail:thma@wwsodocs/doc/11a05d45b307e87101f69687随着气象信息化程度的日益提高,气象部门积累了大量的气象数据,如何管理好和使用好这些海量数据,是提高预报预测准确率和灾害天气预警能力的关键。这些海量气象数据主要包括[1]:1)以地面、高空、太阳辐射、农业气象等台站的观测资料及其统计加工产品为主的台站资料;2)以各种数值模式的同化分析资料和各种遥感探测的数值反演产品为主的格点资料;3)以各类卫星云图和各种雷达图像为主的图形图像资料;4)以面向主题的、有多种资料构成的某一区域或领域范围的综合资料构成综合气象数据。据统计,每天通过气象信息中心广播下发到各台站的气象数据高达300~500M[2];新一代天气雷达信息共享平台建成后,台站收到的气象雷达资料每天高达100G;而中央台站每天收到的资料更是高达TB数量级,业务应用的数据高达PB数量级。现阶段气象预测预报并没有充分利用如此庞大而又珍贵的气象资料。目前,数值天气预报通常采用一套极其复杂的数学方程来描述大气的运动规律。科研人员将气象卫星、雷达等观测的大量数据代入这个方程求解,预测出未来的天气变化情况[3]。正是由于预报模式的复杂性,在一般台站的预报中,预报员根据经验,利用当天或者前几天的少数站点的实况资料以及小范围区域内极少数的几个物理量,提取认为与某一天气现象相关性较高的天气要素作为因子,进行回归、判别分析,即得出预报结论[2]。现阶段的预报业务,难以考虑众多气象因素,更难以分析数据属性间隐含的信息。因此,建立气象综合数据仓库,实现对数据预报过程、信息服务最强大的数据支持;对各种资料进行聚类分析、关联分析、时间序列分析,以求发现各种物理量和气象要素与未来天气之间的关系;根据气象资料做出气象的预测,减少预报中的主观因素,有利于预报技术的持续改进,提高预测的准确度。1气象数据挖掘的应用1.1气象预报气象预报一般指短时、短期和中期的天气预报。根据预报的内容和时限不同,有不同的预报技术和手段。短时(3h内)天气预报主要采用现代化的探测手段,并用外推法作出预报;短期(72h内)天气预报使用传统的天气学、统计学、动力统计学、数值预报、诊断分析等方法制作;中期(10d内)天气预报应用天气学、统计学、动力学、数值预报等方法,综合分析制作出来。所以在气象预报中,主要还是利用天气学基本原理分析及时得到的探测数据;而基于数据挖掘和统计的气象预报方法未得到充分的应用,具有较大的研究空间。国内外...