在AirVisual平台上发布之前,如何验证空气质量数据?
AirVisual平台旨在集中和汇总目前可用的尽可能多的空气质量信息,以提供最全面的全球空气质量概览。
通过AirVisual平台报告的数据源包括来自政府监测站的传感器数据(通常被认为是高成本的“参考监测器”),以及低成本传感器,如公共AirVisual Pro站和PurpleAir传感器。
通过AirVisual平台发布的所有数据都经过数据验证,此过程在这两个传感器数据源之间有所不同。
AirVisual的数据验证系统是基于云的,由机器学习驱动,所有测量结果在发布到我们的平台之前都要通过该系统。
政府“参考”传感器数据
尽管高成本的政府传感器通常被认为是测量空气质量数据的最准确和最可靠的来源,但有时这些传感器也会报告异常或不准确的数据。造成这种情况的原因可能包括临时维护或缺陷,甚至是传感器附近的临时超局部发射源。
因此,所有政府传感器数据在发布前都要经过数据验证系统。这种验证的一个例子是,基于云的系统可以识别站点发布的任何潜在异常情况(例如,PM2.5 从 10ug/m3 突然飙升到 100ug/m3,从一小时到下一小时),并将与附近的其他测量值进行交叉检查,以验证这种峰值是否具有代表性或异常。验证过程还会根据历史模式和其他参数(如天气状况)进行交叉检查。然后,该值将相应地发布或打折。
低成本传感器
除了上述验证过程外,来自低成本传感器的测量也要经过数据校准和校正过程,这将识别和打折异常读数。
应用于低成本传感器的系统考虑了温度、湿度、污染成分等附近条件,并应用了基于环境条件的数据校准算法。例如,在某些情况下,高湿度水平可能导致低成本传感器过度报告PM2.5水平。同样,污染成分(交通产生的污染、沙尘暴、煤基污染等)对测量有很大影响,AirVisual平台使用卫星图像来确定用于校准机制的污染成分。因此,除了区域历史模式外,这种校准和校正算法还考虑了当地的湿度水平和其他环境参数,并相应地调整了PM2.5的测量值。
调整水平由基于人工智能和机器学习的基于云的系统决定。通过多年来从参考传感器、AirVisual传感器、气象数据和卫星图像中的污染成分等数十亿个全球空气质量数据点的汇总,该系统一直在学习世界不同地区不同空气质量参数之间的复杂历史关系。
由于颗粒物的成分在世界不同地区之间差异很大,因此区分颗粒物与局部/区域层面的湿度等因素的相关性至关重要。这些相关性可能因PM的不同局部成分而有很大差异,因此在局部校准和校正算法中必须考虑这些相关性。