乐趣区

关于数据挖掘:R语言广义加性混合模型GAMM分析长沙气象因子空气污染PM25浓度显著性检验逐日变化可视化

全文链接:https://tecdat.cn/?p=32981

原文出处:拓端数据部落公众号

气候变化和空气污染对古代社会产生了越来越大的影响。在这种背景下,钻研气象和空气污染之间的关系以及其对 PM2.5 浓度的影响变得十分重要。为了更好地了解和解释这些关系,狭义加性混合模型(GAMM)成为一种弱小的工具。

长沙作为湖南省的省会城市,其气象条件和空气质量始终备受关注。通过剖析长沙地区的气象数据、空气污染指标和 PM2.5 浓度,能够更加全面地理解该地区的空气质量情况,并揭示气象因素对其变动的影响。

本钻研旨在应用 R 语言中的狭义加性混合模型(GAMM)办法,帮忙客户来摸索长沙地区气象因素与空气污染之间的关系,并进一步钻研它们对 PM2.5 浓度变动的影响。咱们将采集长沙地区的逐日气象数据、空气污染指标以及 PM2.5 浓度数据,利用 GAMM 模型进行剖析。

在剖析过程中,咱们将思考多种气象因素,如温度、湿度、风速等,并联合空气污染指标,如 PM10、SO2、NO2 等,来建设相应的 GAMM 模型。通过显著性测验,咱们将评估各个因素对 PM2.5 浓度的影响水平,并进一步进行逐日变动的可视化剖析,以出现其动态变化法则。

查看数据

读取数据


airquality=read.csv("长沙气象站逐日气象 + 空气污染 数据.csv")  
  
Region=read.csv("长沙市年各个站点的 PM2.5 每日浓度.csv",skip=1)

Table 2. Significance tests of PM2.5levels for different season, region, daytime and day of week. 对不同节令、地区、白天和周日的 PM2.5 程度进行显著性测验。

这段内容提到了对不同节令、地区、白天和周日的 PM2.5 程度进行显著性测验。显著性测验是一种统计办法,用于确定两个或多个样本之间是否存在显著差别。

在这个情境中,钻研人员可能心愿理解不同节令、地区、白天和周日的 PM2.5 程度是否存在显著差别。PM2.5 是指空气中直径小于或等于 2.5 微米的颗粒物,它对人体衰弱和环境质量有重要影响。

为了进行显著性测验,钻研人员可能会收集来自不同节令、地区、白天和周日的 PM2.5 程度数据,并应用统计办法来比拟这些数据。罕用的显著性测验办法包含 t 测验、方差分析和卡方测验等。

通过进行显著性测验,钻研人员能够确定不同节令、地区、白天和周日的 PM2.5 程度是否存在显著差别,从而为环境保护和公共衰弱治理提供重要的科学依据。

Season

 
kruskal.test(PM2.5.ug.m3. ~ Season, data = airquality)

Region

Daytime

Season

pairwise.t.tes=="summ

Region

Day of week

Weekends1=seq(3,nrow(airquality),by=7)  
  
Weekends2=seq(4,nrow(airquality),by=7)

wilcox.test(airquality$PM2.5.ug.m3.[airquality$Weekends==0] , airquali

Fig 3. Day to day variations of PM2.5in different seasons, 不同节令 PM2.5 的逐日变动

不同节令 PM2.5 的逐日变动指的是在不同节令中,每天空气中 PM2.5 浓度的变动状况。PM2.5 是指空气中直径小于或等于 2.5 微米的颗粒物,它们能够悬浮在空气中并被人们吸入。PM2.5 来源于工业排放、交通尾气、燃煤、木材焚烧等。

在不同节令中,PM2.5 的逐日变动可能会有所不同。一般来说,秋季和冬季的 PM2.5 浓度绝对较低,而秋季和夏季的 PM2.5 浓度绝对较高。

在秋季,天气和煦,风力较大,降雨较多,这些因素有助于缩小空气中的 PM2.5 浓度。此时,动物成长沉闷,可能排汇大量的二氧化碳和颗粒物,从而污染空气。

冬季的 PM2.5 浓度个别较低,次要是因为低温和强烈的阳光能够减速颗粒物的合成和扩散。此外,冬季也是降雨量较多的节令,雨水能够洗刷空气中的颗粒物。

秋季的 PM2.5 浓度开始回升,次要是因为天气变冷,大气稳固,风力较小,这有利于颗粒物的积攒。此外,秋季还是农作物播种节令,农田焚烧残留物会开释出大量的颗粒物。

夏季是 PM2.5 浓度最高的节令。在夏季,天气凛冽,大气层稳固,风力较小,这导致颗粒物在空气中滞留工夫较长。此外,夏季是取暖节令,燃煤和木材焚烧开释的颗粒物也会减少。

总的来说,不同节令 PM2.5 的逐日变动受到多种因素的影响,包含气温、风力、降雨量、动物成长和人类流动等。理解这些变动有助于咱们采取相应的措施来缩小 PM2.5 的净化。

points(which(airquality$Season=="spring" & airquality$Weekends==1),airq

不同节令 PM2.5 的逐日变动 Diurnal variations of PM2.5in different months

不同节令 PM2.5 的逐日变动是指在不同节令中,每天 PM2.5 浓度的变动状况。PM2.5 是指空气中直径小于或等于 2.5 微米的颗粒物,它们对人体衰弱无害。这些颗粒物次要来自于工业排放、交通尾气、焚烧过程和天然起源等。

在不同节令中,PM2.5 的逐日变动可能受到多种因素的影响。例如,夏季因为采暖需要减少,燃煤和燃气的使用量减少,导致 PM2.5 浓度较高。而冬季因为气温升高,光化学反应增多,加上交通尾气和工业排放的奉献,PM2.5 浓度也可能较高。

此外,气象条件也会对 PM2.5 的逐日变动产生影响。例如,风速、风向、降雨等天气因素都会影响 PM2.5 的扩散和沉降,从而影响其浓度。

因而,不同节令中 PM2.5 的逐日变动是一个动静的过程,受到多种因素的综合影响。通过对这种变动的钻研和监测,能够更好地理解和应答空气质量问题。

grep(date,airquality$ 日期)),]$PM2.5.ug.m3.  
plot(Mar,type="p",col=j,ylab="95% CI")

3- 5 月份

6- 8 月份

9-11 月份

12-2 月份

Correlation coefficient and COD versus distance between the stations 相关系数和 COD 随站间间隔的变动

相关系数是用来掂量两个变量之间的线性关系强度和方向的统计指标。它的取值范畴在 - 1 到 1 之间,其中 1 示意齐全正相干,- 1 示意齐全负相关,0 示意无相关性。

相关系数和站间间隔的变动之间可能存在肯定的关系。如果两个变量之间的相关系数较高(靠近 1 或 -1),则阐明它们之间存在较强的线性关系。在这种状况下,站间间隔的变动可能较小,因为变量之间的关系比较稳定。相同,如果两个变量之间的相关系数较低(靠近 0),则阐明它们之间的线性关系较弱或不存在。在这种状况下,站间间隔的变动可能较大,因为变量之间的关系较为不稳固。

abline(lm(cordata~distdata),col="red")

GAMM 模型剖析温度  湿度,风速 能见度 气压对 PM2.5 的影响

GAMM(Generalized Additive Mixed Models)是一种灵便的统计模型,联合了狭义可加模型(GAM,Generalized Additive Models)和混合模型(Mixed Models)的长处。它能够用于解决蕴含非线性关系和随机效应的数据建模问题。

GAMM 模型次要用于解决长期观测数据和反复测量数据,其中数据可能受到工夫、空间或其余相干因素的影响。GAMM 模型具备以下特点:

  1. 狭义可加模型(GAM)的长处:GAM 模型能够通过非线性平滑函数来建模解释变量与响应变量之间的简单关系,实用于非线性关系的建模。
  2. 混合模型(Mixed Models)的长处:GAMM 模型能够解决数据中的随机效应,比方个体间的差别或层级构造中的变动。
  3. 可解释性:GAMM 模型通过可加函数模型来形容数据,能够直观地解释模型中的每个平滑项的效应。
  4. gamm(PM2.5.ug.m3.~s(平均温度. 摄
summary(b$gam) # gam style summary of fitted model

simple checking plots 模型测验

用 AR1 残差项拟合模型

lme 拟合的细节

拟合模型的 Gam 格调总结

模型测验


最受欢迎的见解

1.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%bb%98%e5%88%b6%e7%94…)R 语言多元 Logistic 逻辑回归 利用案例

2.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%94%9f%e5%ad%98%e5%88…)面板平滑转移回归 (PSTR) 剖析案例实现

3.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e5%a6%82%e4%bd%95%e5%9c…)matlab 中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e4%b8%ad%e4%bd%bf%e7%94…)R 语言泊松 Poisson 回归模型剖析案例

5.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%94%9f%e5%ad%98%e5%88…) R 语言混合效应逻辑回归 Logistic 模型剖析肺癌

6.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80ggplot2%e8%af%af%e5%b7%a…)r 语言中对 LASSO 回归,Ridge 岭回归和 Elastic Net 模型实现

7.[](https://tecdat.cn/r-%e8%af%ad%e8%a8%80%e7%bb%98%e5%88%b6%e5%8…) R 语言逻辑回归、Naive Bayes 贝叶斯、决策树、随机森林算法预测心脏病

8.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e5%a6%82%e4%bd%95%e6%89…)python 用线性回归预测股票价格

9.[](https://tecdat.cn/r%e8%af%ad%e8%a8%80%e4%b8%ad%e7%9a%84%e7%94…) R 语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

退出移动版