原文链接:http://tecdat.cn/?p=19211

最近咱们被客户要求撰写对于疫情数据的钻研报告,包含一些图形和统计输入。

本文用matlab剖析疫情数据集

数据源

咱们查看解压缩的文件。蕴含:

  • confirmed.csv-确诊病例的工夫序列数据
  • deaths.csv-死亡人数的工夫序列数据
  • recovered.csv-痊愈人数的工夫序列数据

地图上可视化

咱们在地图上可视化已确诊病例的数量。咱们首先加载纬度和经度变量。

opts = detectImportOptions(filenames(4), "TextType","string");

数据集蕴含“省/州”变量,但咱们要在“地区”等级汇总数据。在此之前,咱们须要略微整顿一下数据。

当初,咱们能够应用  groupsummary  将已确认的案例相加并均匀经纬度来按地区汇总数据。

country = groupsummary(times_conf,"Country/Region",{'sum','mean'},vars(3:end));

输入中蕴含不必要的列,例如纬度和经度的总和。咱们删除这些变量。

vars = regexprep(vars,"^(sum_)(?=L(a|o))","remove_");vars = regexprep(vars,"^(mean_)(?=[0-9])","remove_");

<!---->

让咱们应用  geobubble  可视化数据集中的第一个和最初一个日期数据。

<!---->

for ii = [4, length(vars)]    times_conf_exChina.Category = categorical(repmat("<100",height(times_conf_exChina),1));    times_conf_exChina.Category(table2array(times_conf_exChina(:,ii)) >= 100) = ">=100";    gb.LegendVisible = "off";


点击题目查阅往期内容

Python用RNN神经网络:LSTM、GRU、回归和ARIMA对COVID19新冠疫情人数工夫序列预测

左右滑动查看更多

01

02

03

04

美国确诊病例

进入省/州级别。

figuret = tiledlayout("flow");for ii = [5, length(vars)]    gb.BubbleColorList = [1,0,1;1,0,0];    gb.LegendVisible = "off";    gb.Title = "As of " + vars(ii);    gb.SizeLimits = [0, max(times_conf_us.(vars{length(vars)}))];    gb.MapCenter = [44.9669 -113.6201];    gb.ZoomLevel = 1.7678;

能够看到它始于华盛顿,并在加利福尼亚和纽约暴发了大规模疫情。

按确诊病例排名国家/地区

让咱们比拟按国家/地区确认的病例数。日期工夫格局中存在不统一之处,因而咱们一开始会将其视为文本。

opts = detectImportOptions(filenames(3), "TextType","string","DatetimeType","text");

清理日期工夫格局。

Data.nDate = regexprep(Data.Date,"\/20$","/2020");Data.Date = datetime(Data.Date);

咱们还须要标准化“国家/地区”中的值。

Country_Region(Country_Region == "Iran (Islamic Republic of)") = "Iran";

数据集蕴含省/州变量。让咱们在“国家/地区”级别汇总数据。

countryData = groupsummary(provData,{'ObservationDate','Country_Region'}, ...    "sum",{'Confirmed','Deaths','Recovered'});

countryData蕴含每日累积数据。咱们只须要最新的数字。

确认病例按国家/地区的增长

咱们还能够查看这些国家中病例的增长速度。

figureplot(countryData.ObservationDate(countryData.Country_Region == labelsK(2)), ...hold onfor ii = 3:length(labelsK)    plot(countryData.ObservationDate(countryData.Country_Region == labelsK(ii)), ...

只管韩国显示出增长放缓的迹象,但它在其余中央正在减速倒退。

按国家/地区划分的新病例增长

咱们能够通过减去两个日期之间已确认病例的累计数量来计算新病例的数量。

for ii = 1:length(labelsK)    country = provData(provData.Country_Region == labelsK(ii),:);    country = groupsummary(country,{'ObservationDate','Country_Region'}, ...    if labelsK(ii) ~= "Others"        nexttile

您能够看到,中国和韩国没有很多新病例。可见,曾经遏制住了疫情。

咱们来看看仍有多少沉闷病例。您能够通过从确诊病例中减去复原病例和死亡来计算沉闷病例。

for ii = 1:length(labelsK)    by_country{ii}.Active = by_country{ii}.Confirmed - by_country{ii}.Deaths - figure

拟合曲线

无效案例的数量正在降落,曲线看起来大抵为高斯曲线。咱们能够拟合高斯模型并预测流动案例何时为零吗?

我应用  曲线拟合工具箱  进行高斯拟合。

ft = fittype("gauss1");[fobj, gof] = fit(x,y,ft,opts);gof

<!---->

gof =   struct with fields:           sse: 4.4145e+08       rsquare: 0.9743           dfe: 47    adjrsquare: 0.9732          rmse: 3.0647e+03

让咱们通过减少20天来将输入预测。

当初咱们对后果进行绘制。

figurearea(ObservationDate,by_country{1}.Active)hold onplot(xdates,yhat,"lineWidth",2)

韩国

让咱们来查看韩国的沉闷病例,复原案例和死亡人数。

应用高斯模型无奈取得任何适合的后果。


点击文末 “浏览原文”

获取全文残缺材料。

本文选自《matlab用高斯曲线拟合模型剖析疫情数据》。

点击题目查阅往期内容

联合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络工夫序列剖析\
自然语言解决NLP:主题LDA、情感剖析疫情下的新闻文本数据\
联合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络工夫序列剖析\
自然语言解决NLP:主题LDA、情感剖析疫情下的新闻文本数据\
联合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络工夫序列剖析\
用航空公司简单网络对疫情进行建模\
自然语言解决NLP:主题LDA、情感剖析疫情下的新闻文本数据\
疫情下的在线教学数据观\
Fama French (FF) 三因子模型和CAPM模型剖析股票市场投资组合危险/收益可视化\
配对交易策略统计套利量化交易剖析股票市场\
Copula 算法建模相依性剖析股票收益率工夫序列案例\
用COPULA模型进行蒙特卡洛(MONTE CARLO)模仿和拟合股票收益数据分析\
R应用LASSO回归预测股票收益\
金融工夫序列模型ARIMA 和GARCH 在股票市场预测利用\
工夫序列分析模型:ARIMA-ARCH / GARCH模型剖析股票价格\
自然语言解决NLP:主题LDA、情感剖析疫情下的新闻文本数据\
在R语言中应用航空公司简单网络对疫情进行建模\
matlab用高斯曲线拟合模型剖析疫情数据\
R语言ARIMA-GARCH稳定率模型预测股票市场苹果公司日收益率工夫序列\
R语言中的工夫序列分析模型:ARIMA-ARCH / GARCH模型剖析股票价格\
R语言用综合信息准则比拟随机稳定率(SV)模型对股票价格工夫序列建模\
R语言回测交易:依据历史信号/交易创立股票收益曲线\
Python中TensorFlow的长短期记忆神经网络(LSTM)、指数挪动平均法预测股票市场和可视化\
R语言k-Shape工夫序列聚类办法对股票价格工夫序列聚类\
R语言逻辑回归Logistic回归剖析预测股票涨跌\
R语言时变稳定率和ARCH,GARCH,GARCH-in-mean模型剖析股市收益率工夫序列\
R语言中的copula GARCH模型拟合工夫序列并模仿剖析\
R语言多元Copula GARCH 模型工夫序列预测\
R语言ARMA-GARCH-COPULA模型和金融工夫序列案例R语言多元CopulaGARCH模型工夫序列预测R语言乘法GARCH模型对高频交易数据进行波动性预测\
R语言GARCH-DCC模型和DCC(MVT)建模预计\
Python应用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模仿进行股价预测\
R语言工夫序列GARCH模型剖析股市稳定率\
R语言ARMA-EGARCH模型、集成预测算法对SPX理论稳定率进行预测\
matlab实现MCMC的马尔可夫转换ARMA - GARCH模型预计\
Python应用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模仿进行股价预测\
应用R语言对S&P500股票指数进行ARIMA + GARCH交易策略\
R语言用多元ARMA,GARCH ,EWMA, ETS,随机稳定率SV模型对金融工夫序列数据建模\
R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性剖析\
R语言多元Copula GARCH 模型工夫序列预测\
R语言应用多元AR-GARCH模型掂量市场危险\
R语言中的工夫序列分析模型:ARIMA-ARCH / GARCH模型剖析股票价格\
R语言用Garch模型和回归模型对股票价格剖析\
GARCH(1,1),MA以及历史模拟法的VaR比拟\
matlab预计arma garch 条件均值和方差模型\
R语言ARMA-GARCH-COPULA模型和金融工夫序列案例