R语言k-Shape时间序列聚类方法对股票价格时间序列聚类|附代码数据
重复上述步骤1和2,直到集群成员中没有发生更改或迭代次数达到最大值。R语言k-Shape>start<-"2014-01-01">df_7974%>%+filter(date>as.Date(start))#Atibble:1,222x10dateopenhighlowclosevolumeclose_adjchangerate_of_changecode12014-01-061400014330139...
R语言GARCH族模型:正态分布、t、GED分布EGARCH、TGARCH的VaR分析...
由表可知,收益率序列的最小值为-0.03517,最大值为0.03348,平均值为0.0001963,标准差为0.008163353。偏度为-0.4018462,表现为右偏。峰度为2.169439,该分布比正态分布更陡峭。1、正态性检验对指数的日收益率序列进行正态性检验。检验方法采用Jarque-Bera统计量。检验结果显示Jarque-Bera统计量为261.3839,P值接近0,...
【视频】决策树模型原理和R语言预测心脏病实例|数据分享
max_features:在划分节点时所考虑的特征值数量的最大值,默认取None,可以传入int型或float型数据。如果是float型数据,表示百分数。max_leaf_nodes:最大叶子节点数,默认取None,可以传入int型数据。决策树模型的应用场景应用场景:决策树模型适用于非线性关系较为明显的问题,例如:1.房屋价格预测:基于一些特征(如地理...
【视频】CNN(卷积神经网络)模型以及R语言实现回归数据分析
提供一个核和一个步长,合并就相当于卷积,但取每帧的平均值或最大值。扁平化顾名思义,扁平只是将最后的卷积层转换为一维神经网络层。它为实际的预测奠定了基础。R语言实现当我们将CNN(卷积神经网络)模型用于训练多维类型的数据(例如图像)时,它们非常有用。我们还可以实现CNN模型进行回归数据分析。我们之前使用P...
R语言学习 - 热图美化 (数值标准化和调整坐标轴顺序)
上图的测试数据,数值的分布比较均一,相差不是太大,但是Gene_4和Gene_5由于整体的值低于其它的基因,从颜色上看,不仔细看,看不出差别。实际应用中,异常值的出现会毁掉一张热图,如下是一个例子。data<-c(rnorm(5,mean=5),rnorm(5,mean=20),rnorm(5,mean=100),c(600,700,800,900,10000))...
不用R语言,学会这两招,科研小白也能轻松搞定聚类热图的绘制
想必大家对聚类热图Heatmap并不陌生,聚类热图是我们展示基因芯片或测序结果比较常用的方式,可以直观地反映样品间的相似程度(www.e993.com)2024年10月26日。根据基因在各个样本中的表达量绘制的聚类热图,用颜色深浅来代表基因表达量高低。目前绘制热图的工具很多,像MATLAB、MeV(MultipleExperimentViewer)、GraphPadPrism、R语言的Heatmap等等。
R语言地理可视化:中国国内航线航班信息统计、绘制分布夜景图
#计算世界地图的经纬度的最大值woldmap.ma<-aggregate(xworldmap[,c("long.recenter")],by=list(wormap$group)FUN=max)worldmap.md<-cbind(worldma.mea,worldap.in[,2],worldap.max[,2])#给数据的变量名命名
极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR|...
为便于比较,计算了10只股票指数数据的条件风险值(CvaR或估计亏损)。首先,利用数据的时间序列,找到最差的0.95%的跌幅的最大值。然后,通过"高斯"方法计算出估计亏损,这两种计算的结果都以表格形式呈现。ES(s(lD1:2528,2,rp=FAE]),p=0.95,mho="gausn")...
机器学习之确定最佳聚类数目的10种方法
这是Mclust包里面作者定义的“BIC值”,此BIC非彼BIC,这里是作者自己定义的BIC,可以看到,这里的BIC与极大似然估计是成正比的,所以这里是BIC值越大越好,与贝叶斯信息准则值越小模型越好的结论并不冲突2.Nbclust包Nbclust包是我在《R语言实战》上看到的一个包,思想和mclust包比较相近,也是定义了几十个评估指标,然...