【行业观察】基于RFM特征聚类的银联某零售场景用户细分研究
K-means算法是一种基于距离划分的聚类算法,旨在通过一种概率性的方式选择初始聚类中心,以保证聚类中心的初始选择更加合理,其核心思想是从海量数据中随机选取出k个数据分别作为k类用户群的起始值,对剩余数据计算到各类用户群的距离,并分配到距离最近的用户群中,并计算将新形成的用户群的平均值作为新的用户集群值,不断...
北京遥测技术研究所2025年博士、硕士研究生招生简章
??非监督学习的基本概念,聚类的准则函数;聚类方法:K-均值聚类,模糊K-均值聚类。2、硕士招生目录中国航天科技集团有限公司第一研究院:中国航天科技集团有限公司第五研究院:2、专业课复习范围和参考书1.信号与系统(903)复习范围:信号;连续时间系统的时域分析;傅氏变换及其应用——滤波、调制与抽样;拉氏变...
30年期国债ETF投资运作机制创新研究
债券ETF采用抽样复制策略的原因有三:一是部分债券指数成分券范围广(如中证短融指数成分券近3000只),组合难以纳入全部成分券;二是部分指数成分券流动性不足,无法满足债券ETF的交易需求;三是指数成分券根据久期、到期收益率、主体评级等因素划分成不同聚类1后,同类成分券风险收益特征接近,相互替代后不改变组合的风险收益...
基于VRP技术的“弹性”送货模式探索与实践
K-均值聚类算法(k-meansclusteringalgorithm)是MacQueen提出的一种非监督实时聚类算法,基本思路是在最小化误差函数的基础上将数据划分为预定的类数K,其原理简单、便于处理大量数据[10]。本文基于K-Means方法来实现配送区域的动态划分。Z烟草公司的客户数量较大,总配送点达7000余个。本文随机抽样100个客户作为实...
药监局印发药品抽检探索性研究原则及程序
2.2除有特殊监管需求外,开展探索性研究的品种遴选参考《药品质量抽查检验管理办法》第十一条规定,组织抽检的药品监管部门应对拟开展探索性研究的品种进行研究,包括确定最少抽检批次数、抽样环节、企业覆盖比例、文号覆盖比例等,以确保抽取的样品具有足够的代表性。
【还不知道你就慢了!纯纯干货!数学建模竞赛最常用的4个算法!】
在数学的广阔天地里,建模是一种非常重要的技能(www.e993.com)2024年10月3日。而要想成功建模,掌握一些常用的算法是必不可少的。今天,我们就来详细介绍一下数学建模中的四大常用算法:蒙特卡洛算法、蚁群算法、遗传算法、聚类算法。蒙特卡洛算法算法介绍:蒙特卡罗方法又称统计模拟法、随机抽样技术,是一种随机模拟方法,以概率和统计理论方法为基础的...
危险的道路:加州,麻省抽样显示美国最终可能走向群体免疫
由于样本并不完美,其不是随机抽样,其分布在几个方面与圣克拉拉县有明显偏差:性别(样本63%是女性,该县是50%);种族(样本8%为西班牙裔,该县是26%;样本19%为亚裔,该县是28%)。以下表格包含未调整样本,人口调整样本和圣克拉拉的人口统计学特征:在研究者未经调整的样本中,IgG或IgM阳性病例总数为50,粗流行率为1....
python深度学习——聚类分析
MiniBatch的好处是计算过程中不必使用所有的数据样本,而是从不同类别的样本中抽取一部分样本(而非全部样本)作为代表参与聚类算法过程。由于计算样本量少,所以会相应减少运行时间;但另一方面,由于是抽样方法,抽样样本很难完全代表整体样本的全部特征,因此会带来准确度的小幅度下降,但是并不明显。
原来聚类分析有软硬,且看中国分型糖尿病
关于糖尿病的分型,在既往的文章中反复多次提到过「基于六种不同变量将糖尿病分成五个亚组」这篇文章LancetDiabetesEndocrinol.2018May;6(5):361-369.,该篇研究基于GAD抗体,BMI,诊断时年龄,HbA1C,HOMA-β功能,HOMA-IR等六种变量进行的聚类分析(硬聚类),将糖尿病分成五个亚组,并验证了不同亚组微...
抽样检验方法的分类及选取原则
整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。先将总体分为i个群,然后从i个群中随机抽取若干个群,对这些群内所有个体或单元均进行抽查。抽样过程可分为以下几个步骤:(1)确定分群的标注;(2)总体(N)分成若干个互不重叠...