从“选择困难症”说起:如何让决策树替你做选择?
最大深度(MaxDepth):限制决策树的深度,以避免树过深导致过拟合。最小样本分裂数(MinSamplesSplit):如果一个节点中的样本数少于这个值,则停止分裂。最小叶子节点样本数(MinSamplesLeaf):确保每个叶子节点包含足够多的样本,以避免分裂后产生过于小的叶子节点。信息增益阈值(InformationGainThreshold):如果...
深入浅出:可视化理解揭示决策树与梯度提升背后的数学原理
这是通过将数据点的特征值传递给决策树来完成的。假设我们想用上图中的决策树确定数据点(x??,x??)的标签,根节点将特征x??的值与这里的阈值2.73进行比较。如果x??≤2.73,转向左子节点。否则,转向右子节点。根节点通过直线x??=2.73将特征空间分为两个区域,这条直线是根据阈值定义的。在一个区域中有x...
人工智能为美术创作打开新空间
AI绘画之所以具有如此独树一帜的美学特征,根本原因是AI拥有超强的计算能力、理解能力、自主学习能力和模仿能力。正是这种能力赋予神经网络算法模型生成性,这是早期的决策树等传统AI算法所不具备的显著优势。为了与前三代数字绘画所对应的几何美学、奇观美学和互动美学有所区别,我们将AI绘画所呈现的美学特征定义为计算美学...
施荣盛:统一框架下的沪深300指数增强
比如:决策树模型可以通过多个节点组合出接近线性的分段函数。胡亮勇:量化模型核心在于有效因子储备与迭代,能否详细介绍一下您的因子挖掘方法与选用标准,以及迭代过程?施荣盛:在量化模型的构建中,因子的有效性和不断迭代是持续实现超额收益的核心,是我们平时最主要的工作内容。我们的因子挖掘、筛选、迭代方法依托于多年...
决策树与随机森林算法:可视化的决策过程
忽略特征间的相关性:决策树在生成过程中只考虑了单个特征的重要性,忽略了特征之间的相关性。这可能导致决策树在处理某些问题时效果不佳。难以处理连续型特征:决策树对于连续型特征的处理相对困难,需要进行离散化或采用其他方法进行处理。生成过程不稳定:决策树的生成过程是基于启发式算法的,不同的启发式算法可能生成不...
【量化专题】机器学习模型理论—决策树的剪枝
为了增强模型的泛化能力,应减少决策树的复杂度、对已生成的决策树进行简化,也就是剪枝(www.e993.com)2024年9月14日。剪枝(pruning)算法的基本思路为剪去决策树模型中的一些子树或者叶结点,并将其上层的根结点作为新的叶结点,从而减少了叶结点甚至减少了层数,降低了决策树复杂度。从基本策略上讲,决策树的剪枝分为预剪枝和后剪枝,下边将分别介绍...
钉钉杯大数据竞赛必须熟练的11种数据挖掘算法
决策树是一种可以用于分类与回归的机器学习算法,但主要用于分类。用于分类的决策树是一种描述对实例进行分类的树形结构。决策树由结点和边组成,其中结点分为内部结点和叶子结点,内部结点表示一个特征或者属性,叶子结点表示标签(脑回路图中黄色的是内部结点,蓝色的是叶子结点)。
R语言基于决策树的银行信贷风险预警模型
决策树是数据分析中一种经常要用到且非常重要的技术,既能够用于数据分析,也能够作预测。基于决策树算法的一个最大的优点是它在学习过程中不需要使用者了解很多背景知识,只要训练事例能够用属性即结论的方式表达出来,就能使用该算法进行学习。基于决策树的分类模型有如下几个特点:(1)决策树方法结构简单,,便于理解;(...
AI 与大模型如何助力金融研发效能最大化?
监管在金融机构中扮演着特殊的角色。在监管严格的环境下,金融机构可能不会尝试使用AI或大模型进行深入探索。例如,在风控领域,模型的可解释性至关重要,因为需要向借款人解释为何被拒贷或额度设置的原因,这就是为什么许多银行和金融机构仍然使用决策树,尽管它们可能不是最优模型,但具备可解释性。
智能电网的网络安全风险及应对策略 | 科技导报
针对隐形网络攻击,研究者提出了结合核主成分分析(KPCA)的极端随机树(ERT)算法。对于多种数据完整性攻击,使用K最近邻和决策树(DT)等算法进行攻击分类,准确率达到96.5%;而利用变分模态分解(VMD)和DT算法开发的网络物理异常检测系统,准确率可接近99.9%。区块链技术...