量化策略:决策树模型在有色板块仓单数据中的应用
逻辑:针对有色板块中铜、铝、铅、锌、镍、锡六个品种,使用决策树模型进行分箱,得到各品种仓单变化的临界值,当仓单变化大于临界值时,做多该品种,当仓单变化小于临界值时,不持有该品种合约。其中我们将2023年之前的数据作为训练集,2023年及之后的数据作为训练集。二分箱结果从分箱结果来看,针对所有有色品...
浙江农商数字科技申请基于斜决策树的规则挖掘专利,增强对高频特征...
专利摘要显示,本发明提出了一种基于斜决策树的规则挖掘方法和系统,其中,方法包括:获取原始客户数据,对所述原始客户数据进行预处理,构建训练数据集,从训练数据集的数据中提取特征;基于提取的特征和特征交互项构建斜决策树,对所述斜决策树的节点进行分割生成斜决策树模型;根据斜决策树模型生成规则,从生成的规则中筛选可...
李津大局观:Python编程的机器学习,决策树回归模型预测股票价格
李津大局观:Python编程的机器学习,决策树回归模型预测股票价格一、决策树回归模型的机器学习决策树回归主要用于处理连续变量。可以用在股票价格滤波预测上,以下是股票指数运用该原理生成的走势图。二、决策树回归模型的数学原理三、决策树模型python源代码复制粘贴,修改后缀.txt为.py皆可使用,股票价格滤波效果一级...
R语言基于决策树的银行信贷风险预警模型
基于决策树的分类模型有如下几个特点:(1)决策树方法结构简单,,便于理解;(2)决策树模型效率高,对训练集数据量较大的情况较为适合;(3)树方法通常不需要接受训练集数据外的知识;(4)决策树方法具有较高的分类精确度。预警方案设计数据在进行操作的过程中,我们一共分了四步,分别是数据分析和分离数据集,建立训练...
【量化专题】机器学习模型理论—决策树的剪枝
该方法将数据集分为训练数据集和测试数据集,训练数据集用来训练生成决策树模型,测试数据集用来预测决策树模型精度。通过对比剪枝前后决策树模型对测试数据集的预测精度,决定是否进行剪枝处理。如果修剪后的决策树预测精度没有降低,则进行剪枝处理,否则不进行剪枝处理。
【专题研究】KD-Ensemble:基于知识蒸馏的alpha因子挖掘模型
数据预处理包括对输入特征进行去极值、标准化和补充缺失值三个步骤,而提取因子单元则是通过将预处理好后的特征或者残差网络提取得到的特征通过RNN和图模型转化成一系列具有一定选股能力的弱因子,因子加权则是利用决策树对这些不同数据集上生成的弱因子进行短周期非线性加权形成模型最终的个股得分,部分整个流程如下图...
机器学习模型的集成方法总结:Bagging, Boosting, Stacking...
Bagging通常有两种类型——决策树的集合(称为随机森林)和决策树以外的模型的集合。两者的工作原理相似,都使用聚合方法生成最终预测,唯一的区别是它们所基于的模型。在sklearn中,我们有一个BaggingClassifier类,用于创建除决策树以外的模型。##BaggingEnsembleofSameClassifiers(DecisionTrees)...
AI 双雄对决:生成式 AI 与传统 AI 的五大区别
它的核心思想是通过大量的数据进行训练,让模型学会从数据中提取特征,然后根据这些特征进行分类或预测。传统AI包括各种机器学习算法,如决策树、支持向量机(SVM)、逻辑回归等。举个例子,如果想让传统AI识别猫和狗的图片,你需要提供成千上万张标注好的猫和狗的图片。AI会通过学习这些图片的特征(比如猫的尖耳...
难以破解的AI“黑匣子”
模型架构复杂到难以解释尽管许多AI算法背后的数学原理已被人们充分理解,但由这些算法构成的网络所产生的行为,却难以捉摸。ChatGPT、Gemini、Claude、Llama以及任何如DALL-E这样的图像生成器,以及任何依赖神经网络的系统,包括面部识别应用和内容推荐引擎,都面临这样的问题。相比之下,其他AI算法,如决策树或线性回归(...
计算效率提升100倍以上,上交李金金团队开发大模型用于分子动力学
T-AIMD能处理比传统机器学习模型(如支持向量机或决策树)更复杂的数据结构和更大的数据集。该模型能够适应多种类型的材料,并有效预测在不同环境条件(如温度和压力的变化)下的行为。4、模型稳健性T-AIMD在处理带有噪声和不确定性的数据时表现出较高的稳健性。在对比实验中,即使在数据存在轻微偏差的情况下,...