信用评分模型最关键的6个问题:从理论到实务
(1)首先,我们将原始数据按数值从小到大排序,并将其分为20个等分位组,每组包含5%的数据,计算每个区间内的违约率。(2)鉴于违约样本数量相对较少,我们采用局部回归方法对区间违约率进行平滑处理,以减少噪声的影响。(3)为了满足自变量与因变量之间单调关系的基本假设,在完成变量平滑处理后,我们进一步对变量进行强制单...
国家队的救市逻辑
PanelB展示了因变量为个股增持资金量时的OLS回归结果,与PanelA的结果基本一致,国家队/证金系/汇金系在资金分配上,也是在股灾中跌幅越大、市值越大、股息率越高、股权集中度越高、市场价格敏感度越高的股票上,增持的资金量越大。4.3国家队入市的市场影响4.3.1救市组合的累计超额收益国家队救市的市场反...
线性回归算法:用“线性外推”的思路做预测
可解释性强:可以提供每个特征对目标变量的影响程度,有助于理解变量之间的关系。可扩展性强:可以通过添加交互项、多项式特征等进行扩展,以适应更复杂的数据模式。线性回归算法的缺点:仅适用于线性关系:线性回归假设自变量与因变量之间存在线性关系,对于非线性关系的数据拟合效果较差。对异常值敏感:线性回归对异常值较为...
一文解析:回归算法与分类算法:异同之处深入剖析
回归算法:回归算法主要用于预测一个或多个自变量与因变量之间的数值关系。这种关系通常通过拟合一个最佳函数来描述,使得该函数能够最好地根据已知数据预测未知数据的输出值。回归的目标通常是使得预测值与真实值之间的误差最小。分类算法:分类算法则主要用于预测数据的类别或标签。它通过学习已知数据的特征,建立一个分类...
银行信贷风控专题:Python、R 语言机器学习数据挖掘应用实例合集...
属性可以相应地划分:变量ID一个人的客户ID与贷款之间没有关联,也无法为将来的潜在贷款客户提供任何一般性结论。我们可以忽略此信息进行模型预测。二进制类别具有五个变量,如下所示:个人贷款-该客户是否接受上一个广告系列提供的个人贷款?这是我们的目标变量...
孙一鸣、沈歆:论大数据技术在困境企业重整价值识别中的应用
重整价值分析类似于在重整与清算之间进行选择,适宜采用分类算法(www.e993.com)2024年12月19日。逻辑回归算法是解决分类问题的经典方法,其模型简练、泛化能力强、应用广泛,主要是利用回归函数,首先设定一个阈值,大于阈值归为一类,小于阈值归为另一类,即目标变量是破产企业重整,重整计作1,清算计作0。我们尝试采用逻辑回归解决困境企业重整价值识别的问题...
业界研究方法论的改进方向
8、逻辑回归线性回归解决平均涨幅即赔率问题,逻辑回归将因变量分组,一般设定为0与1,解决上涨概率即胜率问题。9、自变量的选择与分类方法不同类型自变量之间可以结合计算交互效应。宏观经济变量:GDP增速、工业增加值增速、社零增速、固定资产投资增速、房地产销售增速、出口增速、工业企业利润增速、工业库存增速、产能...
2024高考冲刺“锦囊”来了
一、回归教材系统梳理要重视回归教材,可先根据教材章节目录逐个知识点进行“串联式”复习,梳理回顾概念、公式、定理、法则、性质等。遇到不清楚、不确定的问题,立刻查阅课本,及时弥补漏洞。然后将知识序化、类化,即将在必修、选择性必修等不同阶段学到的存在逻辑联系的知识进行系统化,构建知识网络。如:函数知识是高...
周翔|算法规制如何场景化
其一,不同的算法解释技术,将产生不同的算法理解效果。基于用户的立场,算法解释的直接效果是有助于提升用户对算法的自动化决策过程和结果的理解。在其他变量保持不变的前提下,以算法解释所实现的理解程度为因变量,以算法的解释技术类型为自变量,研究两者的相关性。如果算法解释的类型和用户的理解程度之间呈显著的相关性...
机器学习十大算法:从原理到实践的探索
逻辑回归是一种用于分类问题的算法,它通过将原始数据转换为概率形式来解决二元分类问题。该算法通过使用sigmoid函数将线性回归的输出转换为概率值,从而实现分类。逻辑回归在欺诈检测、信用评分和疾病预测等领域有广泛应用。逻辑回归的基本原理是通过构建一个逻辑模型来描述分类问题。假设因变量Y是一个二元分类变量,可以...