基于DolphinDB的高性能Barra风控模型
Barra模型采用多层次的因子体系,能够更好地捕捉横截面上机构头寸在各种因子(包括市值等风格因子)上的暴露,从而更精细地预测和解释中国股票市场的风险。与传统的时间序列回归模型有所不同,当Barra模型中纳入具有时序记忆的变量时,它还可以共享截面回归和时序回归模型的一些优良性质。目前,我们在DolphinDB中完整实现...
预测模型教程:详解区分度和校准度的SPSS操作
校准度好,提示预测模型的准确性高,校准度差,则模型有可能高估或低估疾病的发生风险。在实际的应用中,通常用Hosmer-Lemeshowgoodoffittest(拟合优度检验)来评价预测模型的校准度。Hosmer-Lemeshow检验的基本思路如下:1.首先根据预测模型来计算每个个体未来发生结局事件的预测概率;2.根据预测概率从小到大进行...
中国城市劳动力市场的双重二元分割——理论模型与实证检验
第一种是“慕尼黑模型”:该模型假定整个德国劳动力市场被分割为三个子市场,其一是“非特定子市场”,或称“任何人的子市场”,进入该市场的劳动力虽然也需要一定的资质,但被替代性极高;其二是“技术子市场”,强调雇员的技术资质;其三是“特定企业子市场”,即某些企业的职位需要特定资质的雇员才能担任(Lutz&Sengen...
技术应用 | 基于大数据的征信评分模型构建与应用
分析模拟结果:研究发现,研究构建的大数据征信评分模型在准确率、稳健性、区分度等方面,都优于传统的征信评分模型,说明研究构建的大数据征信评分模型具有较高的有效性和稳健性,能够更好地反映借款人的信用风险。征信评分模型的应用1.典型场景应用(1)商业银行。在大数据环境下,商业银行可以利用多种数据来源和方法来构...
佳文荐读丨益肺宣肺降浊方抗血管性痴呆的作用机制研究
2.1.5最优机器学习模型筛选参考文献方法,采用Logistic回归基于GSE122063数据集的高风险基因建立机器学习模型。基于“2.1.4”项所得高风险基因和“2.1.2”项所得“normalize”文本,利用R语言的“RandomForest”“Xgboos”“Ggplot2”“Caret”“Kernlab”“DALEX”包建立广义线性模型(generalizedlinearmodel,GLM)、...
高斯混合模型:GMM和期望最大化算法的理论和代码实现
2、最大化步骤(m步):更新模型的参数,以最大化观察数据的对数似然,给定e步骤估计的潜在变量(www.e993.com)2024年11月4日。这两个步骤重复直到收敛,通常由对数似然变化的阈值或迭代的最大次数决定。在GMMs中,潜在变量表示每个数据点的未知分量隶属度。设Z′为随机变量,表示生成数据点x′的分量。Z′可以取值{1,…,K}中的一个,对应于K个...
中金2024年展望 | 贵金属:利率主导,前低后高
基于白银价格三维拆解框架,我们将2010-2022年COMEX白银月度均价和相关指标作为样本内数据,对白银价格中的工业价值、投机价值、避险价值进行了量化拟合,模型拟合优度约为0.95。模型结果显示,2023年1-10月COMEX银价的合理中枢约为21美元/盎司,而实际的价格均值约为23.4美元/盎司。我们认为投机头寸对降息预期的“抢跑”...
中金:2024,黄金“先低后高”
基于白银价格三维拆解框架,我们将2010-2022年COMEX白银月度均价和相关指标作为样本内数据,对白银价格中的工业价值、投机价值、避险价值进行了量化拟合,模型拟合优度约为0.95。模型结果显示,2023年1-10月COMEX银价的合理中枢约为21美元/盎司,而实际的价格均值约为23.4美元/盎司。我们认为投机头寸对降息预期的“抢跑”...
数据并非都是正态分布:三种常见的统计分布及其应用
对于简单地比较两个分类变量各有两个类别的情况(流行病学中的经典2x2表),上述的卡方独立性测试已经足够好。但是当你必须考虑其他因素,如社会经济状态、年龄或种族/性别时,使用逻辑回归更好。形态:卡方分布是一种连续分布,形态不对称,其形状随自由度的增加而逐渐接近正态分布。
【国信策略】ESG 指数和 ESG 基金的比较分析
从拟合优度来看,三因子模型对大多数ESG指数收益率的解释能力都非常高。其中SEEE碳中和指数的拟合优度最低,不到80%;其次是国企“一带一路”和长江保护指数,拟合优度不到90%;其他指数的拟合优度都在95%以上。这说明我们构建的三因子模型是非常合适的。