范一飞:数据安全保护刻不容缓 供应链安全可控迫在眉睫(全文)
2020年10月21日 - 新浪
深挖应用场景,运用海量多维数据实现信息整合、特征关联和业务洞察,将单场景信息增益叠加为多场景、网络化、图谱化的高价值数据,释放数据潜能、提升服务效率,做到“能用、会用、善用”数据。三是强化数据保护。遵循“用户授权、最小够用、专事专用、全程防护”原则,充分评估潜在风险,加强数据全生命周期安全管理,综合国家...
详情
判别模型、生成模型与朴素贝叶斯方法
2019年7月6日 - 网易
实际是求出分子即可,分母对y=1和y=0都一样。当然,朴素贝叶斯方法可以扩展到x和y都有多个离散值的情况。对于特征是连续值的情况,我们也可以采用分段的方法来将连续值转化为离散值。具体怎么转化能够最优,我们可以采用信息增益的度量方法来确定(参见Mitchell的《机器学习》决策树那一章)。比如房子大小可以如下划分...
详情
开发者自述:我是如何理解决策树的|节点|纯度|裁剪_新浪科技_新浪网
2017年6月21日 - 新浪
三种公式只需要取一种即可,实践证明三种公司的选择对最终分类准确率的影响并不大,一般使用熵公式。纯度差,也称为信息增益(InformationGain),公式如下:其中,I代表不纯度(也就是上面三个公式的任意一种),K代表分割的节点数,一般K=2。vj表示子节点中的记录数目。上面公式实际上就是当前节点的不纯度减去子节点...
详情