钉钉杯大数据竞赛必须熟练的11种数据挖掘算法
对数据类型要求较高,适合数值型数据;可能收敛到局部最小值,在大规模数据上收敛较慢K值比较难以选取;对初值的簇心值敏感,对于不同的初始值,可能会导致不同的聚类结果;不适合于发现非凸面形状的簇,或者大小差别很大的簇。对于”噪声”和孤立点数据敏感,少量的该类数据能够对平均值产生极大影响。克服K-mean...
大数据和机器学习在验证上市公司财务报表真实性的应用研究
区别于财报的报告时间戳(例如20131231),在进行因子研究或者运行模型的时候,就可以有效避免使用未来数据建模,减少数据泄露问题。2.2财务事件标签体系相比于传统的只是对于财务造假违规进行了1/0布尔值的数据采集(只关注了财务报表是否因造假被处罚),本课题从横向和纵向角度丰富了财务事件标签体系。横向上,增加了对一种...
张瑾| 数据驱动未来 技术赋能管理
大数据与小数据之间存在的语义差异,使其难以反映大数据的语义全貌;这意味着小数据会导致决策者做出有限理性决策,进而拉大基于大数据决策与基于小数据决策之间的效果差距。为了破解数据难以“以小见大”的困境,张瑾决定从个体、企业和市场3个典型决策情景出发,逐一破解“大数据—小数据”的应用难题。针对企业舆情管理这一...
陈林:金融支农支小的误区
因此,引入“大数据”,也要重视发掘利用社区“小数据”,这恰恰是民间借贷、合作金融的最大优势。马云看不上的“熟人社会”,恰恰是农村社会及其信用体系的最重要特征。商业机构面向社会公众的信用收集、利用、出售,很容易触犯《个人信息保护法》。而社区小圈子、熟人社会里面流传的“口碑”,并不被禁止,就看如何提炼出来...
大数据时代耕地红线管控监测的机遇与挑战
对于内蒙古农牧交错带以北的戈壁地区、青藏高原、南方丘陵、横断山区等耕地破碎化地区,多套耕地数据的不一致性较大。图2中表明当前12套耕地产品面积与第三次全国国土调查面积整体上具有较强的一致性,但仍呈现显著的区域差异。因此,未来耕地红线的卫星遥感监测工作亟待加强行业标准的制订,提升数据的规范性。
2024年中国大数据产业链图谱研究分析(附产业链全景图)
数据来源:中商产业研究院整理4.城市排名情况从城市梯队和排名情况来看,各城市大数据产业发展的区域差异显著(www.e993.com)2024年11月8日。第一梯队绝对优势明显,引领全国大数据产业发展,依次为北京、上海、深圳、杭州、广州等5个城市,主要集中在东部沿海。第二梯队追赶势头强劲,大数据产业水平持续提升,依次为南京、苏州、武汉、合肥、成都、天津、...
公共卫生学院研究阐释健康医疗大数据在癌症研究中的应用
尽管这些数据的整合显著提高了风险预测模型的准确性,推动了癌症研究和临床实践的进步,但肿瘤大数据仍然面临着诸多挑战。其中包括数据协调、数据缺失、数据存储、数据安全与隐私等问题。数据协调方面的挑战主要源于数据源的异质性、格式不一致和数据质量的可变性。语义差异、时间变异性和伦理道德问题使这一过程更加复杂。数据...
“五经普+”大数据的应用扩展新思路
将经济普查数据与企业工商注册信息等产业大数据结合,对产业规模、结构、产值等分行业的产业空间进行分布识别与评估,能够揭示不同地域的经济发展趋势、产业空间集聚状态、产业结构更新、投入产出变化规律与差异等特征。同时引入专利大数据等专业领域数据进行关联分析,还能辅助区域与企业进行创新能力的评估。
数据资产:逐渐成为企业核心资产之一。全国25个入表案例概览!
据了解,为保障数据资源入表工作的合规性和安全性,金牛城投集团鑫金大数据公司联合数据管理和服务企业、律师事务所、资产评估机构、会计师事务所组成数据资源入表工作组,全面研究分析、论证解决数据盘点、确权估值、入表运营等一系列程序性、合规性、安全性核心问题和风险障碍,以金牛城投内部智慧水务监测数据以及运营数据...
大数据时代,养老服务从智能走向智慧
大数据是数据由量变引起质变的结果,是人类认识世界的新工具。大数据具有分析数据相互作用,从中发现关系,探索规律,创新管理,能够精准认知客观世界和社会发展。一言以蔽之,大数据能够洞察需求、洞察秋毫、洞察重点、洞察趋势、洞察规律。大数据与养老服务根据IDC的预测,全球数据圈将从2018年的33ZB增长到2025年的175ZB,这...