风险管控 | 城商行数字化审计探索
后台数据端一般包括数据仓库或数据湖,以及相应的数据采集、清洗、管理工具。前端应用端一般是基于B/S架构,构建审计分析系统和审计监测预警系统,将审计思路特征化、模型化、指标化后,为审计人员提供查询、分析、监测和预警功能(如图所示)。数字化审计系统建设的成功与否有两个关键要素。一是上文提到的数据;二是审计思路...
新质生产力在公共资源交易领域的发展路径探讨
其次,应积极推动云计算、大数据、区块链等前沿技术在公共资源交易领域的深度应用,在业务流程关键处埋点,定期归纳收集数据,利用平台数据沉淀,加快构建大数据分析中心和数据仓库,并建设创立公共资源交易指数,运用数据挖掘和分析技术,发挥数据生产力和价值,通过打通数据应用场景,开展数据可视化展示,为政策制定提供依据,提高市场...
奥鹏-南开24秋《商务智能方法与技术》在线作业
24.数据仓库是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的、面向主题及不可更新的数据集合。25.对用户的敏感的原始数据进行变换,以便数据的使用者不能对用户的原始数据进行查看,以此保护用户的私有数据26.数据挖掘并不是一个装在软件包装盒中的工具可以简单的买到并运行在商业智能环境中,也不会...
《银行业数据资产估值指南》发布 明确分类与估值方法
过程类数据资产是通过统计、汇总等加工方法,形成的统一、可复用的数据资产,包括数据仓库(除集市数据)、数据湖、中台、各平台中间层数据。《指南》指出,这类数据资产具有普遍适用性,可以使得后续的深度加工减少重复加工工作,避免资源浪费,具有一次加工多次使用的特性。如数据仓库根据所属数据主题域整合形成的参与人类、机...
陈登坤对话海螺AI:大模型激活另类数据价值(上)
3.数据整合:将来自不同来源和格式的数据整合到一个统一的数据库或数据仓库中,以便进行分析。4.数据分析:使用统计分析、数据挖掘等方法对整合后的数据进行分析,提取有价值的信息和洞察。5.报告和应用:将分析结果整理成报告或应用到决策支持系统中,供决策者参考。
编程入门:九大数据仓库特点比较
IBM、Oracle、Sybase、CA、NCR、Informix、Microsoft、和SAS等有实力的公司相继(通过收购或研发的途径)推出了自己的数据仓库解决方案,BO和Brio等专业软件公司也在前端在线分析处理工具市场上占有一席之地(www.e993.com)2024年12月19日。下面针对这些数据仓库解决方案的性能和特点做分析和比较。
R语言K-Means(K均值聚类)和层次聚类算法对微博用户特征数据研究
鉴于新浪微博在国内具有较大影响力,故本文选取有影响力的新浪微博用户为研究对象,包括大V、电商平台、明星、网红等,从微博用户特征出发,来探索基于用户特征的聚类分析。本研究总共获取了50359条微博数据。数据取值范围指标取值范围是否认证V或N性别男或女粉丝数0,1,2…(非负整数)微博数0,1,2…(...
微信万亿数据仓库架构设计与实现
特征数据收集主要包括:数据接入、特征的计算、特征的存储。在数据仓库还未建立时,业务同学通过消费离线存储mmdata和tdw接入数据,通过Flink流式计算或者自定义模块对数据进行加工,计算出需要的特征,最终存储到自行维护的KV,然后在安全策略平台上编写安全策略,读取KV中的数据,实现需要的安全逻辑。传统特征数据收集流程...
数据信息应具备的三个特性
一是科学建立数据仓库。数据仓库是一个集成、稳定的数据集合,用于支持办案、决策和管理。在建设数据仓库之前,需要明确业务需求,确定需要哪些数据以及如何使用这些数据,并同步考量数据的时效性和稳定性等因素。在确定好技术方案开始实施数据仓库的建设时,要完成数据的采集、清洗、转换和加载等工作。数据清洗方面,原始数据中...
以虚实相融的数智化组织网络赋能基层治理
随着数字化时代的到来,虚拟组织的灵活性、适应性等特点逐步显现,使其与实体组织之间成为互为补充的关系,两者形态会互相转化、流动。在数智化时代,公共部门的虚拟组织呈现出超规模特征。这就需要有智治大脑进行大规模计算、支撑跨层级和条块的超大规模协同。基层智治大脑不是数据仓库,而是以全量采集感知作为基础,提升...