电子书上新 |《Data for AI 实践之路:从数据治理到智能应用》
介绍了阿里云DataWorks在湖仓融合数据治理与大模型应用方面的探索。DataWorks作为一站式大数据开发治理平台,支持数据入湖、湖仓融合统一数据开发和数据治理,并通过大模型技术提升数据开发效率。文章还提到了DataWorksCopilot智能SQL编程助手和AI增强分析功能,助力企业数字化转型。蚂蚁集团EB级大数据治理架构与实践分享了...
中国能源行业数字化转型行业市场发展状况及前景趋势分析报告
(1)企业简介(2)企业经营状况及竞争力分析7.2.2阿里云计算有限公司(1)企业简介(2)企业经营状况及竞争力分析7.2.3国电南瑞科技股份有限公司(1)企业简介(2)企业经营状况及竞争力分析7.2.4新华三技术有限公司(1)企业简介(2)企业经营状况及竞争力分析7.2.5百度在线网络技术(北京)有限公司(1...
我用十条优化措施,将Redis费用降本46万/月
作者介绍陈凯玲(“KL博主”):TapTapinfra工程师。开源项目kkFileView等kk系列项目作者,Apollo配置中心项目PMC。优化成果2023年,通过切换低成本的RedisESSD实例、实施流量压缩方案、清理无效数据、治理实例TTL、下线无用实例等措施,自研了Redis流量复制&流量放大、Redis数据迁移、Redis数...
破防了,谁懂啊家人们:记一次mysql问题排查
简单介绍一下出问题的表。一张元数据表,提取出重点部分,抽象出来的结构如下,(id,group,code,name,property1,property2,...)主键primarykey:id唯一键uniquekey:group+code,也就是说在该group内,code是唯一的。此外,我们有一个dataworks离线任务,每天会往该表中写入记录,采用insertignorei...
阿里云助力鱼泡科技重构上亿蓝领招聘模式——以云+AI技术加速蓝领...
基于阿里云一站式实时数据仓库引擎Hologres及云原生大数据计算服务MaxCompute,以及大数据治理开发平台DataWorks,为鱼泡科技提供了离线实时一体化、湖仓一体、分析服务一体、全链路数据治理的云原生一体化数仓解决方案,目前鱼泡网每天可以汇聚数十TB的业务数据,通过数据建模、同步、清洗、分析和挖掘,以毫秒级的时延,保障业务数据...
阿里云以云+AI技术加速鱼泡科技蓝领招聘赛道数字化创新
基于阿里云一站式实时数据仓库引擎Hologres及云原生大数据计算服务MaxCompute,以及大数据治理开发平台DataWorks,为鱼泡科技提供了离线实时一体化、湖仓一体、分析服务一体、全链路数据治理的云原生一体化数仓解决方案,目前鱼泡网每天可以汇聚数十TB的业务数据,通过数据建模、同步、清洗、分析和挖掘,以毫秒级的时延,保障业务数据...
终于有人把阿里云ACP认证介绍明白了!
云计算ACP认证介绍:阿里云云计算专业认证(ACP级-AlibabaCloudCertificationProfessional)是面向使用阿里云云计算产品的架构、开发、运维类人员的专业技术认证,主要涉及阿里云的计算、存储、网络、安全类的核心产品。通过该技术认证可以有效证明该认证人员具备以下能力:具备IT、云计算及网络安全相关从业的基础知识;能够...
关于Data Lake 的概念、架构与应用场景介绍
数据湖(DataLake)概念介绍什么是数据湖(DataLake)?数据湖的起源,应该追溯到2010年10月,由Pentaho的创始人兼CTO,JamesDixon所提出,他提出的目的就当时历史背景来看,其实是为了推广自家产品Pentaho。当时核心要解决的问题是传统数据仓库报表分析面临的两个问题:...
MaxCompute 湖仓一体介绍
DataWorks作为统一的数据开发平台,能够将MC的任务和hadoop任务混编在一个流程中。不但可以统一临时查询入口,发送给不同的引擎。而且可以将不同的引擎作业混合调度。比如数据集成作业,MaxCompute作业以及Hive作业等。二、湖仓一体成功案例介绍某互联网游戏公司的广告算法团队是湖仓一体主要客户,主要应用是机器学习DW+MC+...
使用DataWorks调度DLA循环任务
DataWorks是阿里云上的一款热门产品,可以为用户提供大数据开发调度服务。它支持了DataLakeAnalytics(后文简称DLA)以后,DLA用户可以通过它进行定时任务调度,非常方便。本文将主要介绍如何使用DataWorks调度DLA的循环任务。场景使用DLA对历史数据按天做清洗。数据清洗的SQL是固定的,只是每次执行的时候需要传入不同的日期。