WAIC首日,共达地发布行业首个商用AutoML自动化AI训练平台
9月1日,2022世界人工智能大会(WAIC)在上海顺利开幕。本届大会以“智联世界,元生无界”为主题,汇聚了全球人工智能、元宇宙等前沿科技领域的精英代表和最新成果。
共达地作为AI平台化应用的积极探索者,携新品“GDDi自动化AI训练平台3.0”(以下简称“GDDi3.0”)重磅亮相世博展览馆(展位号:2FA104),吸引往来观众驻足体验。作为行业首个可供“小白”使用的专业AI算法训练平台,观众可通过GDDi3.0体验零代码的专业算法生产过程。在数十分钟内,通过简单三个步骤,从0到1训练一套算法,并在现场一键部署,实时互动,检验算法精度。
超大规模+精细化的AI落地趋势
2019年我国AI摄像头出货量为684万个,预计2022年出货量达3458万,年复合增长率超过70%。但深入到应用场景来看,AI技术的渗透率极低。以落地量最大的安防市场为例,2020年安防摄像头AI渗透率不足5%,其余场景包括制造、医疗、教育等领域的渗透率则更低。
以作为国民经济重要支柱的制造业为例。中国是全世界唯一拥有联合国产业分类中全部工业门类的国家,在世界500多种主要工业产品当中,中国有220多种工业产品的产量占居全球第一。如果计算所有细分工业链条中的完整的工业制品,数量则将如浩瀚星辰般庞大,对应的AI算法需求也将不可估量。但众所周知,AI在工业制造领域落地极为困难。
细究背后的原因,一方面是算法生产的专业门槛极高、周期极长,成本极高,一个成熟算法的生产需要耗费一支15人算法团队数月时间,另一方面是工业制造场景细分极多,对算法要求越来越精细。井喷的碎片化需求与高成本低效率的生产方式之间的矛盾,成为AI与产业联合的死结。
这与共达地在业务一线获取的信息一致。作为专业的算法公司,共达地对接的需求已经远非人脸、车牌这类传统型业务,而是安全帽的识别、反光衣的识别、火焰烟雾的识别等渗透到各类细微场景的需求。且以上场景的需求还能再细分,以火焰识别为例,森林大火和加油站的烟头识别是两种完全不同的算法,场景的光照明暗,物体在摄像机里的尺寸大小,都会影响算法模型的构建。
这些困境共同导致,当前计算机视觉领域90%的市场增长来源于人脸识别、非机动车识别、OCR识别这三大领域。也就是说,在这TOP3领域外的其余计算机视觉算法需求,尚处于待开发、待满足的状态,成为“隐形的长尾市场”。
“GDDi自动化AI训练平台3.0”亮相WAIC
从蒸汽时代到信息时代,人类历史上的每一次技术革命,都引发了生产力的指数级增长。但从目前的情况看,AI还只是一种相对低效的生产力。训练一套算法需要15名专业算法工程师数月时间,这种生产效率现状决定了,AI算法是昂贵的、高门槛的,无法真正成为有普适意义的经济动能。
针对当前供需之间的矛盾,共达地推出“GDDi自动化AI训练平台3.0”(以下简称“GDDi3.0”)。如果把人工智能比作新“电能”,共达地打造GDDi3.0则是一项面向千行百业的电能“平权计划”,通过生产工具的升级实现生产能力的平权,提升生产效率、降低应用成本,加速实现人工智能的规模化商用。
01-门槛低,人人皆可AI
与行业上普遍将AutoML用作专业算法工程师的效率工具不同,GDDi3.0是一套可供政企客户、集成商、业务经理、产品经理等非专业机构和人士使用的行业级生产工具,支持用户以零代码的形式训练可商用算法,门槛极低。
用户只需在定义场景需求后,通过GDDi3.0平台完成1)上传数据;2)选择芯片;3)一键部署,三个步骤即可训练一套适配业务需求的算法。在这个过程中,原本依赖专业算法工程师的数据评估、模型搭建、超参调优、Loss函数与Head等“黑盒”工作,都将由GDDi3.0自动完成,让原本像打造奢侈品一样复杂、繁琐的算法生产工艺,变得和操作流水线一样简单。
02-精度高,能力超过专业人员
GDDi3.0支持99%计算机视觉场景,这意味着绝大多数客户的CV算法需求,GDDi3.0都能满足。且实验数据显示,通过GDDi3.0训练出来的算法平均精度超过92%,表现优于人类算法工程师。
除此之外,在应用过程中,GDDi3.0还能回传终端数据,实现以天为单位的快速迭代,让算法深入场景,实时成长,越用越精准。
03效率高,算法规模化应用基石
供需矛盾背后的核心是生产效率和应用成本的问题。为验证GDDi3.0平台的开发效率,共达地曾安排2名产品经理利用2个月的工作“业余”时间,借助GDDi3.0完成近百个长尾场景算法的训练,且训练精度均达到行业交付标准。同样的工作量,在传统人工智能公司,需要一支专业算法工程师团队数年时间。
从“数人数年”,到“一人数月”,生产效率的大幅提升带来的是算法应用成本的大幅降低。业务数据现实,通过GDDi3.0可使得解决方案整体成本降低90%,这为规模化满足长尾市场的算法需求提供了现实基础。
04部署快,与适配100+主流芯片
在传统生产模式下,算法主要面向云端服务器设计算法结构,应用到终边端时,不仅需要花费大量工时做算法迁移,算法与芯片结构的不适配,还会导致实际算力利用率小于10%,算法精度下降70%左右。
GGDi3.0通过提前适配寒武纪、华为、海思、英特尔、英伟达等百余款主流芯片,使得基于训练平台生产的算法可以提前灵活适配云端服务器、边缘端AIBOX和终端摄像头等硬件形态,并在5秒内一键完成部署,让应用环节极简化。
共达地AutoML自动化AI训练技术赋能千行百业
事实上,在发布新品GDDi3.0前,共达地已经基于领先的产品化、商业化能力,将AutoML自动化AI训练技术应用到多个行业。目前,共达地主要面向行业提供三类服务:一是算法的定制,主要面向需求量小、完全不具备AI能力的客户;二是“算法商城”,即市面上的主流算法需求,可通过共达地算法商城直接采买,一天内即可部署;三是平台服务,即客户可通过共达地AutoML自动化AI训练平台自行建设算法生产能力,适用于算法需求量较大且有一定AI基础的客户。除此之外,共达地还可以辅助提供需求分析、数据服务等,以更完备的产业生态助力客户转型。
以平台服务为例,共达地基于AutoML自动化AI训练平台与专注于计算机视觉深度研发的人工智能公司千视通达成合作,千视通使用共达地AutoML自动化AI训练平台快速生产算法,并通过其深耕多年的行业渠道,将算法集成为行业解决方案交付给终端客户。基于自动化AI训练平台,千视通将算法开发周期从原本数月缩短至了数小时内,并且在常规数据集下算法精度可媲美人类工程师。此外,通过共达地对主流大厂芯片的广泛适配,做到了云/边/端灵活部署,一键下发至设备,并可自动获取现场数据进行低成本的自动持续迭代优化,让精度无限接近理想值。目前,这项合作已广泛落地在智慧交通、智慧园区、智慧金融网点等多个领域,并成功入选信通院2022“人工智能平台应用优秀案例”。
例如,在智慧城市建设中,湖南某步行街需要对撑伞/桌椅占道经营、游摊小贩违规占道经营、垃圾桶满溢识别等场景进行识别,这类需求属于智慧城市建设升级过程中,各省市普遍涌现出来的新需求。
按照传统的操作方式,需要有专门的工作人员完成数据采集、数据标注、模型结构设计、超参调节、芯片适配、迭代优化、部署应用等13大环节,耗费专业算法工程师团队约数年时间才能完成。但通过共达地AutoML自动化AI训练平台,千视通工作人员通过实地监控录像,异地完成了数据的采集与标注,以0代码的方式在数小时内完成了AI能力的建构,并在一周内进行了有效交付。
从实际生活经验出发,步行街这类场景很容易出现意料不到的情况。这类虽然概率很小但一定会出现的现象被称为“长尾效应”。这意味着,算法如果不能适配场景的生长而自生长的话,就会随着应用的逐步深入沦为“人工智障”。在本次湖南某步行街的合作项目中,前端采集的数据能以天为单位回传至共达地自动化训练平台,使算法根据实际场景进行自主学习、快速迭代,越用越聪明,越用越实用。实现“让算法入乡随俗”。
从一支团队团队数年的工作,缩减至一名业务员一周的工作,从“死算法”到“活算法”;此间种种变化,不仅仅是成本的下降和准确率的提升,更是对未来的有力验证——一方面是传统产业普遍实现智能升级,从PPT上的希望变成了可触摸的现实;另一方面是AI产业从理论高空规模化扎根到产业大地中,也从希望变成了可触摸的现实。
再比如,在算法的定制方面,共达地与深圳前海某企业达成合作。该客户下辖数千平米的大型仓库,存放了大规模钢卷以及许多金融机构存放至此的大型保值货物,仅能通过叉车进行挪动,对安全性的要求较高。
若采用传统监控摄像+人力巡检的模式,不仅数千平米仓库需要大量巡检员,费时费力,而且会发生错检漏检,甚至出现之前监守自盗的事故。而这类事故发生时难识别,事后借助录像回溯容易造成巨额损失,故该企业希望引入AI算法,建立起常态化实时监控,识别出未经许可的叉车在货物存放期间,擅自进入存放区域挪动货物的情况,并上报给一位专员管理,防患于未然。
虽然这个项目属于安防领域,但“叉车识别”属于长尾算法,传统AI企业较少涉及,客户无法从现有市场得到现成解决方案。此外,客户可提供训练的数据量较少,且希望快速交付,但传统的AI厂商定制一套算法经常需要数十人团队耗费数月进行手动训练,加上数据量上的门槛,难以满足客户需求。再者,客户没有技术团队可提供支持,不知道如何部署算法,要求最终交付方案的使用门槛极低,但一般AI厂商主要交付算法SDK,客户需要另外寻找硬件进行部署,而部署环节因芯片适配问题导致的算法精度降低、算力浪费又成为一重问题。
共达地基于AutoML自动化AI训练平台,最初仅用企业提供的500多张叉车图片数据,有效提取了关键特征,结合自动化调参,一小时左右初步生成了叉车识别的算法模型。由于共达地已主动适配了十几个主流大厂的近百款芯片,客户无需再寻找其他厂商进行软硬件的集成工作,可直接将新算法一键下发至共达地的边缘端硬件盒子。
在应用过程中,前端以天为单位采集现场数据并回传至共达地AI自动化训练平台进行算法的自主学习、快速迭代,让精度无限逼近实际应用场景的理想值,最终解决了客户的难题。
从AI+产业,到产业+AI
在人工智能商业化发展初期,主要是AI作为领先技术对产业主动发起的探索,即“AI+产业”,主要有两种模式。
一是纵向的解决方案思路,即面向场景需求,提供定制化AI能力,集中实现某个领域的智能化。这种思路在过去几年的发展中创造了AI+安防、AI+金融、AI+社保等领域的盛况,其核心价值在于验证了AI与产业结合的商业价值,让人工智能的发展向前迈出一大步。
另一种是横向的平台思路,即通过面向人智能领域的开发者进行开源,实现行业范围内的技术能力涌现。这种思路让人工智能落地的场景和可能性不再局限于安防、金融等集中场景,AI的开发能力也不再局限于少数人工智能公司,其核心价值在于扩大了人工智能的边界。
但随着产业智能化转型的深入,双方的关系从“AI+产业”扭转为“产业+AI”,即产业界和消费者切实感受到了人工智能作为领先技术带来的强大影响力,并由此涌现出对人工智能的无限想象。
从“AI+产业”到“产业+AI”,并不仅仅意味着产业端意识的觉醒,更意味生产力的“蝶变”和产业关系的“重构”。
从这个角度讲,GDDi3.0的推出,通过面向行业广泛开放零代码式的专业AI开发能力,不只是快速地生产AI,更打破AI供给端、需求端的固定关系,让生产者、中间商、使用者等角色多元融合。
这意味着,从公司层面来说,传统的算法公司也可以通过共达地的平台进行高效地算法训练,以满足复杂场景下的碎片化需求。在这种情况下,AI公司就从单纯的AI生产者,变成了生产者兼使用者。
同样的,产业集成商也能以0代码的形式,从无到有建立自主的AI生产能力,基于多年积累的行业know-how,在中间商这层身份的基础上,增加“AI生产者”的角色。
对于企业主,即传统产业链中的AI购买者、应用者而言,低门槛实现自己的AI构想也变成一件触手可及的事情,既不需要顾虑场景是否太细碎、需求是否太小,也不用担心冗长的周期和高昂的成本。共达地负责将AI开发的难度从专业Photoshop降低到美图秀秀的级别,企业主负责释放业务想象力,这才是产业+AI。
将AI生产能力集成于一个自动化训练平台,人人可用,人人会用,让先进的人工智能力量进入寻常百姓家,就像一款人人皆可下载的APP一样,AIasaService。这就是共达地正在做的事,解放AI生产力,重塑AI生产关系。这种尝试不仅仅是AI商业化的尝试,更是一场社会革新探索,就像教育的普及一样,让每个人、每个产业都具备低门槛拥抱未来的可能。
(来源:新视线)