亦庄智能院与恺望数据联手发布国内首个“车路云”数据协同平台
2024年9月24日,北京“人工智能之城”北京经济技术开发区(北京亦庄)打造全要素AI原生产业创新高地再加速——由北京亦庄智能城市研究院(简称“亦庄智能院”)建设并运营的北京规模最大公共算力平台、人工智能数据训练基地,与国内领先数据服务公司恺望数据联手打造的国内首个“车路云”数据协同平台正式发布并上线。
由北京市高级别自动驾驶示范区工作办公室(简称“北京自驾办”)指导,恺望数据联合北京国际算力服务有限公司(简称"京算公司")举办的“数智加速度:AI大模型下的数据力量与应用革新”生态大会在北京亦庄举行,近200位智能驾驶及人工智能专家和代表,共同探讨数据在AI大模型背景下的战略价值。
恺望数据在当天宣布将基于数据优势打造AI大模型应用,并发布三大场景的AI应用解决方案。
恺望数据联手京算公司
“车路云”数据协同平台正式上线
北京亦庄正在全面加速打造全域“人工智能之城”。当天,恺望数据与亦庄智能院旗下全资子公司京算公司、车网公司携手,基于“人工智能数据训练基地”打造了全国首个“车路云数据协同平台”,并已正式上线运营。该平台聚焦自动驾驶车端感知数据和车路云智能交通场景,为需方提供高效、安全的智能数据应用服务,不仅提供精准适配和精加工的数据,还提供模型训练所需的GPU算力集群服务,首批项目成交签约合作伙伴包括国汽智控、辉羲智能等生态企业。
“数据、算法和算力是构成人工智能技术的三大核心要素。”北京国际算力服务有限公司总经理助理马光表示,从外部条件来看,目前制约企业大模型发展比较明显的问题是算力和数据,因此建设公共算力平台将解决企业,尤其是创业型企业、小规模企业在发展中购买算力能力不足的问题。
《北京·亦庄全域人工智能之城建设方案》中提到,将在北京“全域创建数据要素市场化配置改革综合试验区”,着力打造国家级数据管理中心、数据资源中心和数据流通交易中心。
其中,按照数据基础制度先行区重点建设“2中心2基地(数据训练基地)”的功能布局,由京算公司运营的人工智能数据训练基地是国内首个正式启用的人工智能数据训练基地,集中承载北京规模最大的智能算力基础设施、人工智能数据标注库和大模型数据训练基地等功能,解决行业中存在的数据流通难、确权难、应用难及合规监管难等痛点,推动高质量数据价值释放。
马光提到,人工智能数据训练基地不仅是一个数据汇聚、清洗和标注的平台,更是构建安全合规数据流通形态的核心载体及高质量数据安全流通的可信基础设施,提供数据可信存储、可信加工、可信交付全流程服务,以及提供基础设施、应用平台和对外门户等基础能力,汇聚生态伙伴数据标注、模型训练、合规评测等工具能力,并通过引入沙盒监管机制为数据流通提供了高效、安全的路径。
恺望已与京算、国汽智控等签订战略合作
围绕“全国首个“车路云数据协同平台”,京算公司、恺望数据、国汽智控、辉羲智能等多方已签订相关战略合作协议,明确未来将在各自需求与优势领域展开合作,围绕“大模型+大数据+大算力”,支持建设北京人工智能数据训练基地,有望将进一步筑牢“高质量数据集—智能算力底座—自主可控算法—示范性应用场景”全要素AI原生产业基础底座,并最大程度提高数据利用效率及实现数据价值。
“车路云数据协同平台通过构建一个安全、合规的数据流通体系,让数据要素发挥最大的价值和效能。”马光表示,人工智能数据训练基地是创新数据流通新模式的探索与实践,要建设以人工智能训练场为载体,以安全合规为核心,以沙盒监管为支撑,以交易应用为目的的新型数据流通形态,“车路云数据协同平台”是数据流通、交易模式创新的首个应用场景,有望在未来推广至更多的人工智能领域,构建多元的智能数据生态格局。
“站在行业已有的数据基础上,通过平台存储、监管和再加工,实现行业数据共享、数据复用的实现,行业效率解决企业的翻倍降本需求,可以助力企业实现‘成本少一半、速度快三倍’的数据应用优势。比如传感器型号、位置、算法的趋同,我们有机会把相似的匹配上,匹配不上的通过微调、2次加工达到个性化结果。”于旭表示,随着该平台的上线运营,未来智能交通领域的数据共享,使数据流通成本得到极大降低及数据的利用效率大幅提升,该“车路云数据协同平台”是结合人工智能数据训练基地理念,在智能交通领域探索的数据服务及新型数据流通形态的创新模式,最大程度提高了数据利用效率。
于旭表示,未来恺望数据仍将发挥在自动驾驶数据服务方面的行业经验与优势,深度参与到国家重要的车路云及人工智能的创新与示范项目探索,共同推动高质量数据价值的释放。