自通用人工智能元年以来,算力集群跨入万卡级别,大模型的颠覆性与复杂性前所未有,对高质量数据需求与日俱增,人工智能技术发展对于数据-算法-算力三大关键要素的深层创新需求全面提升。
同时,在中国“百模千态”百舸争流,挑战与机遇相互影响、环环相扣的变革交织下,系统性创新显得关键而迫切。营造人工智能创新发展的良好生态,需要通过体制机制构建、基础设施建设、场景应用创新等路径激活创新,也需要对数据、算法、算力等三大关键要素进行系统性的产业布局建设。
为深入落实国家“人工智能+”战略行动,2023年5月发布的《北京市促进通用人工智能创新发展的若干措施》提出,加快推动朝阳区建设北京数字经济算力中心,形成规模化先进算力供给能力。北京市酒仙桥地区因“一五”时期创下多个“第一”,为我国电子工业、国民经济发展及国防建设事业作出巨大贡献而被称为“新中国电子工业的摇篮”。如今,这里在建的北京数字经济算力中心是由北京电子数智科技有限责任公司(以下简称“北电数智”)以“AI工厂”理念打造的融合算力基础设施、可信数据空间、AI算力展示、创新孵化与协作空间、科技广场等功能区于一体的首个星火·智算标杆项目,预计落成达产后可实现2000PFLOPS智能算力供给。
以星火·智算为核心承载,北电数智发布一系列创新成果,打造具备AI全栈能力的“中国方案”:推动国产芯片从可用到好用的“前进·AI异构计算平台”;高质量AI工具链“宝塔模型适配平台”;推动数据安全共享、可信流通的“红湖·可信数据空间”;医疗、文化、工业制造等服务国计民生的垂类模型矩阵,充分激活行业应用,推动生态繁荣。
以痛点破题以终为始布局全栈AI
人工智能是大国竞争的基础性、战略性领域之一,是实现高水平科技自立自强的题中应有之义。同时科技创新是长期的过程,唯有创新可以支撑我国人工智能等战略性新兴产业在国际赢得更多主动权。
我国人工智能产业模型层和算力层高度分散,模型百模大战,芯片努力追赶国际先进水平,高质量数据集80%在政企手中,整体来看头部产品相对稀缺。国内无论是算力层、算法层还是数据,目前都是“烟囱林立”的状态。
北电数智战略与市场负责人杨震认为,人工智能时代的新型基础设施建设,并非简单的硬件堆砌,而是需要把“生产线”建设起来,让算力、算法和数据能够在生产线上流动和使用。
北电数智作为国有特大型高科技产业集团北京电子控股有限责任公司所控股的企业,其创立之初就锚定建设数字中国的使命,围绕国家战略性新兴产业加强前沿技术的攻关布局,专注原创性、颠覆性、引领性的人工智能领域科技创新是北电数智的核心定位。
经过对整个产业链条的研究,北电数智认为在国内构筑AI系统需要从基础设施做起。因此,北电数智通过以终为始,深入AI产业的每一层并找到问题所在,围绕算力-算法-数据三大要素进行全栈AI的战略布局,以解决产业链的痛点、难点、堵点。从人工智能可用开始,到如何用、用在哪里,战略布局一步步走实向深。
在算力层,作为算力总规模全球第二的大国,我国始终致力于算力产业的深度布局与战略推进,实施“东数西算”工程等重大举措,持续优化算力资源的空间布局与配置效率,促进算力资源在全国范围内的灵活流动与高效共享。工信部统计,预计到2025年,我国算力总规模将突破300EFLOPS。
然而,粗犷的算力使用、冗余的算力部署、低效的算力调配等问题仍是行业发展亟待解决的难题。同时,当下国内市场数十家GPU厂商竞争激烈,如何帮助国产企业帮助国产芯片找到商业化道路并且发展壮大,跑出自己的加速度是北电数智思考所在。北电数智坚持芯片全栈国产化,通过场景化牵引持续推动AI芯片快速成熟。
找准产业痛点继而对症下药。北电数智推出可实现多种算力纳管和统一调度的前进·AI异构计算平台,解决混元算力的大规模集群能力欠缺、场景化评测平台和异构算力混合使用平台的缺少等困扰,并实现商业模式创新“以评促用”,协同将国产芯片性能提升2~3倍,吞吐量提升6~7倍,持续增强国产异构算力的性能加速与调优能力,确保算力资源能够以最优性价比进行最高效率的供给。
其次,国产自研芯片的性能与国外厂商相比仍显不足,北电数智在模型侧,一方面通过宝塔·大模型适配平台广泛适配底座大模型来提高AI普适化;另一方面,通过聚焦多个国计民生相关领域,提供包括政务、医疗、文化、制造、教育在内的垂类模型矩阵,降低模型使用门槛,助力行业AI创新,加速推动人工智能落地。
在数据层,数据是国家科技创新发展和经济社会发展的重要基础性战略资源。高质量数据的缺乏是当前全世界特别是人工智能大国面临的共同挑战。当前,我国市场90%高质量数据都沉淀在非公开场景和系统中,形成“烟囱”分散在不同领域的头部机构里,面临网络公开数据“不好用”、行业数据“流通少”、公共数据“利用难”等问题。国家数据局发布的《关于加快公共数据资源开发利用的意见》《公共数据资源授权运营实施规范(试行)》,都在大力推动公共数据资源的开发、以市场化机制推动数据交易流通的商业模式。
只有最大限度保护数据提供方的利益才能让数据的拥有者敢于将手中的数据资源投入市场流通,数据供应的生态才会趋向成熟完善。同时,高质量的数据离不开可信、流通、开放的数据空间,为推动建立可信的安全数据机制,营造优质的数据流通可用环境提供解决方案,北电数智的“红湖·AI可信数据空间” 搭载可信数据沙盒,利用“逻辑数仓”等技术导入、修改和删除数据,并通过“隐私计算+区块链”技术,保证数据安全、无泄漏,保证数据的可追溯和透明性,做到“全链条可控”。
在节能降碳方面,2024年底北京数字经济算力中心将完成基础设施建设,其全年综合PUE值预计可达1.146。北电数智通过分析和预测运行高峰和波谷,对冷却、供电等系统进行改进,提高智算中心运维效率,降低能耗成本。同时还把多种绿色低碳的设计贯穿于建筑内外,比如应用“余热回收”技术,实现余热循环利用。
对于我国的大多数政企来说,进入AI领域的门槛不仅是高昂的算力成本,如何打通从大模型到行业模型再到行业应用场景的全链路更是挑战巨大。北电数智的全栈AI服务在简化技术应用门槛的同时,也在推动算力普惠、实现AI可用与落地。
与时间赛跑加速释放全栈AI价值
与时间赛跑,北电数智短时期内的成长速度与带动能力为产业树立起新的标杆——不仅在成立一年多的时间里构建了全栈AI能力,也在推动人工智能时代的新质生产力系统构筑。以科技创新为主导,北电数智聚焦基础前沿和关键核心技术、人力资本、数据要素等,一方面以星火·智算全栈AI能力提供所需的新质生产力,另一方面以产业运营构筑AI生态的新质生产关系。
同时,北电数智汇聚了一支具备创新精神和使命驱动的新质人才队伍,其中以著名人工智能专家窦德景为代表,聚集算力、算法、数据的顶尖技术人才,形成CTO组织,在关键领域发挥自主创新的能力。
中国的人工智能产业发展不仅需要“头雁”领飞,也需要“雁群”高飞。北电数智在努力一起拉动产业、企业在跑,催化行业新生态的形成,让行业进化成为可能。
据了解,北电数智坚持生态聚合的开放策略,致力于联动与协同人工智能产业生态伙伴,向建设数字中国共同迈进。截至目前,北电数智的生态伙伴已广泛覆盖通用机器人与具身智能、车路协同与无人驾驶、辅助诊疗AI智能等明星赛道和高潜领域。
今年,北电数智获批承接北京市先进计算迭代验证平台项目;北电数智所运营的“星火·智算”首个标杆项目——北京市数字经济算力中心正式启动建设,北电数智正式揭榜挂帅北京市政务大模型;北电数智发布全栈AI解决方案与产品,与中日友好医院、北京朝阳医院进行项目签约,将共同探索大语言模型、多模态AI技术、国产AI芯片等在医院的落地应用,为医院提供有力的AI转型支持。
为加强产业生态合作,联合产业上下游伙伴实现协同优化与产业升级,北电数智启动AI江湖系列生态私享会,迄今已经围绕“智能算力”“AI工厂”“未来政务”“具身智能”等热门话题,汇聚不同领域的生态伙伴包括中国工程院、北京大学等科研院所,京东方、华为、新华三、阿里、百度、联通等企业,这些伙伴如同原子般相互碰撞、激荡产生新想法,共同洞察人工智能趋势、共探人工智能产业发展未来。
北电数智已入选北京市集成电路产业重点支持企业,北京数字经济算力中心入选2024全国企业数字化应用创新十佳案例,“前进·AI异构计算平台”(先进计算迭代验证平台)也入选北京首批“人工智能+” 应用场景案例。
谈及其中历程与创新,杨震介绍,“创新不一定是巧劲,也不一定是捷径”。北电数智下了很多笨工夫和苦功工夫,比如为提高开发者的工作效率,也让大模型能在更多国产芯片上跑起来,团队在持续进行算子库的补齐与适配,不断投入算子库开发,但随着芯片的升级一切又得推翻重来,可见工夫投入之大;在模型和开发框架之间,进行普适的适配,让开发者可以自由选择模型和开发框架,从而打破算法层的“烟囱”;在数据层面,推动数据和场景打开;以及这一年多来,北电数智协同优秀的产业生态伙伴,组团出人、出力、出思考,秉持开放心态来推动项目高质量落地等。
星星之火,可以燎原。“星火·智算” 作为AI产业链培育基地,也是北电数智的战略与理念的集大成者,未来将持续在各地开枝散叶。面向未来,北电数智将持续借助星火·智算的全栈AI的设计、运营模式,与生态伙伴共同打造AI解决方案,助力广大政企构筑自己的AI生产线并发展自己的AI转型路径,促进人工智能产业繁荣发展,开拓具有中国特色的AI模式。