高考期间,除了考场上奋笔疾书的莘莘学子和考场外的翘首以盼的家长,还有一个忙碌的身影,那就是各个大厂的大模型。押题,写作,答题,它们忙得不亦乐乎,也让大家看到一片欣欣向荣的景象。然而,这一表象的背后却是暗流涌动,甚至硝烟四起。
产品之争,价格往往首当其冲。
5月15日,字节对外宣布豆包大模型正式开启对外服务,豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens,比市场价格低了99.3%、95.8%,并声称已经击穿了大模型行业的底价。
也许是受到豆包大模型的价格刺激,5月21日,阿里云宣布通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens,直降97%。而随后,百度通过官方微信发文称,文心大模型两款主力模型ENIRE Speed和ENIRE Lite全面免费。
随着技术的进步和规模经济的实现,大模型的开发和运维成本可能有所下降,这为厂商提供了降价的空间。而且降价是厂商用来激活市场和吸引用户注意力的一种手段。通过降低价格门槛,厂商可以吸引更多的用户试用其大模型服务,从而增加市场的认知度和接受度,在此基础上进行商业模式的探索。
不管怎样,价格大战反映了我国大模型市场竞争的激烈程度,也反映了大模型技术在我国的商业化进程。这种价格大战可能会为用户带来更多选择和更具竞争力的产品和服务。然而,需要注意的是,价格大战可能会导致一些问题,例如产品与服务质量的降低以及研发投入的减少。
我国大模型的价格大战反映了市场竞争的激烈程度,也表明了我国大模型的商业化程度。近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人工智能支持政策。国务院于2017年发布《新一代人工智能发展规划》,科技部等六部门于2022年印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》对规划进行落实。2024年《政府工作报告》中提出开展“人工智能+”行动。
伴随人工智能领域大模型技术的快速发展,我国不少地方政府出台相关支持政策,加快大模型产业的持续发展。当前,北京、上海、广东、安徽、福建和深圳、杭州、成都等地均发布了AI大模型的相关产业政策。
以上海为例。为深入贯彻国家发展新一代人工智能的战略部署,落实《上海市促进人工智能产业发展条例》,推动上海大模型创新发展,营造通用人工智能创新生态,加快打造世界级人工智能产业集群,上海市经济信息化委、市发展改革委、市科委、市委网信办、市财政局联合制定了《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》,提出要支持引进高水平创新企业,支持本市创新主体打造具有国际竞争力的大模型,鼓励形成数据飞轮,加速模型迭代,对取得重大成果的予以专项奖励。
在技术趋势和政策利好的驱使下,我国大模型产业蓬勃发展。根据相关统计,截至2024年3月,已有117个大模型在中央网信办成功备案,显示出我国大模型发展的迅速和激烈的竞争态势。这些大模型来自不同的地区和企业,其中北京、上海、广东等地的大模型数量占据显著位置,合计占全国大模型总数量的64%。所以,百模大战是名副其实的。
在大模型的发展过程中,政府通过制定政策、优化营商环境、支持大模型重大项目和创新平台等方式,为产业发展提供全方位支撑。同时,企业也积极投入大模型的研发,推出新品,探索产业发展新路径,加快形成人工智能大模型产业竞争优势。但我国大数据产业仍面临算力、数据、应用和能耗等多方面的挑战。
算力瓶颈:随着AI大模型规模的指数级增长,训练大模型越发依赖高性能AI芯片。然而,国内AI高性能芯片市场受进口限制和国内技术瓶颈的双重影响,导致大模型产业发展在算力层面受到制约。主流大模型架构消耗的算力资源较大,对存储设备的要求也更高,这进一步加剧了算力挑战。
数据质量与类型:国内AI大模型数据主要来自互联网、电商、社交、搜索等渠道,存在数据类型不全面、信息可信度不高等问题。可用于大模型训练的中文数据库体量严重不足,这影响了大模型的训练效果和应用范围。
应用场景与商业化:尽管大模型数量众多,但目前我国大模型产业尚未出现爆款级应用。这主要是因为尚未找到明确的商业化思路,缺乏满足客户需求的个性化应用。
能耗问题:大模型对算力的巨大需求也带来了能耗问题。人工智能服务器的功率较普通服务器高,训练大模型所需的能耗是常规工作的数倍,这对能源供应和环境保护带来了挑战。
为了构建健康、可持续和创新的大模型产业生态,我国应在技术创新、数据安全、应用落地、人才培养和国际合作等多个方面下功夫,不断提升我国在大模型领域的竞争力和影响力。
持续推进技术创新是关键。大模型技术的发展日新月异,要想在国际竞争中保持领先地位,我们必须不断加大在算法优化、模型性能提升等方面的研发投入,推动技术创新和突破。同时,也要关注新兴技术的发展趋势,如量子计算、神经形态计算等,以便将这些先进技术应用于大模型领域,进一步提升模型的性能和效率。
加强数据安全和隐私保护至关重要。大模型需要大量的数据进行训练和优化,因此数据安全和隐私保护问题不容忽视。我们应该建立完善的数据安全管理制度和技术防护措施,确保用户数据安全和隐私得到充分保护。同时,也要加强相关法律法规的制定和执行,为数据安全和隐私保护提供有力的法律保障。
推动大模型在各行业的应用落地。大模型技术的应用场景非常广泛,可以应用于自然语言处理、计算机视觉、智能推荐等多个领域。我们应该积极与各行业合作,推动大模型技术在各个领域的应用落地,解决实际问题,提升行业的智能化水平。同时,也要关注不同行业的需求和特点,定制化开发适用于特定场景的大模型解决方案。
培养大模型领域的专业人才。大模型技术的发展需要大量的专业人才支持,包括算法工程师、数据科学家、产品经理等。我们应该加强相关人才的培养和引进工作,建立完善的人才培养体系,为大模型领域的发展提供充足的人才保障。
最后,加强国际合作与交流。大模型技术的发展是全球性的,各国都在积极研究和应用相关技术。我们应该加强与其他国家在技术创新、人才培养、应用落地等方面的合作与交流,共同推动大模型技术的发展和应用。