人工智能带来颠覆性改变

2025-02-18 00:00:00
文萃报·周五版 2025年7期
关键词:人工智能模型

2025年初,全球人工智能领域的聚光灯突然转向一家名不见经传的中国初创公司——杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。这家企业凭借一款名为“Deep-SeekV3”的大语言模型引发全球轰动。开源模型正在超越闭源专有模型。这也成为公众关注的焦点。

什么是AI

“人工智能(AI)”自2016 什么是AI年AlphaGo(又名“ 阿尔法狗”,人工智能名称)问世后广为人知。尽管尚无权威定义,人们常将其与科幻电影中的智能机器人相联系,对此既期待能彻底改变生活,又担忧将颠覆人类。

人工智能研究可追溯至古希腊亚里士多德时期。自1956 年约翰·麦卡锡在达特茅斯会议上首提“人工智能”概念以来,AI 领域已历经半个多世纪的风雨。业界普遍将2023 年作为人工智能发展的分水岭。2023 年之前,关于人工智能的技术探索和创新不胜枚举,2023 年AI 大模型的火爆便是无数技术探索与沉淀后的大爆发,而OpenAI 发布ChatGPT 便是点燃了爆发的导火索。

总结2023 的相关政策可以发现,已经涵盖了技术研发、产业应用、数据管理、伦理治理、数据安全、保障措施等多个方面,不仅指明了中国AI 的发展方向,也为中国AI产业发展提供了坚实的政策支撑。

如果将人工智能按照用途进行简单分类的话,AI 其实要被划分为两类:决策式AI 和生成式AI。

决策式AI:专注于分析情况并做出决策。它通过评估多种选项和可能的结果,帮助用户或系统选择最佳的行动方案。例如,在自动驾驶车辆中,就是通过决策式AI 系统决定何时加速、减速或变换车道。

生成式AI:专注于创造全新内容。它可以根据学习到的数据自动生成文本、图像、音乐等内容。例如,你可以将几篇论文发给生成式AI,它可以生成一篇文献综述,囊括了这几篇论文的关键思想、重要结论。

国内外主要人工智能模型介绍

借政策东风,中国掀起的“ 百模大战”盛况空前。根据国家网信办的数据,截止到2024 年11 月,DeepSeek 未火爆出圈之前,我国已有3 批次,共计309 个大模型通过国家互联网信息办公室备案,几乎全面涵盖了各类大模型和应用行业。

ChatGPT ChatGPT由OpenAI 公司研发的一款基于人工智能技术驱动的自然语言处理工具,人们可将其用于对话交互、文本生成、知识问答、文本理解、语言翻译及辅助编程等。其应用广泛,能灵活适应各种需求。国内与其功能相似的有:百度文心一言、阿里巴巴通义千问、紫东太初、讯飞星火认知、华为盘古、Kimi、豆包、智谱清言等大模型。

Sora 由美国OpenAI 发布的人工智能文生视频大模型,于美国时间2024 年2 月15 日正式对外发布。Sora 是集成视频生成、合成及图片生成功能的AI模型。它能据文本描述快速生成高质量视频,提升创作效率;对已存视频进行剪辑、编辑或增删元素,实现智能合成;还能由静态图片生成视频,展现强大创新能力。国内与其功能相似的产品有:可灵、混元、通义万相、智谱清影、字节即梦、海螺等。

AI 能用来干什么

近年来,AI 在深度学习、自然语言处理、计算机视觉等领域取得显著突破,为应用提供强大支撑。未来,多模态AI将成为主流,结合文字、图像、音频、视频,打造全新交互体验;AI大模型将轻量化,降低使用成本,加速商业化落地;AI模型的可控性和可解释性提升,满足各行业及监管需求。

AI 已广泛应用于各行业,未来将进一步拓展深化。在智能制造中,AI 推动生产线智能化、自动化,提高效率和可持续性;医疗健康领域,AI 辅助精准诊断和治疗,加速新药研发;交通出行方面,自动驾驶技术提高道路安全性和通行效率,优化交通管理;金融服务中,AI 提供个性化投资建议和资产管理,优化业务流程;教育领域,AI 定制个性化学习路径,提升教学质量。AI 技术正以前所未有的力量,赋能各行各业,引领全面变革。

DeepSeek的破圈秘诀

从开源创新生态上看,中国大模型中,已有半数以上大模型开源。

当前中国AI 大模型的能力已经基本达到了广泛商用的要求,并且仍在不断进化当中。而进化路线主要有两条:一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品;二是通过优化模型架构适应性和计算效率,获得更具性价比的产品,如70B 参数的模型,通过优化架构和训练策略,可获得接近或超越更大规模模型的性能。

简单一点来理解,第一种是美国科技巨头推行的“算力堆砌”模式,或者叫“大力出奇迹”。而第二种就是DeepSeek的破圈秘诀,通过数据策略、优化架构、工程创新,达成有限资源的极致利用,可以将其理解为“四两拨千斤”。不仅绕过了美国算力封锁,而且极大降低了大模型训练成本,从而降低了客户的使用门槛。

而价格方面,中国大模型价格下降趋势仍在继续。截止到2024 年底,我国典型AI大模型的输入价格下降至0.5元/百万Tokens 以内。再到DeepSeek 的横空出世,一度将百万Tokens 的输入价格拉进“一毛时代”。

AI 技术引发的社会担忧

从ChatGPT到DeepSeek,AI 大模型的流行带来了一系列社会问题,也引发了社会的关注和担忧。

生成式人工智能在虚假信息方面能制作逼真的多媒体内容,可能导致生产虚假新闻、伪造证据的行为,威胁社会秩序和公共安全。同时,深度伪造技术可能用于身份冒充、欺诈等,侵犯隐私和名誉权。该技术还可能被用于制造恶意软件或网络攻击。

在版权与隐私保护上,训练生成式人工智能模型需要大量个人数据,处理不当可能泄露隐私。此外,该技术可能无意中复制受版权保护的作品,引发知识产权纠纷。

伦理道德方面,生成式人工智能可能缺乏人类判断和审查,产生不当内容。为此,各国正加速立法,规定服务提供者和使用者应遵守的基本规范。

能耗方面,生成式人工智能模型训练和使用耗电量巨大。例如,OpenAI 的GPT-3和ChatGPT 耗电量惊人。在我国,主要数据中心耗电量已是三峡年均发电量的3 倍多,对生态环境造成不可忽视的影响。

对人工智能最大的担忧在于引发失业问题。英国公共政策研究所曾警告,多达800 万英国工人面临因AI 而失业的风险,AI已影响11%的工作岗位,高薪工作也将受影响。人工智能对就业带来的结构性冲击,主要表现在被替代者与新增岗位之间的矛盾,引发的是结构性失业。

同时需要监督数字技术的使用方式,防止资方借此压榨劳动者。应合理设定公平考核指标,保障劳动者的基本权益。

(本版稿件综合《人民日报》、央视网、新浪财经等)

猜你喜欢
人工智能模型
一半模型
我校新增“人工智能”本科专业
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
3D打印中的模型分割与打包
下一幕,人工智能!
南风窗(2016年19期)2016-09-21 16:51:29