千億市場大有可為 頂流「AIGC」的瘋狂與爭議

2023-09-27 18:26陳春風
台商 2023年3期
关键词:數據演算法領域

陳春風

當下的AI領域,可能沒什麼比AIGC更熱了。各種AIGC應用,包括自動生成文字、圖片、視頻、代碼的「AI打工天團」相繼登場,文案、插畫師、視頻製作人,甚至程式員都陷入「被AI替代」的恐慌。

那麼,AIGC浪潮迭起的背後蘊含著哪些商機?

2022年12月16日,《科學》雜誌發佈了2022年度科學十大突破,AIGC赫然在列。AIGC,全稱為Al-Generated Content,指基於生成對抗網路GAN、大型預訓練模型等人工智能技術,根據已有數據尋找規律,並通過適當的泛化能力生成相關內容的生產方式。

隨著國家政策的傾斜和5G等相關基礎技術的發展,中國人工智能產業在各方的共同推動下進入爆發式增長階段,市場發展潛力巨大。數據顯示,2020年中國人工智能核心產業規模就已達1500億元(人民幣,下同),預計在2025年將達到4000億元,未來有望發展為全球最大的人工智能市場。而AIGC的存在,將會極大釋放人類的想像力,掀起屬於這個時代的「新藝術浪潮」。

風口上的 AIGC

這兩年的AI領域,可能沒什麼比AIGC更熱了。

2022年是浪潮兇猛的AIGC元年,尤其是下半年,AIGC概念突然升溫。有這麼幾個標誌性的事件把AIGC推到了風口浪尖之上,其一是文生圖模型 Stable Diffusion 的開源,其二是ChatGPT的爆火出圈。

◆ AI繪畫神器 Stable Diffusion橫空出世

有人將Stable Diffusion形容為AI界的「神筆馬良」,這可能並不誇張。

Stable Diffusion是一個文本至圖像的模型,於2022年8月22日公開發佈,它能讓數十億人在幾秒鐘內創建出令人讚歎的藝術品。用戶隨意輸入自己想要的文字描述,就能得到相應的圖像結果。

兩個月後,伴隨著Stable Diffusion的開源,它所具備的潛力瞬間得到了極大釋放。開源讓Stable Diffusion將無過濾圖像生成的門檻下放到歷史最低,任何具備一點點技術知識的電腦用戶都能輕鬆上手,可以說是一項老少鹹宜的AI圖像生成工具。

儘管此前,藝術創作AI已經歷了一段時間的發展,但Stable Diffusion的出現才真正讓這項技術得到了騰飛式的發展。因為它可以免費使用、上手快捷,大大減少了用戶生成內容的障礙。

Stable Diffusion掀起了文生圖模型的熱潮。2022年 10 月,百度發佈了首個知識增強的AI作畫大模型 ERNIE-ViLG 2.0;11月初,阿里達摩院在魔搭社區ModelScope上開放了通義文生圖大模型;11月底,智源研究院大模型研究團隊開源最新雙語AltDiffusion模型,中文世界有了專業級AI文圖創作工具,其在視效上媲美Stable Diffusion。

◆ ChatGPT火爆出圈

ChatGPT引爆AIGC奇點。2022年11月30日,OpenAI發佈免費機器人對話模型ChatGPT(GPT-3.5系列),引發AIGC界廣泛關注。該模型中首次採用RLHF(從人類回饋中強化學習)方式,用戶與ChatGPT之間的對話互動內容包括日常聊天、信息諮詢、撰寫文章、修改代碼等,對人類語言的理解能力更強,測試版發佈5天後就擁有超過100萬用戶使用,截至2023年1月末,ChatGPT的月活用戶突破1億,成為史上增長最快的消費者應用。ChatGPT的橫空出世,讓全世界看到了AIGC的強大。

ChatGPT就像是一個無所不知的虛擬體,它能回答各種問題,而且總能給到讓人滿意,甚至超過預期的答案,因此引起了極高的關注度。

ChatGPT展示出的強大的能力和無限可能,讓人們看到,通過ChatGPT這樣的技術方案解決很多任務的潛力。大家感到驚奇的是,在一個模型裏面就可以完成各種任務,而且是很難的任務。在過去一些看似比較困難的任務(比如問倫理道德方面),ChatGPT也能解決得很好。

清華大學教授黃民烈認為,ChatGPT出現對AI界來說,有著十分重要的意義:「它宣示著無縫人機交互時代的來臨。」。

從信息檢索的角度看,ChatGPT也取得了很大突破。達摩院基礎視覺負責人趙德麗表示,以前穀歌等搜索引擎做搜索和檢索,只是找已經存在的信息,ChatGPT的應用,實現了從信息的搜索到信息的創造這樣一個範式的轉變,從演算法能力上看,它取得了一個質的飛躍。

雖然現階段的 ChatGPT並不完美,但整體而言,ChatGPT的出現,從長遠來看的影響力,其實不亞於阿爾法狗曾經在人工智能界帶來的影響力,它將會是一個影響非常深遠的技術和應用。

AIGC為什麼突然火了?

AIGC並不是一個新概念。AIGC,通常還有另一種叫法—AI Creation(人工智能創造),大致從2016年—2017年開始,其應用不斷增加,尤其是在自然語言領域,廣泛應用在生成文本、作詩句、寫對聯等方向,近幾年,逐漸延伸到作畫、作曲等領域。

◆ 技術上的關鍵突破

AIGC突然在全球躥紅,成為人人口中的流行詞。究其原因,主要由多項技術上的關鍵突破推動,總結來說:

一,演算法上:從2022年4月開始,在文生圖視覺方向上,視覺效果生成的效果取得了突破性的進展,文生圖的品質得到了很大改善。OpenAI的文本生成圖像模型DALL·E 2演算法發佈後,在演算法效果上取得了和以往相比實質性的突破,成為一個現象級的演算法,其在文本生成圖像生成的效果、真實度表現上,讓大家看到了大規模商用的前景。AI作畫任務十分直觀,給人的視覺衝擊強烈,使得AIGC逐漸破圈,快速傳播。

二,預訓練大模型是AIGC的底座,沒有大模型學到的豐富知識,就無法實現如此豐富的AI內容生成能力。AIGC最重要的是一種融會貫通的能力,要做領域的泛化,需要學習海量的數據,大模型的規模直接決定了AIGC創作力的廣度。多模態大模型的應用,使得AIGC的品質得到了較為明顯的進步。

三,擴散模型的發展。擴散生成的演算法取得了突破,這個演算法能夠對圖像做像素級別的建模,學習效率更高。Stable Diffusion是文本生成圖像模型完全開源的第一個演算法,它跑起來的效率相當高,其開源也帶動了相關生態快速的發展,讓人們看到,基於這種生成式基礎模型,能夠帶來無限的創造和想像空間。特別是在一些國外社區裏,基於Stable Diffusion做的各種創新式的應用發展快速,展現了商業化潛力。

四,算力降低。深度學習計算能力的快速發展。在大算力的基礎上,AI作畫能夠實現在海量數據上進行大參數模型的訓練。相比之前的AIGC演算法,算力上有了很大降低。要訓練一個基礎的預訓練模型,需要很多算力。一些專注於基礎的大模型的機構,將模型訓練好後,可以供很多小企業使用,只需用消費級的網卡就可以做微調,也可以直接基於API調用。預訓練大模型加上微調可以很好地進行文生圖生成風格的改變,派生出了大量的二次開發者,屢屢破圈。

◆ AIGC相關技術逐步發展成熟

AIGC包括多種內容形式,按照黃民烈的分類方法,分為感知智能和認知智能。(感知類:文生圖、語音生成、音樂生成等;認知類:續寫、改錯、小說故事創作、對話生成等)

從技術上看,寫作相關和圖像生成這兩個方向表現比較成熟,對話最難。

其中在文本生成方面,例如在金融文本摘要生成領域,其技術早已成熟到可以落地的程度。ChatGPT在內容的創作能力、問答流暢度上表現不錯,但要深究其真實性、正確性和時效性,還存在不少問題。如何保證內容的真實性、正確性和時效性,是現在AIGC尤其是文字類的生成需要重點考慮的問題。

圖像生成方面,AI繪畫格外火熱。百度ERNIE-ViLG團隊認為,今年以來,AI作畫發展迅速,很大程度來自於技術的突破,使得效果有了質的飛躍,甚至有些AI圖像作品十分驚豔。

不過,雖然AI繪畫已經進入實用階段,但在技術角度,生成的可控性和細節描述能力依然有很大的優化空間。

AI生成視頻,是AI生成圖像的一種延伸。從技術本質上看,視頻可以認為是多張「圖片」,即視頻幀構成的序列,且序列上各幀之間有畫面、邏輯等層面的關聯。因此,從生成品質上來說,AI生成視頻相對更難。

當前文生圖技術可以通過簡單的技術組合,例如分步驟擴散生成等方式,將生成圖像擴展到生成視頻,但效果還不能令人滿意。此外,受限於數據規模和品質,AI生成視頻的生成效果和現在的文本生成圖像的效果相比,有較大差距。

總結來說,AI按照生成圖像的方式生成視頻,仍處於前沿探索階段。

商業想像力幾何?

現階段,AIGC的生成效果已經非常驚豔了,大家看到,這項目技術已經具備了大規模應用和商業化的潛力和性能,具備了從只能在窄領域到更普遍場景下應用的可能性,雖然在使用上還有較大門檻,但通過大模型的開源開放等,有助於將門檻降下來。

而且可喜的是,現在,AIGC已經有不少可行的商業模式發生了。

◆ 「數字人 +AIGC」

AI技術在消費領域的運用已非常普遍,最近幾年,「數字人 +AIGC」成為不少企業的探索方向。在2022的世界AI會議上,「元宇宙」新聞主播、 AI數字人、VR探索遊戲等現身無疑昭示著這個行業正欣欣向榮。

艾媒數據顯示,虛擬人產業保持穩定增長態勢,2021年,中國虛擬人帶動產業市場規模和核心市場規模分別為1074.9億元和62.2億元,預計2025年分別達到6402.7億元和480.6億元。在市場紅利的驅使下,玩家紛至遝來。

2022年12月16日,「新華社AI合成主播首次對話虛擬人」沖上微博熱搜,新華社AI合成主播受邀加盟江蘇衛視2060,「新小浩」「新小萌」和虛擬動漫人「電視雞」「無限少女」進行了一場史無前例的新聞連線;在2022年北京冬奧會上名聲大噪的冬冬,隸屬阿里巴巴旗下,以冬奧宣推官的身份做「帶貨主播」,協助天貓奧林匹克中國旗艦店推廣奧運特許商品;而百度推出的虛擬人林開開、葉悠悠則作為「暖心」弟弟、姐姐的形象,在百度輸入法中陪網友聊天、「談戀愛」等,給予網友們情感慰藉。

艾媒諮詢CEO兼首席分析師張毅稱,「AI合成人物或者說虛擬人這種業態的出現,主要有以下幾個方面的原因。」 首先是人工智能技術已經比較成熟,可以支撐的方向非常多;其次,不少場景因為一些因素已經到了需要使用虛擬人的階段,比如商業代言、電商直播、電視臺主持等,線民對虛擬人的認可度普遍較高並願意支持其發展。

◆ 實體經濟領域蘊含商機

在互聯網應用之外,AIGC在實體經濟領域,也蘊含著不少機會。

實體經濟對內容生產的需求很大。「我們以前認為實體經濟的瓶頸在於生產、產能,其實不是,實體經濟的很多瓶頸在於設計,在於內容。」 小冰公司 CEO 李笛說。以小冰為例,小冰的AIGC內容很早就應用在紡織設計領域。小冰與中國紡織信息中心、國家紡織產品開發中心推出的AI圖案設計平台,可按需定制 100% 原創的圖案紋樣,目前已有超過 400 家企業註冊,並在生產中使用。

北京智源人工智能研究院總工程師林詠華談到,工業生產、製造、倉儲、物流等實體行業,近幾年一直在探索如何用電腦視覺來進行智能化升級,但實際落地並不容易。原因在於,現有的模型品質還未能滿足產業落地的品質要求。其中一個重要原因是,訓練模型時所用的訓練數據十分局限。因此,可以考慮通過AIGC的方式來產生這些場景裏的訓練數據。例如在倉儲、物流或更多的工業場景,用AI來輔助產生一些少見的場景數據,作為訓練數據的補充,提升整個模型的品質。但這需要更精准的圖片生成的控制能力,比較起現有的AIGC模型能力,其可控性需要大大提升。

AIGC在自動駕駛場景下也有著不錯的應用潛力。現在自動駕駛場景存在訓練數據不足的問題,例如針對惡劣天氣、事故等突發狀況,視覺模型在真實場景中很難捕捉,也難以進行模擬,因此,目前業內在嘗試用數字孿生和仿真的方式來模擬。也可以嘗試用大模型的方式,通過給出描述,生成相應的精確場景,緩解某些場景下自動駕駛數據難獲得的問題。

「整體來看,AIGC現在已經開始在探索向實體經濟的應用發展,但目前還在一個比較早期的階段」 林詠華判斷。

小結

隨著技術日益成熟,產業鏈不斷形成和豐富,人工智能業務模型也將朝著多元化的方向發展,AIGC不斷助力產業升級。目前,虛擬人的應用商業模式雖處於探索階段,但商業應用場景已由最初的數字娛樂場景迅速擴大到各行各業,紅利仍然存在。從B端到C端,從虛擬直播到虛擬偶像,再到虛實結合的多點進發,AI創作的商業價值正被不斷挖掘釋放。在AI技術大發展的當下,人工智能走向何處,又能帶來怎樣的能量,將成為行業下一步的看點。

除此之外,人工智能技術正在快速「進化」,其在人類社會發展道路上的分量也越來越重,隨之而來的,人類與人工智能的和諧共處也成為科技大佬們關注的議題,就如同馬斯克在談及OpenAI的創始初衷所說:「我們要怎樣做才能保證人工智能帶給我們的未來是友好的?」這個問題的答案或許就藏在每個科學家的努力之中。

猜你喜欢
數據演算法領域
最佳背包客
《四庫全書總目》子部天文演算法、術數類提要獻疑
纸杯“飞行器”
单多普勒天气雷达非对称VAP风场反演算法
大數據,創新“數字澳門”建設
星际猎人·考验
时计新风貌
張維迎 企業家的決策一定是超越數據的 否則發明微信的就應該是中國移動
征信行業出路在何方
运动平台下X波段雷达海面风向反演算法