加載中...

您的位置：首頁 >金融 > 正文

AI開始為數(shù)字人注入靈魂

2023-05-14 19:10:40 來源：格隆匯APP

【資料圖】

這幾天，國內(nèi)“冷門歌手”憑借AI翻唱再度走紅。

B站網(wǎng)友用AI模型生成了歌手孫燕姿的AI分身，其實跟車載導航上的“林志玲”、“郭德綱”類似。拿歌手本人的音頻去訓練，生成一個音色一模一樣的“孫燕姿”。

然后，讓偶像唱自己喜歡的歌的心愿，就以這樣一種詭異的方式實現(xiàn)了。

圖源：B站

海外的玩法更加離譜。

美國一個擁有180萬粉絲的23歲女網(wǎng)紅，通過用GPT-4復刻了自己的AI分身，然后同時與1000多個網(wǎng)友談戀愛，每分鐘收費1美元。

僅一周，她就狂賺了7.16萬美元。

并且還遠不止如此，現(xiàn)在她的“男友”還在急速增加中，目前已經(jīng)增加到了近萬人，排隊等待與她“談戀愛”時間已經(jīng)長達96小時。

有分析認為，按照趨勢，她月入500萬美元沒有任何難度，如果不是技術限制，她賺到的錢，將可能是一個天文數(shù)字。

這些現(xiàn)象已經(jīng)可以充分說明，一個由AI+帶來的新技術紅利時代，正在被急速到來。

數(shù)字人軍團涌入直播間

直播帶貨是虛擬IP變現(xiàn)最具潛力的場景。

Z世代對社交、視頻、網(wǎng)購等工具的使用深度遙遙領先于全網(wǎng)平均水平，數(shù)字人和虛擬空間結(jié)合的新玩法給他們帶來了體驗感和交互性，虛擬IP的核心粉絲大多來自18-24歲的年輕群體。

這一趨勢讓品牌方看到了讓產(chǎn)品打破圈層的機會。

2020年，虛擬歌手洛天依和樂正綾等來到淘寶直播間，為博士倫、美的、歐舒丹等品牌帶貨。這場直播觀看人數(shù)高達270萬，有近200萬人打賞互動。

這在當時一度掀起巨大的討論，虛擬數(shù)字人直播的時代已經(jīng)來了。

而隨著今年由CHATGPT掀起的人工智能大模型熱潮，虛擬數(shù)字人領域又迎來一輪更加磅礴的爆發(fā)。

一大批量的虛擬數(shù)字人開始扎堆涌進直播間。

今年4月份，天娛數(shù)科(行情002354,診股)旗下的虛擬數(shù)字人“朏朏”已完成 ChatGPT 模型接入，并完成直播首秀，不僅能夠?qū)崟r響應顧客的提問，還能根據(jù)不同問題進行自主回答。

圖源：抖音

在短視頻上，出現(xiàn)過很多這樣的場景：一家公司的整個辦公室里空無一人，只有一排排辦公桌上有數(shù)十臺電腦屏幕里的AI美女們正在直播......

圖源：短視頻

這家公司，只靠2D超寫實的虛擬形象，提前準備好的話術和背景，就可以直播一天，雖然單個效果不如真人直播，但成本低到令人發(fā)指，而且還可以超低成本復制，勝在以量取勝，真正是做到躺著讓AI掙錢也并非不可能。

這一切，在說明，一場基于“AI+”的內(nèi)容效率革命，正在數(shù)字人領域爆發(fā)。

虛擬數(shù)字人根據(jù)制作技術、應用場景、形象特點分為很多種。

與3D人氣偶像不同，現(xiàn)在大多數(shù)直播間里說話的根據(jù)真人原型復刻聲音、表情的2D寫實數(shù)字人，你根本分辨不出是真是假，但制作成本遠低于勇闖娛樂圈的A-Soul IP們。

一個虛擬主播可以進行7*24全天候的直播工作，隨叫隨到，也不用擔心人設翻車的問題，減少了直播運營中的人工成本。

這背后，是AIGC在重新塑造數(shù)字人的生產(chǎn)流程。

2D數(shù)字人的制作用上了深度學習，只需要確定形象設計，圖文音頻數(shù)據(jù)經(jīng)過采集、預處理后上傳到模型訓練，制作方式相對3D更簡單，更標準化，制作效能不斷提升。

這種工廠流水線的方式，使數(shù)字人的制作門檻、成本和周期得到了大幅縮短。

同時，隨著行業(yè)制作端的技術迭代和成本驟降，針對小型客戶的數(shù)字人解決方案也開始涌現(xiàn)。

在4月份，騰訊云發(fā)布的數(shù)字人生產(chǎn)平臺，需要生成真人形象的數(shù)字分身可以在平臺上采購服務，只需上傳圖像音視頻即可實現(xiàn)定制，根據(jù)不同音色、視頻時長收費。

除了制作數(shù)字人，還可以提供整套數(shù)字人直播解決方案，功能包括了真人音頻接管直播間，獲取用戶評論智能回復，定價僅需要千元級別。

而有些渠道商，打包售賣AI主播的定價甚至只要200元以內(nèi)。

這些主播形象大多來自模特經(jīng)紀公司的授權(quán)，投放質(zhì)量雖然粗糙，摳圖痕跡明顯，聲音也沒有特點。

但對普通的中小企業(yè)來說，沒有大V帶貨，花不起上百萬定制高端IP，想要壓縮運營成本，快速起量，幾千塊的數(shù)字人已經(jīng)夠香了。

數(shù)字人直播間，硅基

企業(yè)如果想要自己修改代碼，產(chǎn)出不同的數(shù)字人，還可以向技術提供商購買源碼，售價要比直接買AI主播更貴，不僅能自用，還可以使用源碼發(fā)展代理，甚至比自己做數(shù)字人直播還賺錢。

但AI數(shù)字人的故事，還沒有講完。

AI注入靈魂

IDC在《中國AI數(shù)字人市場現(xiàn)狀與機會分析》報告中將數(shù)字人分為五個等級，目前數(shù)字人發(fā)展經(jīng)歷從手工制作到AI建模的階段，初步具備人的外形，但還只能做簡單的交互決策。

當智能化水平來到L4、L5級別時，AI驅(qū)動的數(shù)字人能夠接管大多數(shù)場景決策，支持更多模態(tài)的實時交互，類似鋼鐵俠的私人AI管家“賈維斯”。

虛擬數(shù)字人過去三十年的發(fā)展，技術發(fā)展和市場需求基本圍繞著兩點在演變，一是視覺效果；二是交互體驗。

虛擬數(shù)字人最早出現(xiàn)在游戲、動漫、電影里，對新潮事物的情感連接和IP價值的延伸遙相呼應。

早期的角色型IP使用手繪，動作要一張一張地畫。1982年，日本動畫《超時空要塞》的女主角林明美成為了首個發(fā)行音樂專輯的虛擬歌手。

在電影里，形象可以用計算機建模，但動作還得讓人來做，CG技術和動作捕捉等技術逐漸普及，依靠綠幕，捕捉設備，演員可以成為任何角色。

千禧年后，從02年的《指環(huán)王》到去年的《阿凡達2》，角色的渲染效果已經(jīng)細致入微，為藝術創(chuàng)作帶來了巨大便利。

到這里，數(shù)字人技術的發(fā)展圍繞更像“人”的極限一步步逼近，不僅僅要求外觀、服裝上的視覺效果趨近真實，還包括驅(qū)動（呈現(xiàn)真實細膩的表情和動作）和渲染（讓畫面更加精細實時）。

不過，總覺得還是缺了點什么。

1970 年，日本機器人(行情300024,診股)專家森昌弘提出“恐怖谷”理論，由于機器人與人類在外表、動作上相似，所以人類會對機器人產(chǎn)生正面的情感。

當機器人與人類的相似程度達到一個特定程度的時候，一點點的差別都會被放大，并帶來負面和反感情緒。而當機器人與人類的相似度繼續(xù)上升，人類對其情感會再度回到正面。

與電影不同，社交屬性更強的應用場景對數(shù)字人實時交互的要求更高，不只是滿足于制作一個好看的“花瓶”而已。

在交互方面，自然語言模型填補了這一空缺。

文本生成能力已經(jīng)驚艷眾人的GPT，給數(shù)字人的“智商”加上了兩道杠。

NLP大模型是AI驅(qū)動虛擬人的技術基石，簡單來講就是讓虛擬數(shù)字人能說會道，減少標準化內(nèi)容的制作成本，被訓練來擔任智能客服、主持人、導游等角色。長期來看，隨著個性化和情感理解的能力提高，為老人提供陪伴關懷，成為小孩子的”私人教師“也將實現(xiàn)。

此外，嘴型動作也可以由AI驅(qū)動，建立起與文本的映射關系，隨著寫實程度的提高，微表情也就更豐富，說話的時候表情、口型能夠?qū)Φ蒙?，這樣的數(shù)字人不僅“形似人”，而且“神似人”。

Midjourney是基于diffusion model擴散模型的爆款產(chǎn)品，在去年7月發(fā)布，通過文本輸入指令訓練AI繪畫。

有機構(gòu)測算過，目前其年收入就已經(jīng)能夠達到1億美元的規(guī)模。

有B站up主用Midjourney復原了奶奶的寫實形象，從外觀上看，衰老的皮紋和白頭發(fā)細節(jié)感十足，加上過去的音頻重現(xiàn)奶奶的聲音，最后通過D-ID生成了奶奶的數(shù)字分身。

為了彌補未與奶奶好好告別的小遺憾，孫子和眼前的數(shù)字“奶奶”開啟了對話，而“奶奶”親切地回應，其實是ChatGPT提供的回答素材。

圖源：B站

正是通過這些用戶端的越來越多的嘗試，反過來為AI的“人格化”不斷添加海量訓練素材，加速豐富AI模型數(shù)據(jù)，最終讓AI為數(shù)字人注入靈魂，帶來更大可能。

尾聲

對虛擬分身的探索至今持續(xù)了三十余年，從手繪到真人驅(qū)動，再到AI驅(qū)動，擬真感和交互性的體驗進步打開了廣闊的應用場景，涓流匯成大海。

AIGC幫助將普通人的外觀、聲音等特征全面數(shù)字化，更低的制作門檻打開了市場的想象空間。

IDC預計，到2026年中國AI數(shù)字人市場規(guī)模將達到102.4億元人民幣，但能夠給我們帶來多么良好的體驗，決定了數(shù)字人最終的命運。

同時，AI數(shù)字人具備下一代人機交互入口的潛質(zhì)，未來我們面對的或不再是冰冷的屏幕，而是生動活潑的數(shù)字人類，越能夠挖掘最深層次的情感需求，成為我們生活里的參與者。

或許正如AI教父所言，人類只是智慧演化的過渡階段，以便創(chuàng)造出數(shù)字智能，如今我們終于有一個長得像人類的數(shù)字分身，像我們一樣說話，以后或許還能像我們一樣思考。

无码狠狠躁久久久久久久网址,四虎永久地址www成人,女人张开腿无遮无挡视频,亚洲熟妇成人精品一区,综合偷自拍亚洲乱中文字幕

AI開始為數(shù)字人注入靈魂

推薦內(nèi)容

今日推薦

焦點圖

百億私募三季度增持40家上市...

創(chuàng)業(yè)板迎來開板13周年 1206...

538家公司前三季度凈利潤翻倍...

乳業(yè)企業(yè)愛上氣泡概念相繼...

熱點新聞

精彩文章

今日看點：天津轄區(qū)召開高素質(zhì)...

无码狠狠躁久久久久久久网址,四虎永久地址www成人,女人张开腿无遮无挡视频,亚洲熟妇成人精品一区,综合偷自拍亚洲乱中文字幕

AI開始為數(shù)字人注入靈魂

推薦內(nèi)容

今日推薦

焦點圖

百億私募三季度增持40家上市...

創(chuàng)業(yè)板迎來開板13周年 1206...

538家公司前三季度凈利潤翻倍...

乳業(yè)企業(yè)愛上氣泡概念 相繼...

熱點新聞

精彩文章

今日看點：天津轄區(qū)召開高素質(zhì)...

推薦閱讀

乳業(yè)企業(yè)愛上氣泡概念相繼...