AI開(kāi)始為數(shù)字人注入靈魂
2023-05-14 19:10:40 來(lái)源:格隆匯APP
【資料圖】
這幾天,國(guó)內(nèi)“冷門歌手”憑借AI翻唱再度走紅。
B站網(wǎng)友用AI模型生成了歌手孫燕姿的AI分身,其實(shí)跟車載導(dǎo)航上的“林志玲”、“郭德綱”類似。拿歌手本人的音頻去訓(xùn)練,生成一個(gè)音色一模一樣的“孫燕姿”。
然后,讓偶像唱自己喜歡的歌的心愿,就以這樣一種詭異的方式實(shí)現(xiàn)了。
圖源:B站
海外的玩法更加離譜。
美國(guó)一個(gè)擁有180萬(wàn)粉絲的23歲女網(wǎng)紅,通過(guò)用GPT-4復(fù)刻了自己的AI分身,然后同時(shí)與1000多個(gè)網(wǎng)友談戀愛(ài),每分鐘收費(fèi)1美元。
僅一周,她就狂賺了7.16萬(wàn)美元。
并且還遠(yuǎn)不止如此,現(xiàn)在她的“男友”還在急速增加中,目前已經(jīng)增加到了近萬(wàn)人,排隊(duì)等待與她“談戀愛(ài)”時(shí)間已經(jīng)長(zhǎng)達(dá)96小時(shí)。
有分析認(rèn)為,按照趨勢(shì),她月入500萬(wàn)美元沒(méi)有任何難度,如果不是技術(shù)限制,她賺到的錢,將可能是一個(gè)天文數(shù)字。
這些現(xiàn)象已經(jīng)可以充分說(shuō)明,一個(gè)由AI+帶來(lái)的新技術(shù)紅利時(shí)代,正在被急速到來(lái)。
01
數(shù)字人軍團(tuán)涌入直播間
直播帶貨是虛擬IP變現(xiàn)最具潛力的場(chǎng)景。
Z世代對(duì)社交、視頻、網(wǎng)購(gòu)等工具的使用深度遙遙領(lǐng)先于全網(wǎng)平均水平,數(shù)字人和虛擬空間結(jié)合的新玩法給他們帶來(lái)了體驗(yàn)感和交互性,虛擬IP的核心粉絲大多來(lái)自18-24歲的年輕群體。
這一趨勢(shì)讓品牌方看到了讓產(chǎn)品打破圈層的機(jī)會(huì)。
2020年,虛擬歌手洛天依和樂(lè)正綾等來(lái)到淘寶直播間,為博士倫、美的、歐舒丹等品牌帶貨。這場(chǎng)直播觀看人數(shù)高達(dá)270萬(wàn),有近200萬(wàn)人打賞互動(dòng)。
這在當(dāng)時(shí)一度掀起巨大的討論,虛擬數(shù)字人直播的時(shí)代已經(jīng)來(lái)了。
而隨著今年由CHATGPT掀起的人工智能大模型熱潮,虛擬數(shù)字人領(lǐng)域又迎來(lái)一輪更加磅礴的爆發(fā)。
一大批量的虛擬數(shù)字人開(kāi)始扎堆涌進(jìn)直播間。
今年4月份,天娛數(shù)科(行情002354,診股)旗下的虛擬數(shù)字人“朏朏”已完成 ChatGPT 模型接入,并完成直播首秀,不僅能夠?qū)崟r(shí)響應(yīng)顧客的提問(wèn),還能根據(jù)不同問(wèn)題進(jìn)行自主回答。
圖源:抖音
在短視頻上,出現(xiàn)過(guò)很多這樣的場(chǎng)景:一家公司的整個(gè)辦公室里空無(wú)一人,只有一排排辦公桌上有數(shù)十臺(tái)電腦屏幕里的AI美女們正在直播......
圖源:短視頻
這家公司,只靠2D超寫(xiě)實(shí)的虛擬形象,提前準(zhǔn)備好的話術(shù)和背景,就可以直播一天,雖然單個(gè)效果不如真人直播,但成本低到令人發(fā)指,而且還可以超低成本復(fù)制,勝在以量取勝,真正是做到躺著讓AI掙錢也并非不可能。
這一切,在說(shuō)明,一場(chǎng)基于“AI+”的內(nèi)容效率革命,正在數(shù)字人領(lǐng)域爆發(fā)。
虛擬數(shù)字人根據(jù)制作技術(shù)、應(yīng)用場(chǎng)景、形象特點(diǎn)分為很多種。
與3D人氣偶像不同,現(xiàn)在大多數(shù)直播間里說(shuō)話的根據(jù)真人原型復(fù)刻聲音、表情的2D寫(xiě)實(shí)數(shù)字人,你根本分辨不出是真是假,但制作成本遠(yuǎn)低于勇闖娛樂(lè)圈的A-Soul IP們。
一個(gè)虛擬主播可以進(jìn)行7*24全天候的直播工作,隨叫隨到,也不用擔(dān)心人設(shè)翻車的問(wèn)題,減少了直播運(yùn)營(yíng)中的人工成本。
這背后,是AIGC在重新塑造數(shù)字人的生產(chǎn)流程。
2D數(shù)字人的制作用上了深度學(xué)習(xí),只需要確定形象設(shè)計(jì),圖文音頻數(shù)據(jù)經(jīng)過(guò)采集、預(yù)處理后上傳到模型訓(xùn)練,制作方式相對(duì)3D更簡(jiǎn)單,更標(biāo)準(zhǔn)化,制作效能不斷提升。
這種工廠流水線的方式,使數(shù)字人的制作門檻、成本和周期得到了大幅縮短。
同時(shí),隨著行業(yè)制作端的技術(shù)迭代和成本驟降,針對(duì)小型客戶的數(shù)字人解決方案也開(kāi)始涌現(xiàn)。
在4月份,騰訊云發(fā)布的數(shù)字人生產(chǎn)平臺(tái),需要生成真人形象的數(shù)字分身可以在平臺(tái)上采購(gòu)服務(wù),只需上傳圖像音視頻即可實(shí)現(xiàn)定制,根據(jù)不同音色、視頻時(shí)長(zhǎng)收費(fèi)。
除了制作數(shù)字人,還可以提供整套數(shù)字人直播解決方案,功能包括了真人音頻接管直播間,獲取用戶評(píng)論智能回復(fù),定價(jià)僅需要千元級(jí)別。
而有些渠道商,打包售賣AI主播的定價(jià)甚至只要200元以內(nèi)。
這些主播形象大多來(lái)自模特經(jīng)紀(jì)公司的授權(quán),投放質(zhì)量雖然粗糙,摳圖痕跡明顯,聲音也沒(méi)有特點(diǎn)。
但對(duì)普通的中小企業(yè)來(lái)說(shuō),沒(méi)有大V帶貨,花不起上百萬(wàn)定制高端IP,想要壓縮運(yùn)營(yíng)成本, 快速起量,幾千塊的數(shù)字人已經(jīng)夠香了。
數(shù)字人直播間,硅基
企業(yè)如果想要自己修改代碼,產(chǎn)出不同的數(shù)字人,還可以向技術(shù)提供商購(gòu)買源碼,售價(jià)要比直接買AI主播更貴,不僅能自用,還可以使用源碼發(fā)展代理,甚至比自己做數(shù)字人直播還賺錢。
但AI數(shù)字人的故事,還沒(méi)有講完。
02
AI注入靈魂
IDC在《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析》報(bào)告中將數(shù)字人分為五個(gè)等級(jí),目前數(shù)字人發(fā)展經(jīng)歷從手工制作到AI建模的階段,初步具備人的外形,但還只能做簡(jiǎn)單的交互決策。
當(dāng)智能化水平來(lái)到L4、L5級(jí)別時(shí),AI驅(qū)動(dòng)的數(shù)字人能夠接管大多數(shù)場(chǎng)景決策,支持更多模態(tài)的實(shí)時(shí)交互,類似鋼鐵俠的私人AI管家“賈維斯”。
虛擬數(shù)字人過(guò)去三十年的發(fā)展,技術(shù)發(fā)展和市場(chǎng)需求基本圍繞著兩點(diǎn)在演變,一是視覺(jué)效果;二是交互體驗(yàn)。
虛擬數(shù)字人最早出現(xiàn)在游戲、動(dòng)漫、電影里,對(duì)新潮事物的情感連接和IP價(jià)值的延伸遙相呼應(yīng)。
早期的角色型IP使用手繪,動(dòng)作要一張一張地畫(huà)。1982年,日本動(dòng)畫(huà)《超時(shí)空要塞》的女主角林明美成為了首個(gè)發(fā)行音樂(lè)專輯的虛擬歌手。
在電影里,形象可以用計(jì)算機(jī)建模,但動(dòng)作還得讓人來(lái)做,CG技術(shù)和動(dòng)作捕捉等技術(shù)逐漸普及,依靠綠幕,捕捉設(shè)備,演員可以成為任何角色。
千禧年后,從02年的《指環(huán)王》到去年的《阿凡達(dá)2》,角色的渲染效果已經(jīng)細(xì)致入微,為藝術(shù)創(chuàng)作帶來(lái)了巨大便利。
到這里,數(shù)字人技術(shù)的發(fā)展圍繞更像“人”的極限一步步逼近,不僅僅要求外觀、服裝上的視覺(jué)效果趨近真實(shí),還包括驅(qū)動(dòng)(呈現(xiàn)真實(shí)細(xì)膩的表情和動(dòng)作)和渲染(讓畫(huà)面更加精細(xì)實(shí)時(shí))。
不過(guò),總覺(jué)得還是缺了點(diǎn)什么。
1970 年,日本機(jī)器人(行情300024,診股)專家森昌弘提出“恐怖谷”理論,由于機(jī)器人與人類在外表、動(dòng)作上相似,所以人類會(huì)對(duì)機(jī)器人產(chǎn)生正面的情感。
當(dāng)機(jī)器人與人類的相似程度達(dá)到一個(gè)特定程度的時(shí)候,一點(diǎn)點(diǎn)的差別都會(huì)被放大,并帶來(lái)負(fù)面和反感情緒。而當(dāng)機(jī)器人與人類的相似度繼續(xù)上升,人類對(duì)其情感會(huì)再度回到正面。
與電影不同,社交屬性更強(qiáng)的應(yīng)用場(chǎng)景對(duì)數(shù)字人實(shí)時(shí)交互的要求更高,不只是滿足于制作一個(gè)好看的“花瓶”而已。
在交互方面,自然語(yǔ)言模型填補(bǔ)了這一空缺。
文本生成能力已經(jīng)驚艷眾人的GPT,給數(shù)字人的“智商”加上了兩道杠。
NLP大模型是AI驅(qū)動(dòng)虛擬人的技術(shù)基石,簡(jiǎn)單來(lái)講就是讓虛擬數(shù)字人能說(shuō)會(huì)道,減少標(biāo)準(zhǔn)化內(nèi)容的制作成本,被訓(xùn)練來(lái)?yè)?dān)任智能客服、主持人、導(dǎo)游等角色。長(zhǎng)期來(lái)看,隨著個(gè)性化和情感理解的能力提高,為老人提供陪伴關(guān)懷,成為小孩子的”私人教師“也將實(shí)現(xiàn)。
此外,嘴型動(dòng)作也可以由AI驅(qū)動(dòng),建立起與文本的映射關(guān)系,隨著寫(xiě)實(shí)程度的提高,微表情也就更豐富,說(shuō)話的時(shí)候表情、口型能夠?qū)Φ蒙?,這樣的數(shù)字人不僅“形似人”,而且“神似人”。
Midjourney是基于diffusion model擴(kuò)散模型的爆款產(chǎn)品,在去年7月發(fā)布,通過(guò)文本輸入指令訓(xùn)練AI繪畫(huà)。
有機(jī)構(gòu)測(cè)算過(guò),目前其年收入就已經(jīng)能夠達(dá)到1億美元的規(guī)模。
有B站up主用Midjourney復(fù)原了奶奶的寫(xiě)實(shí)形象,從外觀上看,衰老的皮紋和白頭發(fā)細(xì)節(jié)感十足,加上過(guò)去的音頻重現(xiàn)奶奶的聲音,最后通過(guò)D-ID生成了奶奶的數(shù)字分身。
為了彌補(bǔ)未與奶奶好好告別的小遺憾,孫子和眼前的數(shù)字“奶奶”開(kāi)啟了對(duì)話,而“奶奶”親切地回應(yīng),其實(shí)是ChatGPT提供的回答素材。
圖源:B站
正是通過(guò)這些用戶端的越來(lái)越多的嘗試,反過(guò)來(lái)為AI的“人格化”不斷添加海量訓(xùn)練素材,加速豐富AI模型數(shù)據(jù),最終讓AI為數(shù)字人注入靈魂,帶來(lái)更大可能。
03
尾聲
對(duì)虛擬分身的探索至今持續(xù)了三十余年,從手繪到真人驅(qū)動(dòng),再到AI驅(qū)動(dòng),擬真感和交互性的體驗(yàn)進(jìn)步打開(kāi)了廣闊的應(yīng)用場(chǎng)景,涓流匯成大海。
AIGC幫助將普通人的外觀、聲音等特征全面數(shù)字化,更低的制作門檻打開(kāi)了市場(chǎng)的想象空間。
IDC預(yù)計(jì),到2026年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)到102.4億元人民幣,但能夠給我們帶來(lái)多么良好的體驗(yàn),決定了數(shù)字人最終的命運(yùn)。
同時(shí),AI數(shù)字人具備下一代人機(jī)交互入口的潛質(zhì),未來(lái)我們面對(duì)的或不再是冰冷的屏幕,而是生動(dòng)活潑的數(shù)字人類,越能夠挖掘最深層次的情感需求,成為我們生活里的參與者。
或許正如AI教父所言,人類只是智慧演化的過(guò)渡階段,以便創(chuàng)造出數(shù)字智能,如今我們終于有一個(gè)長(zhǎng)得像人類的數(shù)字分身,像我們一樣說(shuō)話,以后或許還能像我們一樣思考。
關(guān)鍵詞:
推薦內(nèi)容
- AI開(kāi)始為數(shù)字人注入靈魂
- 天天微資訊!查八字五行缺什么命_查八字五行缺什么
- 流落柬埔寨的廣西女孩已平安回國(guó),精神狀態(tài)已明顯
- 【解讀民法典】通宵打麻將突發(fā)腦溢血
- 太原:非法回收處置廢舊鉛酸電池,兩人被行政拘留
- 香港佳士得春拍杰作云集外灘,上海觀眾眼界大開(kāi)
- 世界快資訊丨沈陽(yáng)發(fā)布藍(lán)色大風(fēng)預(yù)警。
- 監(jiān)利稅務(wù):“雪中送碳”助力企業(yè)渡難關(guān)|天天微資訊
- 2023湖北“才聚荊楚·創(chuàng)立方”大學(xué)生創(chuàng)業(yè)路演周會(huì)
- 天天即時(shí):我國(guó)汽車出口持續(xù)實(shí)現(xiàn)迅猛增長(zhǎng) 汽車產(chǎn)
- 當(dāng)前速遞!高值醫(yī)用耗材集采陸續(xù)落地:平均降價(jià)84
- 西藏旅游強(qiáng)勁復(fù)蘇
- 新疆伊犁河谷野果林花開(kāi)正盛
- 多措并舉加大生態(tài)保護(hù)力度 促進(jìn)漁業(yè)可持續(xù)發(fā)展-
- 全球快報(bào):構(gòu)成破壞電力設(shè)備罪需要滿足哪些條件
- 新疆開(kāi)行中歐班列數(shù)量再創(chuàng)新高 亞歐“黃金通道”
- 西藏旅游強(qiáng)勁復(fù)蘇
- 夏收拉開(kāi)序幕 機(jī)械化助力農(nóng)業(yè)生產(chǎn)降本增效
- 多措并舉加大生態(tài)保護(hù)力度 促進(jìn)漁業(yè)可持續(xù)發(fā)展-
- 每日熱聞!中國(guó)-中亞峰會(huì)丨西安:千年古都盡顯光影
- 中文在線:公司已在有聲書(shū)生產(chǎn)中應(yīng)用AI主播 世界
- dnf男法師轉(zhuǎn)職外觀_DNF男法師轉(zhuǎn)什么好 今日訊
- 抬頭看!今天黃山上空出現(xiàn)日暈奇觀|每日焦點(diǎn)
- 全球觀天下!山東多地高溫37℃,濟(jì)南一周預(yù)警
- 動(dòng)態(tài):周末去哪摘枇杷?點(diǎn)這里~
- 賈躍亭宣布FF91已生產(chǎn)了40輛,5月底開(kāi)啟首階段交
- 敦煌旅游“火”得早-當(dāng)前關(guān)注
- 嘉魚(yú)枇杷香 引來(lái)浙商采_每日信息
- 環(huán)球精選!國(guó)際護(hù)士節(jié)上演生命“接力” 95后白衣
- 孝昌:生態(tài)茶園成了“網(wǎng)紅打卡地”
- 三峽國(guó)際旅游度假區(qū)項(xiàng)目落戶宜昌點(diǎn)軍|每日簡(jiǎn)訊
- 省級(jí)醫(yī)療專家組團(tuán)來(lái)嘉開(kāi)展公共健康義診-每日聚焦
- “跨界無(wú)感”,長(zhǎng)三角共繪一張“實(shí)景圖”-當(dāng)前簡(jiǎn)訊
- 企業(yè)經(jīng)營(yíng)預(yù)期好轉(zhuǎn)信心增強(qiáng)_世界實(shí)時(shí)
- 首座超15000噸海上鉆采平臺(tái)對(duì)接成功 填補(bǔ)國(guó)內(nèi)技
- [GTAOL]冒險(xiǎn)家 鐵腕經(jīng)典改裝版復(fù)刻 全球今頭條
- 華泰汽車金融破產(chǎn)倒計(jì)時(shí)
- 粵桂產(chǎn)業(yè)協(xié)作讓更多脫貧村“共享”紅利-環(huán)球即時(shí)
- 首座超15000噸海上鉆采平臺(tái)對(duì)接成功 填補(bǔ)國(guó)內(nèi)技
- 這些傳媒股概念股籌碼集中(附名單) 每日頭條
今日推薦
焦點(diǎn)圖
熱點(diǎn)新聞
- 深圳激活“沉睡”政務(wù)數(shù)據(jù) 打造中
- 抓緊申報(bào)!廣州市發(fā)布2021年度對(duì)外
- 粵港澳賽區(qū)參賽隊(duì)獨(dú)攬獎(jiǎng)金 華為軟
- 就業(yè)形勢(shì)喜人!北大匯豐商學(xué)院2022
- 你見(jiàn)過(guò)“賺錢”類App的廣告嗎?遇上
- 深圳:6000萬(wàn)元消費(fèi)券即將發(fā)放餐飲
- “中國(guó)質(zhì)造”吸引外貿(mào)企業(yè)振翅高飛
- 廣州市版權(quán)產(chǎn)業(yè)發(fā)展處于全國(guó)領(lǐng)先地
- 留抵退稅政策落地、紅利加速釋放
- 第五屆進(jìn)博會(huì)籌備工作有序推進(jìn) 簽