• <code id="mqf9b"><thead id="mqf9b"></thead></code><code id="mqf9b"></code>

    <code id="mqf9b"></code>

  • <listing id="mqf9b"></listing>
    <listing id="mqf9b"></listing>
    訂閱
    糾錯
    加入自媒體

    誰在“操控”虛擬人?

    2023-10-16 15:06
    自象限
    關注

    圖片|動漫《火影忍者》截圖

    ©自象限原創

    作者|程心

    編輯|周游

    大模型的風,吹動虛擬數字人廠商野蠻生長(以下統稱虛擬人)。

    《虛擬數字人深度產業報告》預計,到2030年我國虛擬數字人整體市場規模將達到2700億元,其中,“服務型虛擬人”總規模也將超過950億元。

    如同禿鷹盯上腐肉,嗅到萬億商機的各方勢力,都欲分一杯羹,這也直接導致了目前的虛擬人玩家格局陷入了“混戰”狀態。

    「自象限」根據各方數據不完全統計,目前國內虛擬數字人核心廠商約有6000家。而按天眼查的數據顯示,相關廠商數量甚至超過6萬家。

    同時,隨著大模型(Large Model)的興起,虛擬人的產業格局也在發生深刻變化。

    比如,虛擬人正在經歷從制作流程降本到技術突破的關鍵階段,從大語言模型到多模態能力,讓虛擬人從展示突破到了實時互動,這意味著未來虛擬人可能只需要一個實時渲染的外觀,就能擁有十分逼真的溝通能力。技術門檻的降低,也會讓更多參與方加入到這個開拓中的市場。而狂奔半年后,百億個虛擬人也逐漸滲透進各行各業,并逐步進入商業化階段。

    也就是說,在廠商“混戰”的表面下,隱藏的不僅是巨大的商業利益,更是復雜的技術博弈。而牽動著虛擬人“木偶引線”的另一頭,操控者們的世界也在發生翻天覆地的變化。

    千億市場,廠商“混戰”

    如果說元宇宙時期的虛擬人已經是一把大火,那大模型就相當于在這之上又烹上了一勺油。一瞬間,鋪天蓋地的數字人廠商涌來,將本就復雜的行業攪得愈發渾濁。

    這其中,既包括從元宇宙時期就一直堅持虛擬數字人的廠商,也有依靠全棧技術優勢輕松邁出第一步的大廠,更不乏聞風而來的換道廠商。

    「自象限」初步了統計核心廠商的類型后發現,這些廠商大致可以分為四類:

    ▲圖為自象限原創,轉載請注明出處

    第一類是互聯網大廠,如騰訊、百度、阿里、京東、網易等。這里面其實也分兩類,一類是騰訊、百度為代表,他們業務龐大,在面向To B的解決方案上,比如金融、文旅、汽車等場景,需要一個數字人形象來符合新的交互方式。對于這些企業,數字人只是業務的一個補充。另一類則是網易為代表的,具有技術積累的企業,由于網易在游戲建模、AI捏臉等方面豐富的探索和技術積累,讓他們需要通過虛擬人將這些沉淀的資源轉化。

    第二類是原生廠商。這是較早布局數字人的一批廠商,如即構科技、魔琺科技、硅基智能、風平智能、數字栩生、相芯科技等。這類廠商或屬于上一波元宇宙創業的“遺珠”,或屬于市場早期以電商直播帶貨、本地生活直播等場景切入數字人場景的公司,得益于AIGC技術,其中的一些公司完成了從2D數字人到3D數字人的升級。

    第三類是換道廠商。基于原有技術延伸入局數字人賽道,如:商湯、華為、科大訊飛、快手、360、美圖、蔚領時代、元境科技、新壹科技等。這類廠商在發展過程中積累了一些涉及數字人的技術。譬如商湯的視覺識別技術、科大訊飛的語言識別技術、蔚領時代的游戲渲染技術等等,以這些技術為突破口再結合大模型的發展,完成了賽道的轉換。

    第四類是跨界廠商。他們因為自身業務場景需求而下探數字人技術,如萬興科技、藍色光標、謙尋、高途、中公教育等。這類廠商的特點是其原本業務與數字人并無太大交集,如萬興科技主營業務是提供文圖、剪輯類的基礎工具,衍生出為客戶提供數字人工具;藍色光標的主要業務為廣告業務,通過數字人可以更好的完成客戶的需求;而謙尋則是一家MCN公司。但隨著應用和場景的拓展,數字人成為了其新的發力方向,萬興科技借數字人進一步開拓了海外直播、營銷業務,謙尋借由數字人找尋到了新一輪直播帶貨流量、成交額增長動力。

    源于“出身”的不同,不同廠商的商業模式和目標也完全不同。

    大廠的虛擬人多為服務自身核心戰略而生,比如阿里、京東的虛擬人多被應用在電商領域;騰訊將移動互聯網時代積累下來的RTC(實時通信技術)應用在虛擬人交互中,打造了智影制作平臺;百度希壤更偏向于表演型虛擬人,為不同企業提供定制化代言人;而網易則將虛擬人應用在游戲、教育等多個自身業務中。總的來說,互聯網大廠并沒有急于將虛擬人獨立對外商業化,而是受自身技術的積累和場景需求催生。

    核心對外提供服務的主要是原生的數字人廠商和換道廠商,從上個風口到如今,這類廠商已經積累了數字人的技術經驗,對于底層技術、細節把控和場景的探索都有著更為體系化的認知。根據技術路線的不同,原生廠商又被分為2D廠商和3D廠商,2D廠商更傾向于虛擬人與場景的結合,而3D廠商則處于技術迭代的狀態。

    “2D虛擬人制作有兩種方式,一種是請真人錄制,然后幫其定制形象。一種是從用戶提供的視頻中提取形象,再用到各種場景中。但是2D數字人沒辦法做到3D那樣轉身、跳舞、做各種動作。”即構科技對二者的制作差異進行了詳細解釋。

    但由于2D虛擬人的制作成本低,帶動了整個虛擬人市場“飛入尋常百姓家”,填補了市場由于價格攔路而不能落地的需求鴻溝!缸韵笙蕖沽私獾,目前原廠廠商是大公司和品牌側傾向的選擇,通過行業KA客戶打造標桿案例,比如銀行、大型消費品品牌(健力寶)、美妝品牌(HR赫蓮娜)等等。

    換道廠商和跨界廠商有異曲同工之筆,如商湯、美圖等換道廠商,在上個階段積累了CV、圖像識別等技術,被應用在了虛擬人的制作中,而像藍標、謙尋等公司,源于自身的需求出發,為了避免高昂的采購成本,也選擇自研虛擬人,技術不夠硬核但有固定的客戶群,商業化冷啟動相對迅速。

    產品成熟,重在交付

    今年8月、9月開始,虛擬人廠商產品開始加速迭代。據不完全統計,兩個月內至少有10家廠商發布了新的虛擬人產品。

    產品的高度迭代意味著虛擬人正在飛快得適應市場需求,而這也意味著虛擬人第一階段的賽點已經走入關鍵階段。

    從類型來看,虛擬人廠商分為兩類,一類直接交付虛擬人產品,包括通用虛擬人產品、行業垂直場景的虛擬人產品,比如電商、零售、營銷、直播等,客戶即拿即用,或標準化或定制化;另一類則提供虛擬人制作平臺,客戶通過使用平臺提供的工具,自主生產虛擬人。

    相比之下,產品交付類型更適合企業探索虛擬人初期,幾乎不需要技術團隊配合,門檻更低,也是目前較多企業選擇的方式。

    針對這類產品形式,虛擬人廠商也提供了多樣的購買方案。如汽車試駕一樣,品牌在購買虛擬人之前,可以先可進行Demo的試用,真實感受虛擬人的表情、動作、交互等等。除此之外,品牌在購買前還可以進行方案咨詢,廠商會根據客戶情況,制定具體的虛擬人傳播方案,并有多種不同風格的虛擬人可以選擇。

    以即構虛擬人Avatar為例,企業可選擇擬人形象和Q版形象,并可以在線直接體驗給虛擬人換裝、捏臉,并通過AI完成了表情驅動、聲音驅動、文本驅動、肢體驅動等全方位的驅動方式。

    ▲圖源:即構官網截圖

    提供制作平臺的廠商產品則更加復雜,如魔琺科技的三款產品分別針對了不同場景進行,包括虛擬視頻、虛擬人直播和獨立的虛擬人服務,并且在后端打造了端到端的寫實3D虛擬人工業化產線,包括從技術到調試到運營的“星云平臺”,讓虛擬人能夠和大模型結合,長出“腦子”,真正實現3D交互。

    ▲圖源:魔琺科技發布會

    今年8月,魔琺科技升級了有言AIGC生成平臺、有光直播帶貨平臺和有靈虛擬人制作平臺,為企業提供系列生成工具,企業根據自身需求,能夠更加靈活的調整虛擬人的細節、結構和適配的使用場景。

    相比之下,商湯既能夠直接交付虛擬人產品,也打造了如影虛擬人制作平臺,基于在視覺、語音領域積累的3萬個算法模型,打造了集智能化生成、智能化驅動、智能化交互的數字人平臺。在商湯智能化引擎驅動下,虛擬人能快速識別、反應,與用戶建立起對話關系。并且,事后,虛擬人也不會“失憶”,繼續學習迭代。

    這也說明了,當下廠商不僅是商業模式上的競爭,更是技術先進性的比拼。

    技術”三級跳“

    從整個虛擬人的技術發展進程來說,大模型帶來最核心的改變,是推動著虛擬人從第一階段看起來“像人”,到能夠與人實時互動。

    ▲圖為自象限原創,轉載請注明出處

    第一階段,虛擬人廠商比拼的是“誰看起來更像人”?虛擬人廠商的核心技術多在傳統的CG(建模)技術、驅動技術、渲染引擎等等,所以虛擬代言人為代表的表演型虛擬人成為了核心交付產品。

    但由于技術的不成熟導致了虛擬人制作成本高企,「自象限」從行業內人士了解到,2022年,某大廠提供的訂制虛擬人價格高達10萬,這讓虛擬人根本無法規;涞。

    大模型來了之后,一方面讓虛擬人制作成本進行了大幅度降低;另一方面,AI技術加速了虛擬人的交互功能,讓虛擬人交互起來更像人。

    某虛擬人制作廠商曾吐槽:“以前6888元一個,賣一個賠一個”,通過智能渲染、智能驅動,流程自動化制作等能力,讓虛擬人的制作成本有了30%-50%的縮減,市面上甚至冒出了“99元、299元一個的虛擬人”。

    更重要的是,大模型技術加速了虛擬人對語言語義的理解能力,讓虛擬人能夠從簡單的檢索生成,到語言文字AI驅動,更快速的對人的需求進行回復,甚至做到“秒回”,同時模型也驅動了渲染技術、擬真技術、超寫實技術的進化。

    舉個具體的例子:交互的核心并不只是動作反饋,更是內容的生成和語音的交流,故而,AIGC技術和語音生成技術成為了當下技術發展的核心。

    ▲圖源:網絡

    大模型讓虛擬人“長了腦子”,有了思考和推理能力,AIGC技術讓虛擬人能夠有“想法”,TTS(Text To Speech 文本轉語音技術)技術則讓虛擬人能夠“表達”。

    幾天前,在GPT-4V版本更新,TTS實現了進步,文本驅動語音有了語氣和口吻,在停頓、重音和自然交互程度上有了極大的提升。不僅可以模仿不同的口吻,甚至設定“渣女”時還學會了“夾子音”。

    有行業專家推測:TTS技術端到端成熟后,對行業格局的改變會很大。因為虛擬人真的能夠實時交互后,落到產業里才能產生實際價值。

    從看起來像人,到實時互動,大模型推動著虛擬人完成二級階躍,但這也只是一個新的開始。從元宇宙到大模型時代,虛擬人真正備受關注的內在原因在于,他將有可能是下一個虛擬時代的“入口”,背后連接著新的虛擬世界,入口屬性讓其變的既性感又危險。

    國外最早布局虛擬人的微軟小冰CEO李笛則認為:虛擬人未來是混合模型。

    本質上,這兩種觀點的內核是一致的,只不過李笛的假設更為具體。下一階段,將進入“虛擬人+”的階段,虛擬人+RPA在企業內部打造數字員工;虛擬人+AI Agent,在C端打造陪伴型機器人;虛擬人+AR/VR,在3D空間打造可見的游戲NPC;虛擬人+具身智能,讓人型機器人有了靈魂。

    若將多種技術進行全面融合,虛擬人才真的能夠成為“入口級應用”。屆時,比拼的賽點將是虛擬人的開放程度、生態建設、場景拓展等一系列綜合能力。

    當虛擬人被賦予了更多能力,其背后的木偶引線到底還能否掌握在人的手里?

    這個答案,也著實讓人期待。

           原文標題 : 誰在“操控”虛擬人?

    聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

    發表評論

    0條評論,0人參與

    請輸入評論內容...

    請輸入評論/評論長度6~500個字

    您提交的評論過于頻繁,請輸入驗證碼繼續

    暫無評論

    暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號