作者:伊萬?梅塔
【資料圖】
當(dāng)下,開發(fā)者與各類企業(yè)正愈發(fā)頻繁地在應(yīng)用程序中接入人工智能智能體與聊天機器人,但這類產(chǎn)品的交互形式至今仍大多局限于文本。數(shù)字虛擬人生成技術(shù)企業(yè)檸檬切片(Lemon Slice) 正試圖改變這一現(xiàn)狀:該公司研發(fā)出一款全新擴散模型,僅憑一張圖片即可生成數(shù)字虛擬人,為這類智能對話產(chǎn)品疊加視頻交互層。
這款名為檸檬切片二代(Lemon Slice-2) 的模型,生成的數(shù)字虛擬人可對接知識庫,勝任人工智能智能體的各類指定角色 —— 既能解答客戶咨詢、輔導(dǎo)課后作業(yè),甚至還能擔(dān)任心理健康疏導(dǎo)顧問。
該公司聯(lián)合創(chuàng)始人莉娜?科盧奇表示:‘生成式人工智能發(fā)展初期,我和聯(lián)合創(chuàng)始人們就開始嘗試各類視頻模型,當(dāng)時我們便意識到,視頻交互終將走向智能化、可互動化。像聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器這類工具的核心吸引力,就在于其強交互屬性,而我們的目標(biāo),正是讓視頻也具備這樣的交互能力。’
檸檬切片公司介紹,這款模型的參數(shù)量達 200 億,單塊圖形處理器即可運行,能以每秒 20 幀的速率生成視頻流。企業(yè)可通過應(yīng)用程序編程接口調(diào)用該模型,也可借助一款嵌入式組件,僅需一行代碼就能將虛擬人功能集成至自有網(wǎng)站。虛擬人生成后,用戶還能隨時調(diào)整其背景畫面、風(fēng)格設(shè)計與面部外觀。
除高度擬人化的虛擬人形象外,該公司還著力研發(fā)非人類虛擬角色的生成技術(shù),滿足多元化場景需求。這家初創(chuàng)企業(yè)采用十一實驗室(ElevenLabs)的技術(shù),為旗下所有虛擬人定制語音。
檸檬切片由莉娜?科盧奇、西德尼?普萊馬斯與安德魯?韋茨于 2024 年聯(lián)合創(chuàng)立。公司的核心競爭思路是:憑借自研的通用型擴散模型打造虛擬人產(chǎn)品,以此形成差異化競爭力。這類生成式模型的原理是,從帶噪聲的訓(xùn)練數(shù)據(jù)中逆向?qū)W習(xí)規(guī)律,進而生成全新的數(shù)據(jù)內(nèi)容。
‘時至今日,我接觸到的多數(shù)虛擬人解決方案,非但沒能為產(chǎn)品賦能,反而拉低了體驗感。’科盧奇直言,‘這些虛擬人形象要么違和怪異,要么動作僵硬呆板。靜態(tài)畫面看上幾秒還算精致,可一旦開啟交互,那種強烈的違和感撲面而來,根本無法讓用戶產(chǎn)生舒適的體驗。虛擬人技術(shù)之所以始終未能真正落地普及,核心原因就是產(chǎn)品體驗始終達不到合格水準(zhǔn)。’
為支撐技術(shù)研發(fā)與業(yè)務(wù)擴張,檸檬切片于本周二官宣完成1050 萬美元種子輪融資,投資方包括經(jīng)緯創(chuàng)投、硅谷創(chuàng)業(yè)孵化器 Y Combinator,還有云端存儲服務(wù)商多寶箱首席技術(shù)官阿拉什?費爾多西、游戲直播平臺 Twitch 首席執(zhí)行官埃米特?希爾,以及美國電子音樂組合煙鬼樂隊。
檸檬切片表示,公司已搭建完善的風(fēng)控機制,可有效防范未經(jīng)授權(quán)的人臉、聲音克隆行為;同時還依托大型語言模型,對虛擬人產(chǎn)出的內(nèi)容進行合規(guī)審核。
該公司并未披露具體的合作客戶名單,但透露其技術(shù)已落地應(yīng)用于多個領(lǐng)域,包括教育教學(xué)、語言學(xué)習(xí)、電子商務(wù)與企業(yè)員工培訓(xùn)。
檸檬切片目前面臨激烈的行業(yè)競爭,賽道內(nèi)的對手既包括數(shù)字視頻生成領(lǐng)域的初創(chuàng)企業(yè)(如 D-ID、HeyGen、深曦科技),也有一眾數(shù)字虛擬人研發(fā)商(如精靈科技、靈魂機器、普拉奇卡、虛擬人操作系統(tǒng)公司)。
經(jīng)緯創(chuàng)投合伙人伊利亞?蘇哈爾認(rèn)為,虛擬人技術(shù)將在視頻場景為主的領(lǐng)域迎來爆發(fā)。舉例來說,相比長篇文字,人們更愿意通過視頻平臺學(xué)習(xí)知識。他指出,檸檬切片的技術(shù)硬實力與研發(fā)思路,將成為其突圍的核心優(yōu)勢。
‘這支團隊深耕技術(shù)研發(fā),擁有成熟的機器學(xué)習(xí)產(chǎn)品落地經(jīng)驗,絕非只做技術(shù)演示與理論研究的團隊。行業(yè)內(nèi)不少競品的技術(shù)方案僅適配特定場景或垂直領(lǐng)域,而檸檬切片選擇遵循人工智能領(lǐng)域的“慘痛教訓(xùn)”原則,采用規(guī)模化的研發(fā)路徑 —— 通過海量數(shù)據(jù)與算力投入打磨通用模型,這一思路在其他人工智能賽道均已被驗證有效。’伊利亞?蘇哈爾評價道。
Y Combinator 合伙人賈里德?弗里德曼則表示,相較于部分只專注研發(fā)擬人虛擬人或游戲角色類虛擬人的同行,檸檬切片采用的擴散類模型,使其具備生成全品類虛擬形象的能力。
‘我認(rèn)為,檸檬切片是業(yè)內(nèi)唯一一家立足機器學(xué)習(xí)底層邏輯研發(fā)技術(shù)的企業(yè),其方案終有一天能突破“恐怖谷效應(yīng)”,通過虛擬人領(lǐng)域的圖靈測試。’弗里德曼說,‘他們訓(xùn)練的模型,與視頻生成工具 Veo3、Sora 同屬一類 —— 視頻擴散轉(zhuǎn)換器。這款通用型模型可實現(xiàn)端到端的全流程生成,其技術(shù)上限永無止境;而行業(yè)內(nèi)其他競品的技術(shù)天花板,都止步于超寫實畫質(zhì)之下。該模型不僅能生成人類形象,也可打造非人類面孔,且僅需一張圖片,就能快速生成全新的虛擬人臉形象。’
檸檬切片目前僅有 8 名員工,本輪融資資金將主要用于兩大方向:一是擴招算法研發(fā)與商業(yè)化落地團隊,二是支付模型訓(xùn)練所需的算力成本。
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁面或BBS上進行跟帖或發(fā)表言論者,文責(zé)自負(fù)。
3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實,不對您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問題,請在30日內(nèi)同本網(wǎng)聯(lián)系。