在AI視頻生成領(lǐng)域,一場(chǎng)激烈的較量在2025年4月中旬悄然上演,主角是兩位老對(duì)手——快手與字節(jié)跳動(dòng)。
4月14日,字節(jié)跳動(dòng)低調(diào)上線了視頻生成基礎(chǔ)模型Seaweed的官網(wǎng),并發(fā)布了技術(shù)報(bào)告。這款模型以70億參數(shù)實(shí)現(xiàn)了超越同類140億參數(shù)模型的效果,訓(xùn)練效率也極高,僅需66.5萬(wàn)H100 GPU小時(shí),遠(yuǎn)低于同類模型的百萬(wàn)GPU小時(shí)標(biāo)準(zhǔn)。
相比之下,快手在視頻生成領(lǐng)域的聲勢(shì)則浩大得多。4月15日,快手高級(jí)副總裁蓋坤在一場(chǎng)發(fā)布會(huì)上,高調(diào)宣布了快手在視頻生成領(lǐng)域的最新成果,包括圖像生成基座模型“可圖2.0”、視頻生成基座模型“可靈2.0”,以及多模態(tài)編輯功能MVL。蓋坤表示,“可靈”的發(fā)布一度引領(lǐng)了視頻生成賽道,并創(chuàng)造了上線三個(gè)月服務(wù)超260萬(wàn)用戶的記錄。
“可靈2.0”在文生視頻和圖生視頻能力上均超越了谷歌的視頻模型Veo2,在與老對(duì)手Sora的較量中,文生視頻模型的勝負(fù)比甚至達(dá)到了367%。這一成績(jī)無(wú)疑為快手在視頻生成領(lǐng)域的領(lǐng)先地位增添了重量級(jí)的籌碼。
盡管字節(jié)跳動(dòng)的Seaweed在性能上略遜于快手的上一代模型“可靈1.6”,但其部署成本極低,僅需40GB顯存的單GPU就能實(shí)現(xiàn)高分辨率視頻的生成,這使得中小團(tuán)隊(duì)和個(gè)人創(chuàng)作者也能輕松負(fù)擔(dān)得起AI視頻創(chuàng)作。這一優(yōu)勢(shì)無(wú)疑為Seaweed在市場(chǎng)上的推廣鋪設(shè)了道路。
在實(shí)用性方面,字節(jié)和快手都意識(shí)到,單一的視頻生成模型無(wú)法滿足用戶的多樣化創(chuàng)作需求。因此,快手在發(fā)布“可靈2.0”的同時(shí),還推出了圖像生成模型“可圖2.0”,以增強(qiáng)指令遵循能力和審美能力。而字節(jié)跳動(dòng)的Seaweed則結(jié)合了長(zhǎng)上下文調(diào)優(yōu)技術(shù)和長(zhǎng)敘述視頻生成技術(shù),使得生成的視頻能夠保持全局文本描述和分鏡描述的一致性。
對(duì)于快手而言,“可靈”的出現(xiàn)不僅為其帶來(lái)了短視頻之外的新增長(zhǎng)曲線,還撬動(dòng)了快手的其他業(yè)務(wù)。據(jù)快手財(cái)報(bào)顯示,“可靈”在開放API服務(wù)后,累計(jì)營(yíng)收已超過(guò)1億元,用戶數(shù)量也實(shí)現(xiàn)了大幅增長(zhǎng)。而對(duì)于字節(jié)跳動(dòng)來(lái)說(shuō),Seaweed的發(fā)布則是其AI改革后的一個(gè)注腳,標(biāo)志著字節(jié)跳動(dòng)在視頻生成領(lǐng)域邁出了堅(jiān)實(shí)的一步。
在這場(chǎng)較量中,雙方不僅比拼了模型性能和落地成本,還展現(xiàn)了各自在AI領(lǐng)域的戰(zhàn)略布局和技術(shù)實(shí)力。隨著AI技術(shù)的不斷發(fā)展,視頻生成領(lǐng)域的戰(zhàn)火無(wú)疑將更加激烈。