【jinnianhui科技消息】近日,字節(jié)跳動(dòng)推出的AI視頻生成模型Seedance2.0引發(fā)海內(nèi)外廣泛關(guān)注。這款模型憑借“雙分支擴(kuò)散變換器架構(gòu)”實(shí)現(xiàn)視頻與音頻同步生成,用戶僅需輸入文本或上傳圖片,即可在60秒內(nèi)獲得帶有原生音頻的多鏡頭序列視頻,其多鏡頭敘事功能更被業(yè)界視為突破性創(chuàng)新。

據(jù)官方介紹,Seedance2.0的核心優(yōu)勢在于“單提示生成連貫多場景”能力。AI可自動(dòng)拆解文本或圖像中的敘事邏輯,生成多個(gè)關(guān)聯(lián)場景,并在角色一致性、視覺風(fēng)格統(tǒng)一性及氛圍銜接上實(shí)現(xiàn)“零手動(dòng)編輯”。例如,用戶輸入“雨夜追兇”的提示詞,模型可自動(dòng)生成從案發(fā)現(xiàn)場到嫌疑人逃亡、警方追捕的全流程視頻,且鏡頭切換、光影變化均保持高度連貫。這一特性被開源證券評(píng)價(jià)為“導(dǎo)演級(jí)控制精度”,或成為AI影視創(chuàng)作的“奇點(diǎn)”。
博主“影視颶風(fēng)”的測試顯示,Seedance2.0在分鏡設(shè)計(jì)上展現(xiàn)出“類真人導(dǎo)演”的運(yùn)鏡思維,能通過角度切換、鏡頭推拉等手法增強(qiáng)敘事張力;音畫匹配方面,模型可依據(jù)視頻內(nèi)容自動(dòng)生成環(huán)境音效與背景音樂,甚至能模擬雨聲、腳步聲等細(xì)節(jié)。開源證券研報(bào)指出,該模型在自運(yùn)鏡、分運(yùn)鏡及全方位多模態(tài)思考能力上實(shí)現(xiàn)突破,2K視頻生成速度較快手可靈等競品快30%。

此外,影視颶風(fēng)Tim在評(píng)測字節(jié)跳動(dòng)AI視頻模型Seedance2.0時(shí),因兩項(xiàng)突破性能力直言其“恐怖”——僅憑一張人臉照片即可生成對(duì)應(yīng)人物的真實(shí)聲音與語氣,并能“腦補(bǔ)”未上傳的物體背面細(xì)節(jié)。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
-金年會(huì)體育
官方微信公眾號(hào)平臺(tái)