首頁(yè) 行業(yè) 活動(dòng) 項(xiàng)目 快訊 文娛 時(shí)尚 娛樂 科技 汽車 綜合 生活

性能與價(jià)格雙殺同類!Vidu Q1強(qiáng)勢(shì)登頂,超越Runway、Kling

1871-04-24 17:45:49 來(lái)源:今日熱點(diǎn)網(wǎng)

4月21日,生數(shù)科技全新視頻大模型Vidu Q1官宣全球上線,憑借性能提升與全新功能,該模型一經(jīng)上線即引發(fā)行業(yè)高度關(guān)注,力證其用實(shí)力再次攪動(dòng)市場(chǎng)風(fēng)云。據(jù)視頻生成模型權(quán)威測(cè)評(píng)基準(zhǔn)VBench-1.0以及VBench-2.0剛剛發(fā)布的測(cè)評(píng)結(jié)果,Vidu Q1在VBench系列的兩個(gè)榜單上都超越了Runway 、OpenAI Sora、快手的Kling等國(guó)內(nèi)外頂尖模型,拿下文生視頻賽道榜單雙第一。

圖片3.png

圖片4.png

Vidu Q1在VBench-1.0的視頻質(zhì)量、視頻語(yǔ)義一致性以及VBench-2.0常識(shí)推理、物理理解等綜合維度上達(dá)到SOTA水平(即當(dāng)前最先進(jìn)的模型),成為全球視頻生成效果最強(qiáng)模型。

圖片5.png

此外在國(guó)內(nèi)權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE的圖生視頻榜中 ,Vidu Q1也在動(dòng)漫風(fēng)格、寫實(shí)風(fēng)格上均斬獲雙榜單第一的亮眼成績(jī)。

實(shí)際上,在提升創(chuàng)作者生產(chǎn)力和創(chuàng)作力上,生數(shù)Vidu 技術(shù)和產(chǎn)品上一直引領(lǐng)全球。

此次發(fā)布的 Q1 是Vidu 的新一代高質(zhì)量模型,“Q”代表著模型具備更高畫面質(zhì)感、更強(qiáng)語(yǔ)義理解。目前Vidu Q1已支持生成5秒、1080P高質(zhì)量視頻,不斷推進(jìn)AI視頻走向商業(yè)化。

Vidu Q1剛一發(fā)布,就獲得了海外內(nèi)視頻創(chuàng)作者的連連點(diǎn)贊。有海外創(chuàng)作者表示,一致性與 1080p 質(zhì)量相結(jié)合,達(dá)到頂級(jí)一流水準(zhǔn)。

圖片1.png

據(jù)了解,此次上線的Vidu Q1在“極致高質(zhì)量”上進(jìn)行了全面升級(jí):

電影級(jí)高清畫質(zhì):Vidu Q1 文生視頻和圖生視頻支持1080P視頻直出,無(wú)論是宏大的科幻敘事還是人物特寫的細(xì)微表情,都可以清晰呈現(xiàn);

首尾幀更全能:只需兩張圖,即可生成大師級(jí)運(yùn)鏡,電影鏡頭感UP,鏡頭語(yǔ)言理解能力大幅提升,即使是復(fù)雜場(chǎng)景運(yùn)鏡也能穩(wěn)穩(wěn)hold 住;

動(dòng)畫風(fēng)格更驚艷:Vidu Q1在動(dòng)畫風(fēng)格的生成效果上再度升級(jí),高動(dòng)態(tài)的運(yùn)動(dòng)表現(xiàn)力,更加多元化的動(dòng)畫風(fēng)格;

上線AI音效功能:一句話就能生成精準(zhǔn)專屬音效,還可實(shí)現(xiàn)多種音效疊加,讓AI視頻生成進(jìn)入“有聲時(shí)代”;

目前Vidu Q1已陸續(xù)上線 網(wǎng)頁(yè)與 App 端,無(wú)需邀請(qǐng)碼,打開 App和網(wǎng)頁(yè)即可一鍵體驗(yàn),真正做到“頂級(jí)模型,全民可用”,而且每秒生成價(jià)格最低僅需0.3元,真正的“性價(jià)比之王”。

更懂鏡頭語(yǔ)言,抽卡不再是“玄學(xué)”

"抽卡”幾乎是每個(gè)創(chuàng)作者都經(jīng)歷過的難題。而決定抽卡效率的關(guān)鍵,在于模型是否真正“聽得懂人話”。

在這方面,Vidu Q1 實(shí)現(xiàn)了質(zhì)的飛躍,相比 Vidu 1.5,Q1的文生視頻功能在理解提示詞的語(yǔ)義和鏡頭邏輯方面大幅提升,極大降低了“抽不到理想鏡頭”的概率。

例如下面視頻,提示詞中包含"男子” “行人” “汽車” “街道”等多個(gè)元素,且有復(fù)雜的位置關(guān)系和光線描述,Q1 不僅精準(zhǔn)理解了這些關(guān)系,還鏡頭感十足,宛如好萊塢導(dǎo)演的實(shí)拍作品。

提示詞:鏡頭聚焦于一位身穿皮夾克的男子,他獨(dú)自行走在白天的城市街道上。陽(yáng)光在人行道上投射出逼真的陰影,背景中是汽車和行人,而模糊的畫面則以電影般的照片寫實(shí)風(fēng)格呈現(xiàn)。

Vidu Q1 不僅能聽懂“人話”,連專業(yè)鏡頭語(yǔ)言也拿捏得死死的。

比下面的例子,焦點(diǎn)從近處的粉色西裝男子自然切換到他身后穿黑西裝的男子,整個(gè)變焦過程流暢自然。

即使是大幅度運(yùn)動(dòng),Vidu Q1也能很好遵從,AI視頻生成常見的崩壞程度大幅降低。從左至右分別是:Runway Gen-3 Alpha、Veo2、Vidu Q1。比如疾馳的日產(chǎn)天際線汽車在午夜時(shí)分疾馳,與其他家相比,Vidu Q1生成的視頻日產(chǎn)汽車可以實(shí)現(xiàn)快速漂移,運(yùn)動(dòng)幅度大,同時(shí)又非常逼真。Runway Gen-3 Alpha畫面出現(xiàn)大幅崩壞,Veo 2表現(xiàn)還算正常,場(chǎng)景還原也不錯(cuò),但是運(yùn)動(dòng)幅度上不及Q1 。

Runway 漂移.gif

Veo 漂移.gif

Vidu Q1漂移.gif

提示詞:富士膠片Portra 400H靜態(tài)照片,急馳的日產(chǎn)天際線R33 GTR LM JGTC,大幅度運(yùn)動(dòng)效果,東京7-11便利店,午夜時(shí)分

更強(qiáng)風(fēng)格表現(xiàn)力

前段時(shí)間,GPT 4O的吉卜力風(fēng)格火爆全網(wǎng),全網(wǎng)社交平臺(tái)秒變吉卜力的世界。實(shí)際上在視頻生成領(lǐng)域,Vidu也早已經(jīng)在社交平臺(tái)上刮起了一股AI動(dòng)畫風(fēng),無(wú)論是類似新海誠(chéng),宮崎駿,大友克洋風(fēng)格的日本動(dòng)畫,還是類似迪斯尼、皮克斯、彼得.道格特風(fēng)格的美國(guó)動(dòng)畫,Vidu統(tǒng)統(tǒng)都能穩(wěn)定輸出,表現(xiàn)驚艷。

有日本創(chuàng)作者在社交平臺(tái)表示,目前只用Vidu來(lái)做動(dòng)畫。

10b5c4f3-1274-43d9-aa90-d8f4434d33fa.png

而這次,Vidu 開始自己卷自己了。Q1相比Vidu 2.0又有了大幅提升,支持更加多元風(fēng)格的視頻輸出,尤其在動(dòng)畫風(fēng)格表現(xiàn)上,與同行拉開了顯著差距。

先來(lái)感受一波Vidu Q1在動(dòng)畫風(fēng)格上的實(shí)力。下面呈現(xiàn)的是一位夢(mèng)幻少女視頻,不僅人物細(xì)節(jié)豐富,美學(xué)表現(xiàn)出色,就連照在人物臉上時(shí)有時(shí)無(wú)的動(dòng)態(tài)光影和夢(mèng)幻的球體波光也表現(xiàn)得非常自然,只能說Vidu是懂老二次元的。

提示詞:夢(mèng)幻動(dòng)漫女孩的特寫鏡頭,有著閃閃發(fā)光的星系般的眼睛和飄逸的深綠色頭發(fā),被發(fā)光的球體和神奇的散景燈柔和地照亮,吉卜力和新海誠(chéng)的靈感,16:9 的寬高比

即使在多主體復(fù)雜場(chǎng)景里,Vidu Q1依然很能打。下圖是太空中宇宙飛船飛行的場(chǎng)景,整體畫質(zhì)高清,多艘宇宙飛船的運(yùn)動(dòng)軌跡合理且流暢自然,飛船飛行的后引擎光、遠(yuǎn)處的太陽(yáng)光、以及周邊的動(dòng)態(tài)銀色運(yùn)動(dòng)軌跡,讓人仿佛有看科幻大片的即視感。

同行對(duì)比來(lái)看,Vidu Q1 更能理解多元?jiǎng)赢嬶L(fēng)格,且在動(dòng)畫風(fēng)格一致性上保持較好。

比如我們讓各家生成80、90年代復(fù)古風(fēng)格的可愛的動(dòng)漫女孩。Veo 則直接生成了3D風(fēng)格,Runway Gen-3 Alpha 雖然理解了復(fù)古動(dòng)漫風(fēng),但是畫面比較生硬、呆板,而Vidu Q1對(duì)于80、90年代復(fù)古風(fēng)格理解精準(zhǔn),女孩的表情動(dòng)作也非常自然。

runway 動(dòng)漫.gif

Runway-Gen3 Alpha

Veo動(dòng)漫.gif

Veo 2

Vidu 動(dòng)漫.gif

Vidu Q1

此外,在動(dòng)畫風(fēng)格表現(xiàn)力上,Q1的人物表現(xiàn)更加生動(dòng),高動(dòng)態(tài)表現(xiàn)較為驚艷。

比如下面視頻,可以看到Veo 2視頻中的小狗運(yùn)動(dòng)不是很合理,Runway-Gen3 Alpha中的小狗則直接懸空了,Vidu Q1不僅很好理解了3D動(dòng)漫風(fēng),而且鏡頭運(yùn)動(dòng)能很好體現(xiàn)小狗降落的極速感,以及隨著降落不斷變化的田園景色,非常逼真。

runway 小狗跳傘.gif

Runway Gen-3 Alpha

Veo小狗跳傘.gif

Veo 2

Vidu Q1小狗跳傘.gif

Vidu Q1

據(jù)了解,在AI動(dòng)畫賽道,Vidu在創(chuàng)作者心目中是無(wú)可替代的NO.1。無(wú)論是小白用戶還是專業(yè)創(chuàng)作者,都可以用Vidu來(lái)實(shí)現(xiàn)做動(dòng)畫的夢(mèng)想。

拒絕畫餅!App、網(wǎng)頁(yè)端直接體驗(yàn)

Vidu Q1已全球同步上線,無(wú)需排隊(duì),也不用再申請(qǐng)內(nèi)測(cè),上線即可立刻體驗(yàn)。目前 Vidu APP 已在安卓和iOS市場(chǎng)上線,用戶打開手機(jī)APP,或者登陸Vidu 網(wǎng)站即可立刻體驗(yàn)最新Q1模型帶來(lái)的極致高質(zhì)體驗(yàn)。此外,據(jù)了解,Q1可控等相關(guān)重磅功能未來(lái)也將陸續(xù)上線,值得狠狠期待一波。

天賦從不是定義創(chuàng)作的邊界,Vidu Q1讓你成為天生導(dǎo)演。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞:

上一篇:消博聊“企”來(lái)|新加坡OSIM傲勝:消博會(huì)是世界級(jí)窗口,將持續(xù)深耕并拓展中國(guó)市場(chǎng)

下一篇:最后一頁(yè)

責(zé)任編輯:

最近更新

點(diǎn)擊排行
推薦閱讀