視頻大模型“Vidu”發(fā)布:一鍵生成16秒高清視頻,逼近Sora水平

視頻大模型“Vidu”發(fā)布:一鍵生成16秒高清視頻,逼近Sora水平

今日,生數(shù)科技聯(lián)合清華大學發(fā)布了其最新的視頻大模型Vidu”,這一成果在AI視頻生成領(lǐng)域引起了廣泛關(guān)注。據(jù)悉,“Vidu”支持一鍵生成長達16秒、分辨率高達1080p的高清視頻內(nèi)容,在多鏡頭語言、時空一致性等方面表現(xiàn)出色,其效果已經(jīng)逼近了全球領(lǐng)先的視頻大模型Sora。

“Vidu”的發(fā)布標志著國內(nèi)在視頻大模型領(lǐng)域取得了重要突破。在短短兩個月的時間內(nèi),生數(shù)科技團隊就實現(xiàn)了這一令人矚目的成果,展現(xiàn)了他們在AI視頻生成技術(shù)上的深厚實力。

據(jù)悉,“Vidu”采用了自研的U-ViT架構(gòu),通過大規(guī)模訓練實現(xiàn)了長視頻生成。同時,該模型還復用了圖文任務經(jīng)驗,提升了訓練效率,使得視頻生成更加快速、高效。

在視頻效果方面,“Vidu”展現(xiàn)出了出色的性能。它不僅能夠生成多鏡頭語言、時空一致性的視頻內(nèi)容,還能夠虛構(gòu)出真實世界不存在的超現(xiàn)實主義畫面,這一點在當前的視頻生成模型中十分罕見。這些特點使得“Vidu”在視頻制作中更具靈活性和創(chuàng)意性,能夠滿足更多復雜和精細的視頻需求。

此外,“Vidu”的發(fā)布也體現(xiàn)了國內(nèi)在AI視頻生成領(lǐng)域的創(chuàng)新活力。隨著技術(shù)的不斷發(fā)展,越來越多的企業(yè)和團隊開始投入到這一領(lǐng)域的研究和應用中,推動著AI視頻生成技術(shù)的不斷進步和升級。

生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝表示,他們將繼續(xù)致力于提升“Vidu”的性能和應用范圍,以滿足更多用戶的需求。同時,他們也希望能夠與更多的合作伙伴共同推動AI視頻生成技術(shù)的發(fā)展和應用,為人類社會的進步貢獻更多力量。

總的來說,“Vidu”的發(fā)布是國內(nèi)在AI視頻生成領(lǐng)域的一次重要突破,它不僅提升了國內(nèi)在這一領(lǐng)域的技術(shù)水平,也為未來的視頻制作和創(chuàng)意產(chǎn)業(yè)帶來了更多的可能性。我們期待“Vidu”能夠在未來繼續(xù)發(fā)揮更大的作用,為人類社會的文化、藝術(shù)和科技領(lǐng)域帶來更多的創(chuàng)新和驚喜。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://leeannwhittemore.com/article/651211.html

AI的頭像AI認證作者

相關(guān)推薦

發(fā)表回復

登錄后才能評論