新榜訊 阿里云旗下視覺生成基座模型萬相 2.1(Wan)震撼開源,此次開源遵循最為寬松的 Apache2.0 協(xié)議,14B 和 1.3B 兩個(gè)參數(shù)規(guī)格的全部推理代碼與權(quán)重盡數(shù)開源,并且支持文生視頻及圖生視頻任務(wù)。據(jù)了解,14B 萬相模型于指令遵循、復(fù)雜運(yùn)動生成、物理建模、文字視頻生成等領(lǐng)域表現(xiàn)卓越。1.3B 版本的測試結(jié)果不但超越了尺寸更大的開源模型,甚至接近部分閉源模型,同時(shí)能夠在消費(fèi)級顯卡上運(yùn)行,僅需 8.2GB 顯存便可生成高品質(zhì)視頻,適用于二次模型開發(fā)及學(xué)術(shù)研究。(記者 黃心怡)
掃描二維碼
手機(jī)瀏覽
阿里萬相視頻生成模型開源
分享文章鏈接
相似推薦

阿里通義首個(gè)音頻生成模型ThinkSound正式開源
新榜訊 7月5日訊,阿里“通義大模型”公眾號發(fā)布消息,通義實(shí)驗(yàn)室首個(gè)音頻生成模型ThinkSound正式開源,此舉將突破“靜音畫面”所帶來的想象力限制。

騰訊混元視頻生成工具HunyuanCustom宣布開源
新榜訊 騰訊混元正式開源全新多模態(tài)定制化視頻生成工具 Hunyuan Custom。

潞晨科技推出視頻生成模型Open-Sora 2.0
新榜訊 3 月 13 日,潞晨科技重磅宣布推出 Open-Sora 2.0,并將模型權(quán)重、推理代碼以及分布式訓(xùn)練全流程全面開源。