日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

發布時間:2023/12/19 综合教程 44 生活家
生活随笔 收集整理的這篇文章主要介紹了 阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

感謝網友 大眼夾、打工軌道人、航空先生 的線索投遞!

3 月 22 日消息,近日,阿里達摩院已在 AI 模型社區“魔搭”ModelScope 上線了“文本生成視頻大模型”。

根據官方介紹,目前文本生成視頻大模型,由文本特征提取、文本特征到視頻隱空間擴散模型、視頻隱空間到視頻視覺空間這 3 個子網絡組成,整體模型參數約 17 億,目前僅支持英文輸入。擴散模型采用 Unet3D 結構,通過從純高斯噪聲視頻中,迭代去噪的過程,實現視頻生成的功能。

官方介紹稱,本模型適用范圍較廣,能基于任意英文文本描述進行推理,生成視頻。一些文本生成視頻示例如下:

A giraffe underneath a microwave.(一只在微波爐里的長頸鹿)

A goldendoodle playing in a park by a lake.(一只金貴犬在湖邊的公園玩耍)

據了解,模型已經在創空間和 huggingface 上線,可以直接體驗,也可以參考該頁面自行搭建。模型需要硬件配置大約是 16GB 內存和 16GB GPU 顯存。在 ModelScope 框架下,通過調用簡單的 Pipeline 即可使用當前模型,其中,輸入需為字典格式,合法鍵值為 'text',內容為一小段文本。該模型暫僅支持在 GPU 上進行推理。

從試玩的結果來看,目前能生成的視頻長度多在 2-4 秒,生成等候時間從 20 多秒到 1 分多鐘不等。

總結

以上是生活随笔為你收集整理的阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。