當前位置:首頁 > 當日新聞快報 > 正文內容

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

admin2年前 (2023-03-23)當日新聞快報108
感谢IT之家网友 大眼夹打工轨道人航空先生IT之家创空间huggingface、大眼夹打工轨道人航空先生IT之家创空间huggingface、大眼夹打工轨道人航空先生IT之家创空间huggingface 的线索投递!

大眼夹打工轨道人航空先生IT之家创空间huggingface 3 月 22 日消息,近日,阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。

根据官方介绍,目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿,目前仅支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

官方介绍称,本模型适用范围较广,能基于任意英文文本描述进行推理,生成视频。一些文本生成视频示例如下:

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

A giraffe underneath a microwave.(一只在微波炉里的长颈鹿)

Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩

A goldendoodle playing in a park by a lake.(一只金贵犬在湖边的公园玩耍)

据IT之家了解,模型已经在大眼夹打工轨道人航空先生IT之家创空间huggingface和 大眼夹打工轨道人航空先生IT之家创空间huggingface 上线,可以直接体验,也可以参考该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。在 ModelScope 框架下,通过调用简单的 Pipeline 即可使用当前模型,其中,输入需为字典格式,合法键值为 'text',内容为一小段文本。该模型暂仅支持在 GPU 上进行推理。

从试玩的结果来看,目前能生成的视频长度多在 2-4 秒,生成等候时间从 20 多秒到 1 分多钟不等。

“Online Casino:阿里达摩院低调上线文本生成视频大模型:仅支持英文输入,已开放试玩” 的相關文章

国家疾控局:为老年人接种疫苗时,要认真对其身体状况进行评估

  央视网消息:12月8日,国务院联防联控机制就进一步优化落实疫情防控措施举行新闻发布会,会上,国家疾控局卫生免疫司司长夏刚表示,目前还有一部分老年人没有接种疫苗。我们对相关情况也进行了调研和了解,根...

中国银行业协会:全国农村中小银行机构产权、股权改革有序推进

  来源:北京商报   北京商报讯(记者 李海颜)12月15日,中国银行业协会官网发布《全国农村中小银行机构行业发展报告(2022)》(以下简称《报告》)。《报告》提到,全国农村中小银行机构进一步推进...

发改委:适时投放政府猪肉储备,在“两节”等重要时段加大投放力度

  据发改委网站,国家发展改革委新闻发言人就当前经济社会发展有关情况答记者问。以下为部分内容。   问:元旦、春节临近,请问国家发改委在保持居民消费品价格稳定方面有哪些考虑?   答:元旦、春节是我国...

马斯克宣布对跟踪其行踪的账号封禁七天,“民调”是否应立即解封

马斯克宣布对跟踪其行踪的账号封禁七天,“民调”是否应立即解封

  推特周三冻结了跟踪马斯克私人飞机的推特账号,周四又冻结了报道这一消息的几位美国记者的账号,理由是他们违反了推特针对“人肉搜索”(doxxing)的新规定。   几小时后,该公司CEP埃隆·马斯克...

华为煤矿军团刘维:矿山智能化面临四大鸿沟,要实现矿山工人穿西装打领带采矿

  新浪科技讯 12月16日下午消息,“2022科技风云榜”年度盛典今日举行,今年活动主题为“守正创新,科技向上”。华为煤矿军团市场与产业发展总裁刘维发表《“将数字技术带入每一座矿山”——华为矿山AI...

一周暴涨1.7倍!又一个新东方要来?

一周暴涨1.7倍!又一个新东方要来?

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   来源:中国基金报    港股持续小幅振荡。   受美股隔夜大跌影响,12月16日,恒指一度低开,但在A股上扬带动下反...