当前位置：首页 > 科技 > MiniMax发布新型线性模型架构视频音乐生成模型首次亮相

MiniMax发布新型线性模型架构视频音乐生成模型首次亮相

科技
2024-10-21 14:41
0

“大模型的核心意义是做更好的信息处理，大部分的信息体现在多模态的内容里面，而不是体现在文字上。”MiniMax创始人闫俊杰如此解释上线视频、音乐生成模型的初衷。

近日，在“2024 MiniMax Link伙伴日”活动上，MiniMax发布了基于MOE+ Linear Attention(线性注意力)的新型线性模型架构，并展示了MiniMax最新音乐模型、视频模型的研发成果。

MiniMax新型线性模型架构能在单位时间内更加高效地训练海量数据，极大地提升了模型的实用性和响应速度。在与GPT-4o同一代模型能力对比上，MiniMax的新一代模型处理10万token时效率可提升2-3倍，并且随着长度越长，提升越明显。相比于通用Transformer架构，新架构的原生线性计算复杂度大幅减少了大模型的训练和推理成本。在128K的序列长度下，新架构成本减少90%以上。

据介绍，MiniMax视频模型具有压缩率高、文本响应好和风格多样等优点，可生成原生高分辨率、高帧率视频，模型能力首屈一指。

闫俊杰分析，视频模型与文本模型有着本质区别，前者处理量大，更具复杂性，因此无法应用文本模型所构建的底层基础设施，用于数据处理、清洗以及标注等。视频模型不仅需要升级基础设施，还因为缺少开源的内容，需要投入更多耐心。

MiniMax第一款音乐模型则可以合成纯音乐为制作人快速构建歌曲的基本结构，由歌手自由演绎主唱或和声部分。没有伴奏，音乐模型也可以是实力歌手，清唱作品同样不在话下。值得一提的是，MiniMax语音模型已实现对粤语、日语、韩语、西班牙语等多语种支持的升级。

目前，全球领先的MiniMax音乐生成模型与视频生成模型已经在开放平台和海螺AI网页版上线。此外，abab 7系列模型将于未来数周内正式发布，并采用新一代创新技术。

MiniMax成立于2021年，是一家专注于推动通用人工智能技术突破的科技创业公司，已经获得阿里、腾讯、红杉中国、高瓴创投、IDG资本等机构投资。公司拥有自研多模态通用大模型，此前基于大模型发布了针对企业客户的技术开放平台，和海螺A1、星野等多款C端AI应用产品。

MiniMax主要通过开放平台和在产品中植入广告实现商业化。“目前最重要的东西还不是商业化，而是真正达到技术可广泛可用的程度。”闫俊杰当下思考更多的还是技术如何提升，以及如何跟用户做更好的共创。

标签： geek 、科技星海、我国近年来的重大科技成就、科技手抄报简单又漂亮内容、全国科技创新大会

上一篇：AI驱动用户增长美图旗下开拍创作内容数超5000万

下一篇：OPPO一加全面适配支付宝碰一下47款超1亿手机解锁手机一碰即付

MiniMax发布新型线性模型架构视频音乐生成模型首次亮相

猜你喜欢

随便看看

黄金周攒机大爆款AMD 锐龙5 7600X3D京东热销推荐

高分辨率高覆盖率吉林一号全球一张图发布

首个大数据批流融合国家标准正式发布阿里云为牵头起草单位

预计2026年产业规模将突破200亿元人形机器人加速进化

阿里巴巴热土丰收节公益助农直播收官23个县域特色农产品热卖

推荐排行

阅读排行

阿里巴巴热土丰收节公益助农直播收官23个县域特色农产品热卖

阿斯麦失去欧洲市值最高科技公司头衔

赵致真获得中国龙奖终身成就奖附感言

赣鄱大地校企携手以科技求新质

货拉拉司机橙色阳光帮扶行动获评暖途行动十大年度公益项目