
阶跃星辰联合吉利开源两款大模型:覆盖视频、语音领域

凤凰网科技讯 2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的两款Step系列多模态大模型向全球开发者开源。分别为阶跃Step-Video-T2V以及阶跃Step-Audio。
其中,阶跃Step-Video-T2V是目前全球范围内参数量最大、性能最好的开源视频生成模型,参数量达 300 亿,可直接生成 204 帧、540P分辨率的高质量视频。
阶跃Step-Audio是行业内首款产品级开源语音交互模型,能根据场景需求生成情绪、方言、语种、歌声和个性化风格的表达,与用户自然高质量对话。
阶跃星辰是吉利汽车集团的科技生态战略合作伙伴,双方自2023年合作。吉利汽车集团CEO淦家阅表示,吉利全栈自研的星睿AI大模型已与这两款大模型完成深度融合,将推动AI科技在智能汽车领域的普及。
阶跃星辰创始人、CEO姜大昕博士称,开源旨在分享技术成果,推动多模态模型发展,与开发者共同拓展技术边界。
相关阅读:
接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型