全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括

图源备注:图片由AI生成,图片授权服务商Midjourney

全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括

图源备注:图片由AI生成,图片授权服务商Midjourney
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情
今日,阶跃星辰与吉利汽车集团宣布,联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。其中,阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量,能够直接生成204帧、540P分辨率的高质量视频,确保生成内容信息密度高、一致性强。评测结果显示,Step-Video-T2V在指令遵循、运动平滑性、物理合理性、美感度等方面均表现出色,显著超越市面上既有的最佳开源视频模型。
2月20日,马斯克通过社交平台X发布了一条重要消息,宣布Grok应用程序已成功上线了Grok3语音模式的早期测试版。这一动态立即引起了广泛关注。
今日,苹果应用商店免费APP下载排行榜上传来新消息,腾讯元宝凭借出色的表现,成功超越豆包,升至中国区榜单的第二位,仅次于持续稳居榜首的DeepSeek。这一成绩的取得,离不开腾讯元宝近期的一次重大更新。2月13日,腾讯元宝正式接入了满血版Deepseek - R1模型,这一核心亮点的加入,使得用户在打开腾讯元宝并进入对话界面后,能够免费体验到前所未有的便利与强大功能。
近日,在全球开发者先锋大会(GDC)上,出门问问公司正式推出了其最新产品——小问移动数字人。该产品凭借其灵活可移动的身体、高智商的问答能力以及流畅的交互体验,吸引了众多现场参观者的目光,成为了大会的一大亮点。