根据公开数据显示,今年1月,快手可灵AI全球月访问用户总数环比增长113%。
瑞银近期表示,在线娱乐与教育乃是 AI 落地的核心场景,快手作为应用层的标杆企业,其自主研发的可灵 AI 在全球视频生成模型领域占据领先地位。
前不久可灵AI正式上线多图参考参考功能,支持同时参考多个主体。用户可以上传1到4张参考图片,并框选出其中的人物、物品、道具或场景。
阿里巴巴12月16日发布新一代万相2.6系列模型,针对影视制作和图像创作全面升级,号称“全球功能最全的视频生成模型”。该模型已上线阿里云百炼和官网,核心亮点包括国内首个“角色扮演”功能,并支持音画同步、多镜头生成及声音驱动等,在画质、音效等方面实现技术突破。
快手旗下可灵AI发布“主体库”,为O1多模态视频模型增加长期记忆功能。用户上传单张角色图,系统可生成3D视角补全和多光线变体,支持跨场景一键调用角色,主体一致性超96%。流程包括上传图片自动处理、AI补全多角度视图,实现从单图到3D记忆的转换。
苹果推出视频生成模型STARFlow-V,采用“归一化流”技术而非主流扩散模型,专注于提升长视频稳定性。该模型在视觉质量和生成速度上可与扩散模型媲美,输出分辨率为640×480像素,帧率为每秒16帧。
苹果发布视频生成模型STARFlow-V,采用归一化流技术替代主流扩散模型,旨在提升长视频生成的稳定性和减少错误累积。该技术直接学习数据分布,简化生成过程,与Sora等竞争对手形成差异化竞争。
快手可灵AI发布数字人模型Avatar2.0,用户仅需提供一张照片和一段音乐,即可生成长达5分钟的唱歌视频。该模型显著提升了数字人的表现力,使其能够自然展现表情和肢体动作,告别僵硬“对口型”模式。这标志着AI内容创作从静态向动态叙事的重大进步。