全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括

图源备注:图片由AI生成,图片授权服务商Midjourney

全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括

图源备注:图片由AI生成,图片授权服务商Midjourney
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情
今日,阶跃星辰与吉利汽车集团宣布,联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。其中,阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量,能够直接生成204帧、540P分辨率的高质量视频,确保生成内容信息密度高、一致性强。评测结果显示,Step-Video-T2V在指令遵循、运动平滑性、物理合理性、美感度等方面均表现出色,显著超越市面上既有的最佳开源视频模型。
北京时间,2025 年 2 月 21日讯 :OpenAI 今日宣布,其人工智能工具 Operator 已正式向澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国以及 ChatGPT 可用的多数地区的 Pro 用户推出。这一消息通过 X 平台发布,标志着 Operator 的全球化推广迈出重要一步。然而,欧盟、瑞士、挪威、列支敦士登和冰岛的推广工作仍在进行中,具体进展有待后续更新。Operator 扩展至多国Operator 是 OpenAI 开发的一款 AI 代理工具,能够通过视觉界面控制浏览器,自主完成订票、购物等网络任务。该工具最初于
今日,中央网信办发布2025年“清朗”系列专项行动整治重点称,2025年,“清朗”系列专项行动将进一步巩固提升治理成效,聚焦人民群众反映强烈的突出问题,在破解难点瓶颈方面下功夫,强化源头管理和基础管理;在治理创新方面下功夫,针对性细化每个专项打法举措;在维护网民权益方面下功夫,严厉打击各类侵权违法行为,营造更加清朗有序的网络环境。
据 Daring Fireball 报道,iPhone15Pro 用户即将迎来一个好消息:苹果的视觉智能(Visual Intelligence)功能将登陆2023年发布的 Pro 系列旗舰机型。这意味着,iPhone15Pro 用户升级到 iPhone16系列的理由又少了一个。视觉智能类似于谷歌的 Google Lens,是苹果智能(Apple Intelligence)AI 功能套件的一部分。用户可以将摄像头对准物体,利用 AI 进行实时分析。它可以独立完成一些任务,但更多实用信息则来自其屏幕快捷方式——ChatGPT 或谷歌图片搜索。iPhone16和 iPhone16Pro 用户可通过长按专用的拍照按钮来触发视觉