相关推荐
AI初创公司Delphi:打造名人和网红AI数字虚拟人
["Delphi是一家人工智能初创公司,致力于创建个性化数字聊天机器人,以扩大名人和网红与粉丝的互动。","该公司通过多种数据源塑造名人和网红,使其能够与更多人进行互动。","Delphi已筹集270万美元资金,计划使用开源模型,项目显然采用OpenAI技术。","已有100多名聊天机器人创作者和数千名用户参与私人测试。","Delphi的愿景是通过人工智能技术为名人和网红提供更广泛的互动机会,成功与否取决于技术卓越性和与原始人物的相似度。"]
警惕AI数据投毒!仅 0.01% 的虚假文本就能增加 AI 有害输出 11.2%
国家安全部警示AI数据污染风险:虚假信息占比仅0.01%即可导致AI有害输出增加11.2%,严重影响金融、公共安全及医疗等领域。建议加强数据源头监管,建立分类分级保护制度,定期清洗污染数据,确保AI技术安全发展。
ChatGPT用户数暴涨至7亿创纪录新高,OpenAI年化收入飙升至120亿美元
OpenAI旗下ChatGPT迎来爆发式增长,周活跃用户达7亿,同比增长超4倍。商业化进程加速,付费商业用户从300万增至500万,年化收入达120亿美元。公司暗示GPT-5即将发布,或将带来新一轮技术升级。尽管谷歌AI产品用户规模仍占优,但ChatGPT在用户活跃度和付费转化方面表现突出。产品新增休息提醒等功能,关注用户体验和健康。AI应用正进入大规模普及新阶段,7亿周活用户标志着全球约十分之一人口定期使用AI工具。
阿里通义千问开源全新文生图模型Qwen-Image
通义千问系列首次开源了一款名为Qwen-Image的20亿参数多模态扩散变换器(MMDiT)图像生成基础模型。这一创新成果不仅在复杂文本渲染和精确图像编辑方面取得了突破性进展,更是在多个公开基准测试中展现了卓越性能,成为图像生成与编辑领域的新星。 Qwen-Image以其强大的文本渲染能力脱颖而出,支持多行布局、段落级文本生成及细粒度细节呈现,无论是英语还是中文,均能实现高保真输出。例如,在渲染宫崎骏风格的动漫场景时,模型能够精准呈现店铺牌匾、人物姿势及神态,甚至酒缸上的细小文字也清晰可见。同样,在中文对联的渲染中,Qwen-Image不仅准确绘
小米全量开源MiDashengLM-7B:音频理解性能刷新SOTA,推理速度暴增20倍
小米发布并开源MiDashengLM-7B多模态大模型,在音频理解领域实现重大突破。该模型采用双核心架构设计,融合专业音频处理与语言理解能力,在22个评测集上刷新最佳成绩。其单样本推理首Token延迟仅为业界先进模型的1/4,数据吞吐效率高出20倍以上。创新性地实现语音、环境声和音乐的统一理解,支持终端离线部署。小米全量开源该模型,推动音频AI技术发展,为开发者提供强大工具。
