相关推荐
Unsloth Studio 发布:首个本地可视化大模型微调平台,显存占用降低 70%
Unsloth AI推出开源无代码可视化工具Unsloth Studio,旨在简化大语言模型微调流程,降低开发门槛。该工具通过定制化反向传播内核实现训练速度翻倍和显存节省70%,无需复杂环境配置和高昂硬件成本。
2026年3月18号 15:51
268.8k
技术优化仍需打磨:Meta 宣布 Llama4发布计划推迟至5月
Meta推迟Llama4发布至5月,因技术挑战影响性能优化。该模型是Meta AI战略关键,延期或影响其与OpenAI等竞争。
2026年3月13号 16:28
201.4k
xAI发布Grok4.20:推理性能提升显著,不幻觉率78%创行业纪录
2026年3月12日,xAI发布新一代大语言模型Grok4.20 Beta。该模型在保持价格优势的同时,以极高的事实可靠性创下行业新纪录。在启用推理功能的智能指数评估中,Grok4.20获得48分,较前代提升6分。虽然其综合基准测试得分(57分)仍略低于Gemini3.1Pro Preview和GPT-5.4,但在AA全知测试中表现突出,非幻觉率高达78%。
2026年3月13号 10:06
292.3k
读完 500 万篇新闻,谷歌 Gemini 成功预测全球山洪灾害
谷歌利用大语言模型分析全球500万篇新闻报道,挖掘非结构化数据,构建了覆盖全球的山洪预测体系。这一创新方案解决了传统深度学习模型在偏远地区因缺乏历史气象数据而难以预测山洪的难题。
2026年3月13号 9:56
180.7k
杨立昆进军“世界模型”:其 AI 初创公司完成 10.3 亿美元融资
杨立昆创立的AMI公司获10.3亿美元融资,投前估值达35亿美元。该公司致力于将具备推理、规划和世界建模能力的AI系统商业化,试图挑战当前以“预测下一个单词”为核心的大语言模型范式。
2026年3月10号 16:41
196.6k
