河南省近日正式发布了首批四个工业大模型,涵盖工业质检、安全生产、矿山作业以及冷链物流等关键领域,标志着该省在推动数字化转型方面迈出了坚实的一步。


河南省近日正式发布了首批四个工业大模型,涵盖工业质检、安全生产、矿山作业以及冷链物流等关键领域,标志着该省在推动数字化转型方面迈出了坚实的一步。

近日,谷歌的 Gemini 人工智能项目正在通过比较其输出结果与 Anthropic 公司的 Claude 模型来提升自身性能。据 TechCrunch 获得的内部通信记录显示,负责 Gemini 改进的承包商正在系统地评估这两种 AI 模型的回答。图源备注:图片由AI生成,图片授权服务商Midjourney在 AI 行业,模型的性能评估通常通过行业基准测试来进行,而不是让承包商逐一对比不同模型的答案。负责 Gemini 的承包商需要根据多个标准对模型的输出进行评分,包括真实性和详细程度。他们每次有多达30分钟的时间来判断 Gemini 和
近日,谷歌深度学习团队和多所大学的研究人员联合发布了一项名为 “MegaSaM” 的新系统,该系统能够从普通的动态视频中快速、准确地估计相机参数和深度图。这一技术的问世,将为我们在日常生活中录制的视频带来更多的可能性,特别是在动态场景的捕捉与分析方面。传统的运动结构重建(Structure from Motion,SfM)和单目同步定位与地图构建(SLAM)技术,通常需要输入静态场景的视频,并且对视差的要求较高。面对动态场景,这些方法的表现往往不尽如人意,因为在缺乏静态背景的情况下
一个被广泛视为人工智能缺陷的特性——"幻觉",竟成为科学突破的关键。据《财富》杂志报道,2024年诺贝尔化学奖得主之一的大卫·贝克教授,正是借助AI模型的"幻觉"特性实现了重大科研突破。来自华盛顿大学的贝克教授是今年三位诺贝尔化学奖得主中唯一的美国科学家。他利用计算机软件成功发明了新型蛋白质,这一成就最终为他赢得了这一殊荣。图源备注:图片由AI生成,图片授权服务商Midjourney通常情况下,AI模型的"幻觉"——即生成虚假或不准确信息的倾向——被认为是一个严重的
还在为处理各种格式的非结构化文档而烦恼吗?Fireworks AI近日推出了一项名为“Document Inlining”的创新功能,它能将PDF、截图、图像等非结构化文档转化为大语言模型(LLM)可理解的结构化文本,为聊天机器人和AI模型提供可直接使用的文字内容,大幅提升了AI处理文档的效率和准确性。Document Inlining的核心在于其强大的复合AI系统,它能自动识别和解析文档中的多种内容,包括文本、表格、图表以及嵌套布局等复杂元素,让AI能够像阅读普通文本一样理解这些文件。这款工具的操作非常简单,
OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩,标准计算条件下得分高达75.7%,而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外,但仍无法证明人工智能通用性(AGI)已被破解。ARC-AGI 基准测试基于抽象推理库(Abstract Reasoning Corpus),该测试旨在评估 AI 系统适应新任务和展示流动智力的能力。ARC 包含一系列视觉谜题,需要理解基本概念如物体、边界和空间关系。人类能够轻松解决这些谜题,而目前的 AI 系统在这方面却面临很大挑战。ARC 被认为是 AI 评估中最