阿里雲開源了視覺語言模型Qwen-VL,這是繼8月開源通用模型Qwen-7B和對話模型Qwen-7B-Chat之後,又一個開源的大模型。Qwen-VL支持中英文,可以進行知識問答、圖像標題生成、圖像問答等多種應用。相比其他模型,Qwen-VL可以進行中文開放域定位,在圖像中準確標註檢測框。Qwen-VL基於Qwen-7B研發,引入視覺編碼器,支持圖像輸入。Qwen-VL在多項視覺語言任務中的測試中,取得了同等模型最好的效果。Qwen-VL已在ModelScope等平臺開源。多模態是大模型發展的重要方向,仍面臨一定技術挑戰。
相關推薦
廣汽發佈星河智艙新架構:深度融合通義千問,打造“一次指令,全搞定”的移動第三空間
廣汽發佈星河智艙ADiGO Intelligence架構,深度融合阿里通義千問大模型,旨在革新智能座艙體驗。該架構基於超375萬輛車的真實數據,通過多模態感知、情感化交互與場景引擎三大核心,實現1.6秒內快速響應、超95%識別準確率,並能主動提供場景化服務,推動人車交互向更智能、情感化方向發展。
Apr 13, 2026
163.0k
阿里通義 CoPaw 官宣更名 QwenPaw:深度整合“千問”生態,桌面 Agent 開啓進化新階段
通義千問開源生態下的桌面智能助手CoPaw發佈1.1.0版本並完成品牌重塑,新名稱體現其與通義千問生態的深度整合。項目旨在通過軟硬協同打造更懂用戶的個人數字助理,未來將聚焦模型能力提升,從“陪伴”工具轉向“生態聚合”平臺。
Apr 13, 2026
252.0k
阿里雲百鍊上線“記憶庫”功能:支持跨會話記憶,檢索性能提升50%
阿里雲百鍊平臺上線“記憶庫”功能,解決AI Agent在多輪對話中的遺忘問題,賦予其跨會話長期記憶能力。該功能限時免費開放,支持API調用或一鍵部署。系統內置提取、存儲、檢索、注入四大模塊,可自動提取並存儲關鍵信息,實現智能記憶調用。
Apr 9, 2026
804.0k
通義千問“深度研究”上線財經分析模塊,接入萬隻股票實時行情與百萬份財報
通義千問“深度研究”功能升級,新增專業財經分析模塊,通過Agentic架構整合同花順實時金融數據,覆蓋全球股票行情及海量公司資料,實現從需求解析到信息整合的全鏈路自主分析。
Apr 7, 2026
283.8k
前Qwen 核心技術骨幹發聲:大模型正進化爲“行動派”
原阿里通義千問技術負責人林俊暘離職後首次發文,指出大模型正從“推理式思維”轉向“智能體思維”。未來重點在於模型能否爲行動而思考,並在與現實交互中持續修正計劃。
Mar 27, 2026
225.8k
