アリババクラウドは、視覚言語モデルQwen-VLをオープンソース化しました。これは、8月に汎用モデルQwen-7Bと対話型モデルQwen-7B-Chatをオープンソース化した後に続く、新たな大規模言語モデルです。Qwen-VLは中国語と英語に対応しており、知識質問応答、画像キャプション生成、画像質問応答など、様々な用途に使用できます。他のモデルと比較して、Qwen-VLは中国語のオープンな領域での位置特定が可能で、画像内の検出領域を正確にマークできます。Qwen-VLはQwen-7Bをベースに開発され、視覚エンコーダーを導入することで画像入力に対応しています。Qwen-VLは、複数の視覚言語タスクにおけるテストで、同等のモデルの中で最高の結果を達成しました。Qwen-VLはModelScopeなどのプラットフォームで既にオープンソース化されています。マルチモーダルは、大規模言語モデル発展の重要な方向性ですが、依然として技術的な課題が残されています。
関連推奨
知乎2025年度 AI 商品ランキングが発表され、ドウバオが首位を獲得
知乎が発表した2025年AI製品ランキングは、ユーザーフィードバックと専門評価に基づき、市場動向の信頼できる指標を提供。バイトダンスの「豆包」が「ユーザー支持No.1」を獲得し、市場での優位性を示した。....
アリババが新しいQwenモデルを発表、3秒の音声で声をクローン
アリババクラウドが2つのAI音声モデルを発表。Qwen3-TTS-VD-Flashは、ユーザーがテキスト指示で音声をカスタマイズ可能。感情やリズムを詳細に指定し、個別化された音声生成を実現。....
アイシテクノロジーとアリババクラウドが全面協力契約を締結 AIビデオのグローバル化を推進
アイシテクノロジーとアリババクラウドは全面的な協力契約を締結しました。両社はAIビデオ生成分野で深く協力し、モデル、計算リソース、製品、エコシステムおよびビジネスなど多方面にわたって取り組む予定です。技術の発展を共同で推進するものです。アリババクラウドはアイシテクノロジーにインフラストラクチャの支援を提供し、そのグローバルな展開を支援します。
23日で3000万の月間アクティブユーザーを達成!アリババ通義千問が無料で大放出 PPT、執筆、文庫、講義をすべて無料で利用可能
アリババ通義千問の公開テスト開始23日間で月間アクティブユーザー数が3000万を突破し、国内のモデルの中でも最も速い成長記録を樹立しました。同時に4つの生産性機能――AI-PPT、AI執筆、AI文庫、AI講義を永遠に無料開放し、利用のハードルや制限を設けず、広範な注目を集めています。ユーザーからのフィードバックによると、市場は単に会話ができるだけのAIではなく、実際の問題を解決できる生産性の高いツールをより好む傾向があります。
NeurIPS 2025 最優論文発表:アリババ通義千問がゲート付き注目機構で中国唯一の賞を受賞
アリババの通義千問チームがNeurIPS 2025で最優秀論文賞を受賞。論文『Attention Gating Makes Better Foundation Models』は「スライドゲート」機構を提案し、標準アテンション後に学習可能なゲートを追加して重要ヘッドとトークンを動的に選別。1.7Bパラメータモデルが15B MoEモデルと同等性能を達成。応募2万件中4作品の受賞作で唯一の中国成果。....
