カリフォルニア大学サンタクルーズ校が開発したMiniGPT-5モデルは、Generative Vokens技術を導入することで、テキスト特徴空間と画像特徴空間の整合を実現しました。複数のデータセットにおけるテストで、比較基準を上回る性能を示し、その高い適応能力を実証しています。MiniGPT-5は、マルチモーダル生成に対し、統一的で効率的なソリューションを提供し、技術的なボトルネックを突破しました。
関連推奨
昆仑万維のAI動画製品SkyReelsが11月初頭に新バージョンをリリース予定
昆仑万维のAI動画製品SkyReelsは、新バージョンが11月初頭に正式リリースされる予定であることを発表しました。昆仑万维のAI戦略により支援を受け、この製品は今後も世界中のAI動画市場での会社のリーダーシップを強化し、『誰もが本格的な動画制作に参加できる』業界のビジョンを加速して実現する見込みです。現在、世界中のユーザーはSkyReels公式サイトにアクセスし、テストリストに登録してモデル機能を体験できます。
シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLモデルが正式リリースされ、視覚認識能力が大幅に向上
シリコンベースのフローアクセスプラットフォームにアリババのQwen3-VLオープンソースモデルがリリースされました。このモデルは視覚的理解、時系列分析、マルチモーダル推論において顕著な進歩を遂げています。画像のぼけや動画の複雑さなどの課題に対処することができ、視覚認識能力を向上させ、32言語のOCR機能をサポートし、弱い視覚情報の正確な処理が可能となり、ユーザーが複雑な視覚タスクを簡単に処理できるようにします。
アント・バイリンチームが新しくオープンソースの高性能思考モデル Ring-flash-2.0 をリリース
アント・バイリンチームが高性能思考モデルのオープンソース版であるRing-flash-2.0をリリースしました。このモデルはLing-flash-2.0-baseを深く最適化したものです。総パラメータ数は100億で、推論時に61億のパラメータのみがアクティブになります。効率的なアクティベーションメカニズムにより、強力な計算能力を実現し、リソースを大幅に節約します。複数の高難度ベンチマークテストで優れた性能を発揮し、これは人工知能分野における重要な進展を示しています。
アリババクラウドCTOが明らかにした:通義千問は300以上モデルをオープンソース化し、ダウンロード数が6億を突破
2025年雲棲大会で、Alibaba Cloud CTOの周靖人は、通義千問プロジェクトが300以上のモデルをオープンソース化し、ダウンロード数が6億回を突破したと発表。全サイズ・全モーダルをカバーし、多様なニーズに対応、AI業界の発展を支援。....
フランスのAI企業Mistral、オープンソースの推論モデル「Magistral Small 1.2」を発表
Mistral AIが新たにオープンソース推論モデル「Magistral Small1.2」をリリース。24Bパラメータを搭載し、Apache2.0ライセンスで公開。128kのコンテキスト処理、多言語・視覚入力に対応し、新機能「[THINK]トークン」を導入。前バージョン1.1から視覚エンコーダーを追加し、性能向上を実現。....
