カリフォルニア大学サンタクルーズ校が開発したMiniGPT-5モデルは、Generative Vokens技術を導入することで、テキスト特徴空間と画像特徴空間の整合を実現しました。複数のデータセットにおけるテストで、比較基準を上回る性能を示し、その高い適応能力を実証しています。MiniGPT-5は、マルチモーダル生成に対し、統一的で効率的なソリューションを提供し、技術的なボトルネックを突破しました。
関連推奨
資金市場の注目株:智譜の時価総額が1兆円を突破 国産大モデルが高光時をむかえる
6月22日、香港市場でAI関連株が上昇。智譜AIの株価は一時40%超急騰し2980香港ドルに達し、香港株初の2000香港ドル台を維持する銘柄に。時価総額は1兆香港ドルを突破し、上場来の上昇率は2000%超。大規模言語モデル競争の過熱と米国の規制動向が背景。....
ZhiPu GLM-5.2 完全オープンソース 先端の知能をすべての人に
米国がAnthropicのAIモデルに輸出規制を実施し、非米国ユーザーの利用を制限。技術競争と独占への懸念が高まる中、中国のAI陣営は開放戦略で対抗。6月13日、智譜が関連措置を発表し、技術発展の道筋の分断が顕在化。....
グーグルがDiffusionGemmaを発表:テキスト拡散アーキテクチャを用いてAIの推論を高速化する試み
Googleが6月10日に公開したオープンソース実験モデル「DiffusionGemma」は、テキスト拡散アーキテクチャを採用し、専用GPU上でのテキスト生成速度が従来の自己回帰モデルに比べて最大4倍向上。AI生成効率の向上を目指すが、公式は慎重な姿勢を示している。....
ステップ3.7 Flash:エージェントの効率の新しい時代が本当に訪れました
本日、オープンソースモデルのステップ3.7 Flashが正式にリリースされ、Apache 2.0ライセンスで重みが公開されました。エージェント時代における効率性・信頼性・マルチモーダル実行などの主要な課題を直撃しています。複数のベンチマークテストで優れた成績を収めています:ClawEval-1.1では67.1点で1位、SimpleVQA Searchでは79.2点で1位、SWE-PROでは56.3点で2位、V* Pythonでは95.3点を記録し、エージェントタスクやコード生成においてその実力を示しています。
李開復:オープンソースモデルはAI主権を実現するより最適な道筋
李開復氏は「AI主権」の概念を提起し、その重要性が技術の制御、データのセキュリティ、モデルと本土文化・法規の適合性に及ぶことを強調した。彼は各国がオープンAIを再構築しようと無理に進む必要はなく、閉鎖的な自社開発はコストが高く現実的ではないと述べた。資源が限られた国や企業にとって、オープンソースモデルを基盤にしたローカルなシステム構築は、より実現可能な第三の選択肢であると指摘した。
