関連推奨
バイトダンスが画期的なAIモデルVidi2を発表:120億パラメーターで動画編集を完全自動化
バイトダンスが120億パラメーターを持つ動画理解モデルVidi2を発表しました。このモデルは数時間分の原始素材を処理し、ストーリーの構成を理解し、プロンプトに従ってTikTokの動画や映画のカットを生成できます。その核心的突破は、正確な時空間定位(STG)機能で、動画内の時空間的な詳細を同時に認識でき、動画編集業界を大きく変えると期待されています。
昆仑万維のAI動画製品SkyReelsが11月初頭に新バージョンをリリース予定
昆仑万维のAI動画製品SkyReelsは、新バージョンが11月初頭に正式リリースされる予定であることを発表しました。昆仑万维のAI戦略により支援を受け、この製品は今後も世界中のAI動画市場での会社のリーダーシップを強化し、『誰もが本格的な動画制作に参加できる』業界のビジョンを加速して実現する見込みです。現在、世界中のユーザーはSkyReels公式サイトにアクセスし、テストリストに登録してモデル機能を体験できます。
アリ国際デジタルトレードグループAIチームがOvis2.5を発表:経済的視覚推論モデルの新突破
アリババ国際デジタル貿易グループのAIチームが多モーダル大規模言語モデルOvis2.5を発表。9Bと2Bの2サイズを提供。経済的な視覚推論ソリューションで、高解像度認識能力と画像詳細保持を特徴とする。....
昆崙万維がAI音楽モデルMureka V7.5をリリースし、MoE-TTS音声モデルを発表
2025年8月15日、昆侖万維グループはMureka V7.5を発表し、5日間のAI技術発表週間を締めくくった。毎日新モデルを公開し、多モーダルAIをカバー。Mureka V7.5はAI音楽創作に新たな進展をもたらした。....
マイクロソフト、地質図の理解を支援するGeoMap-Benchを発表
地質科学分野において、地質図は地球の表面と地下構造を理解するための重要なツールです。しかし、これらの複雑な図表を解釈するには専門知識と豊富な経験が必要です。この分野の知能化レベルを高めるため、マイクロソフトアジア研究院は最近、地質図の理解におけるマルチモーダル大規模言語モデル(MLLM)の性能を評価するために設計された新しいベンチマークセット、GeoMap-Benchを発表しました。GeoMap-Benchの発表は、地質図解釈における人工知能の応用における重要な一歩を示しています。マイクロソフトの研究者と…
