アリババクラウド魔搭、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開


本日、階躍星辰と吉利汽車集団は、階躍Stepシリーズのマルチモーダル大規模モデル2つ——Step-Video-T2V動画生成モデルとStep-Audio音声モデル——を共同でオープンソース化すると発表しました。その中で、階躍Step-Video-T2V動画生成モデルは、パラメータ数と性能において世界をリードするレベルにあります。このモデルは300億個のパラメータを持ち、204フレーム、540Pの高解像度動画を直接生成でき、生成されたコンテンツの情報密度が高く、一貫性が高いことを保証します。評価結果によると、
OpenAIは先週金曜日、オーストラリア、ブラジル、カナダ、インド、日本、シンガポール、韓国、イギリスなどの多くの国のChatGPT Proユーザー向けに最新のAIエージェントツール——Operatorを発表しました。このツールの導入は、OpenAIがAI分野で重要な拡張を果たすことを示し、ユーザーがさまざまな日常業務をより効率的に完了できるよう支援することを目的としています。Operatorは今年1月にアメリカで初めて導入されて以来、高い注目を集め、市場で少数の
OpenAIは金曜日に、オーストラリア、ブラジル、カナダ、インド、日本、シンガポール、韓国、イギリスなどの複数の国で、ChatGPT Proユーザー向けに「Operator」という名前の人工知能エージェントツールを導入することを発表しました。このツールは、チケットの予約、レストランの予約、経費報告の提出、オンラインショッピングなど、さまざまなタスクをより効率的に実行するためにユーザーをサポートすることを目的としています。「Operator」は今年1月にアメリカで最初に導入され、市場に存在するいくつかの「人工知能エージェント」ツールの一つです。
百度の文心インテリジェントエージェントプラットフォームは、DeepSeekモデルを全面的に接続し、すべてのユーザーに無料で開放しました。文心インテリジェントエージェントプラットフォームは、百度が提供する文心大モデルに基づいたインテリジェントエージェント構築プラットフォームで、ユーザーが迅速にインテリジェントエージェントアプリケーションを作成および展開するのを支援することを目的としています。
日本の人工知能スタートアップSakana AIは、「AI CUDAエンジニア」を発表しました。この革新的なAIシステムは、高度に最適化されたCUDAカーネルの自動生成を目指し、機械学習操作の実行効率を大幅に向上させます。最新のXプラットフォームからの情報によれば、このシステムは進化した大規模言語モデル(LLM)を基盤にしたコード最適化技術により、一般的なPyTorch操作の実行速度を10倍から100倍に向上させることを実現し、AI技術がGPU性能において新たなマイルストーンを打ち立てることを示しています。