上海人工知能研究所は先日、低コストの大規模モデル訓練ツールキット「XTuner」を発表しました。これは様々なハードウェアに対応しており、開発者はわずか8GBのコンシューマー向けビデオメモリで、特定のニーズに合わせた「専用の大規模モデル」を訓練することができます。これにより、訓練コストのハードルが大幅に低くなります。XTunerは、書生・浦語、Llamaなど複数のオープンソースの大規模モデルに対応し、増分事前学習、指示微調整などのタスクを実行できます。同時に、使いやすさと設定可能性を両立しており、増分事前学習、シングルターン&マルチターン対話指示微調整、ユーティリティ指示微調整の標準化されたワークフローを内蔵しているため、開発者はデータ自体に集中できます。XTunerは、上海人工知能研究所が推進する大規模モデルの研究開発と応用における包括的なオープンソースシステムの実用的なツールとしての地位をさらに強化し、業界全体で技術の進歩を促進します。
関連推奨
テンセントクラウド、星脈ネットワーク2.0を発表 大規模モデルのトレーニング速度を20%向上
テンセントクラウドは最近、大規模モデルのトレーニング効率を向上させることを目的としたアップグレード版の星脈ネットワーク2.0を発表しました。以前のバージョンでは、大規模モデルの計算結果の同期通信時間が50%以上を占め、効率が低下していました。新バージョンの星脈ネットワーク2.0では、複数の側面でアップグレードが実施されました。
中興通訊、大規模モデル訓練に対応した最新のAIサーバーを発表
中興通訊は、中小規模モデルのトレーニングと推論ニーズに対応した最新のAIサーバーを発表しました。G5シリーズサーバーを発表し、今年中には大規模モデルのトレーニングに対応した最新のAIサーバーを発表する予定です。
AI大規模モデル訓練の裏側、データ産業チェーンが形成されつつある
データは新たな生産要素として、データ産業チェーンを形成しつつあります。大規模モデルの訓練には膨大な高品質なデータが必要であり、データは将来の大規模モデル企業のコアコンピタンスの一つとみなされています。データの計算と取引は、権利確定、セキュリティ管理など多くの課題に直面しています。
Runway、映画レベルのビジュアル表現を生み出す新たなAI画像ジェネレーター「Frames」を発表
AIメディアテクノロジー企業Runwayは、最新のテキストから画像生成モデル「Frames」を発表しました。AIビデオモデルで知られるRunwayが、画像創作分野における影響力の拡大を目指した取り組みです。Framesは、特に映画のような視覚効果の生成において高い評価を得ており、ユーザーから広く好評を得ています。このモデルは2024年11月に初めて発表され、過去数週間はRunwayクリエイタープログラムのユーザーに先行体験版が提供されていました。
OpenAI、数週間以内にo3-miniを発表、性能はo1-proをやや下回る
先日、OpenAIのCEOであるサム・アルトマンがソーシャルメディアで、期待が高まっているo3-miniが数週間以内に正式発表されることを明らかにしました。このニュースは、人工知能の発展に関心を持つ多くのユーザーを興奮させました。大規模言語モデルの蒸留版であるo3-miniは、APIとウェブインターフェースの両方を同時に提供し、ユーザーのニーズをさらに満たします。o3-miniの性能は、以前のo1-proには及びませんが、速度は向上しています。これについて、OpenAIの研究科学者であるホン・ウ・レン氏は...
