関連推奨
バイチューティアが香港科技大学と共同でMMProLongを発表:長文のLMM訓練用Q&Aデータの効率はOCR変換を大幅に上回る
バイチューティアSeedチームと香港科技大学が共同でMMProLongモデルを発表しました。Qwen2.5-VLに基づき、長文処理の効率においてマルチモーダル大規模言語モデルの新たな突破を達成しました。研究では、データの構造が長文の理解力に与える影響が鍵であることが明らかにされ、従来のトレーニング手法を打ち破り、現在のLMMトレーニングにおける課題に直接対応することになりました。
DeepSeek V4が来週発売: ネイティブな音声・映像・画像生成をサポートし、国内のコンピューティング能力に対応
深度求索は来週、画像・動画・テキスト生成をネイティブサポートする多モーダル大規模モデルV4をリリース。国内の高性能低コストオープンソース多モーダルモデル市場の空白を埋める。1月のR1推論モデル以来の初の大型アップデート。初期は簡易技術説明を提供、1ヶ月後に詳細なエンジニアリングレポートを公開。V4は華為・寒武紀と基盤エコシステムで連携済み。....
DeepSeek V4の発表が間近!新たなマルチモーダルモデルでAIの生成をよりスマートに
深度求索は来週、画像・動画・テキスト生成をネイティブサポートするマルチモーダル大規模モデル「DeepSeek V4」をリリース。国内の低コストオープンソースモデル需要に対応し、AI発展を推進。技術概要も同時公開、詳細版は約1ヶ月後予定。....
5億ドルを投じた後、さらに千万ドルを投資!クンラン・ワンウェイが海外AIドラマをリード 8000万月間利用者の裏にある収益術
昆仑万维は海外AIショートドラマ市場で力を入れ続け、5億ドル投資後にさらに数千万ドルを追加し、創作エコシステムを強化。傘下のDramaWaveとFreeReelsは月間アクティブユーザー8000万人、月間売上高4000万ドルを突破し、強い市場支配力と収益力を示している。....
バイトダンスが画期的なAIモデルVidi2を発表:120億パラメーターで動画編集を完全自動化
バイトダンスが120億パラメーターを持つ動画理解モデルVidi2を発表しました。このモデルは数時間分の原始素材を処理し、ストーリーの構成を理解し、プロンプトに従ってTikTokの動画や映画のカットを生成できます。その核心的突破は、正確な時空間定位(STG)機能で、動画内の時空間的な詳細を同時に認識でき、動画編集業界を大きく変えると期待されています。
