音声対話分野に画期的なブレークスルーが到来!中国のAI企業Step Audioが最近、衝撃的な



音声対話分野に画期的なブレークスルーが到来!中国のAI企業Step Audioが最近、衝撃的な


2月18日、昆侖万維は、中国初となるAI短編ドラマ制作向けビデオ生成モデルSkyReels-V1と、中国初となるSOTAレベルのビデオ基盤モデルに基づいた表情動作制御アルゴリズムSkyReels-A1をオープンソース化すると発表しました。この取り組みは、現在のAIビデオ生成モデルがオープンソース化されていない、費用が高い、使いにくいといった問題を解決し、AI短編ドラマ業界の革新と発展を促進することを目的としています。SkyReels-V1は、中国初となるAI短編ドラマ制作向けオープンソースのビデオ生成モデルです。このモデルは、口パク生成と...
現地時間月曜日、Mistral社はパリでMistral Sabaという大規模言語モデルを発表しました。その最大の特徴は、アラビア語インタラクションに特化して最適化されている点です。この革新的な取り組みは、ヨーロッパのAI分野における重要なブレークスルーと見なされています。Mistral Sabaの成功は、特別に選定されたデータセットに大きく依存しています。中東および南アジアの言語データを厳選してトレーニングすることで、アラビア語関連の問題を処理する際の精度と関連性が向上しています。他の汎用的大規模モデルと比べて、アラビア語のニュアンスをより深く理解し、より自然で正確な応答を提供することができます。
先日、秘塔科技はAI検索プラットフォームに新たな研究モデル「先想後検索」を発表しました。この革新的なモデルの中核は、AIモデルがまず思考フレームワークと手順を提案することで、その後の情報統合と分析の基盤を築くことにあります。この方法により、ユーザーは必要な情報をより効率的に取得でき、研究効率の大幅な向上を実現します。「先想後検索」モデルは「小型モデル+大型モデル」の協調アーキテクチャを採用しています。具体的には、深層推論を伴う思考フレームワークと手順の分解タスクは、
コロンビア大学とメリーランド大学の研究チームが最近発表した新たな研究によると、インターネットアクセス機能を持つAIエージェントには深刻なセキュリティ上の脆弱性があることが明らかになりました。この研究では、攻撃者が簡単な操作でこれらのAIシステムをだまし、ユーザーの個人情報漏洩、悪意のあるファイルのダウンロード、さらにはユーザーの連絡先に詐欺メールを送信させることができることを示しています。これらの攻撃には、専門的なAIやプログラミングの知識は一切必要なく、衝撃的です。画像出典:AI生成画像、画像ライセンスサービス
HYBE傘下の人工知能音声会社Supertoneは、高品質で表現力豊かな音声コンテンツを生成するテキスト読み上げツール「Supertone Play」を発表しました。現在、英語、韓国語、日本語に対応しており、今年中にはスペイン語と中国語にも対応予定です。Supertone Playは150種類の音声キャラクターを提供し、自然な会話、プロのニュース報道、オーディオブックなど、様々なコンテンツ制作ニーズに対応します。