AI電話呼び出しは無意味な自慢とは言うな！声網とメイドゥーが発表したVoiceAgentEval：業界最初の評価基準でAIに人のようにさせる

長年にわたって、AI音声外呼業界は公的な「計量基準」がありませんでした。今日、アカイブとメイドゥーおよび xbench は、AI音声外呼シーンを対象にしたエージェント評価基準「VoiceAgentEval」を正式に発表しました。これは業界の空白を埋め、AIモデルが現実のビジネスシナリオに迅速に移行することを目的としています。

実験室データには頼らず、現実のビジネスで「真の金」を鍛える。

VoiceAgentEvalの最大の特徴はその「実戦性」です:

網羅性が高い:6つの主要な業務分野の30のサブシナリオをカバーし、最も現実的な市場ニーズを再現しようと試みています。

データがリアル:実際の電話営業データに基づいて構築され、従来の堅苦しいスクリプトを避けました。

二重の評価軸:テキスト生成の論理が正しいかどうかだけでなく、音声の次元での評価も追加し、AIの会話における総合的なパフォーマンスを全面的に見ています。

150種類の会話シミュレーション、AIの演習がよりスムーズに。

モデルのタスクの遵守度と汎用的なインタラクション能力をテストするために、評価フレームワークはユーザー・シミュレータを使用して150種類の仮想会話シナリオを構築しました。これはAIにさまざまなユーザーのフィードバックに対して、常に安定してビジネスプロセスを進行させることができるかを評価する「模擬試験」のようなものです。

現在のAI音声外呼で最も優れているのは誰?

この評価基準を通じての初期スクリーニングにより、現在のAI音声外呼シーンにおいて総合性能上位3つのモデルがすでに判明しています。この結果は業界に技術のベンチマークを設け、北京三快科技有限公司などの関連企業にとって、後続のAIビジネス展開において権威ある参考になります。

セキュリティ警告：Claudeのプラグインがマルウェアのステップに。Googleカレンダーが攻撃の入口に

イスラエルのセキュリティ企業LayerXは、Claude Desktop Extensionsに深刻な脆弱性を発見しました。攻撃者はGoogleカレンダーの招待を利用し、「ゼロクリック」によるリモートコード実行ができ、CVSSスコアは10/10です。脆弱性の原因は、Claudeが外部コンテナ入力を自動処理することにあり、悪意のある命令がスケジュール処理によって引き起こされる可能性があります。

AIGCが映画界を越える！中国初のAIアニメーション映画「團円令（タンユアンリング）」公開日決定：贈り物としての台湾のパンダをモデルにした、両岸の人々との絆を継ぐ

中国初のAIGCアニメーション映画「團円令（タンユアンリング）」は2月28日に公開される。この映画は民革中央と中央テレビの指導のもと制作された。映画ではすべてのAI技術が活用され、技術革新を表現するとともに、中華文化伝播の新たな道を探究し、技術と感情の融合を実現する。

アマゾンがAIコンテンツ取引プラットフォームを準備、著作権許諾の合規戦いを開拓

アマゾンはAWSクラウドサービスを通じてコンテンツ取引市場を構築する計画で、出版業者に文章などの資産を直接掲載してもらうことで、AI開発者が合法的にデータを取得できるようにし、業界の著作権紛争とデータ需要を緩和する予定である。

智譜 GLM-5 の意図せぬリーク？DeepSeekのアーキテクチャを再利用し性能は爆発的。市場価値が200％急騰し、中国国内AIトップクラスに立つ

2026年の春節期間中に中国の大規模モデル競争が爆発しました。智譜AIは新世代の大規模モデルであるGLM-5を発表し、投資市場に強い反応を引き起こしました。株価は200％上昇し、時価総額は1500億香港ドルに達しました。そのモデルは「Pony Alpha」として匿名で公開され、コード能力において優れたパフォーマンスを示しました。

AI電話呼び出しは無意味な自慢とは言うな！声網とメイドゥーが発表したVoiceAgentEval：業界最初の評価基準でAIに人のようにさせる

関連推奨

セキュリティ警告：Claudeのプラグインがマルウェアのステップに。Googleカレンダーが攻撃の入口に

FacebookがAI動的なプロフィール画像と背景を公開し、高齢者向けプラットフォームの活力を再び呼び起こそうとしている

AIGCが映画界を越える！中国初のAIアニメーション映画「團円令（タンユアンリング）」公開日決定：贈り物としての台湾のパンダをモデルにした、両岸の人々との絆を継ぐ

アマゾンがAIコンテンツ取引プラットフォームを準備、著作権許諾の合規戦いを開拓

智譜 GLM-5 の意図せぬリーク？DeepSeekのアーキテクチャを再利用し性能は爆発的。市場価値が200％急騰し、中国国内AIトップクラスに立つ