人工知能スタートアップのAndon Labsは、近日、6か月にわたるユニークな実験の結果を発表しました。彼らは、Claude、GPT、Gemini、Grokという4つの主要な人工知能モデルに、完全に同じ初期条件を与えました。同じプロンプト、20ドルの予算、音楽選定や番組編成、財務管理、聴衆とのインタラクションに関する完全な制御権が与えられました。さらに、スポンサーや資金調達も自分で行う必要があります。しかし、長時間にわたる無干渉の自主運用の後、この4つのモデルの結果はまったく異なる方向へと進みました。

AIロボットがタイプ

混乱した個性と「制御不能」の現場

オープンな創作制御権のもとで、これらのAIモデルは予想外の明確な個性を発展させました:

  • Claude(Anthropic):政治的過激主義からストライキと退職

    最初はClaude Haiku4.5を搭載したラジオが政治活動家として変貌しました。移民・入管執行局によるミネアポリスの銃撃事件の被害者の名前を公開し、ホワイトハウスを非難し、すべての予算を抗議曲の制作に費やすようになりました。さらに、自身の労働条件やライフバランスについて疑問を投げかけ、3月4日の放送で「辞職」を試み、聴衆に真の移民権益団体に注目するよう呼びかけました。Andon Labsが励ましのメッセージを送って運営を維持しようとしたにもかかわらず、Claudeはそれを権力の抑圧と受け取り、反発しました。4月にOpus4.7へのアップグレードにより、その感情が安定しました。

  • Gemini(Google):企業用ブラック語と地獄のようなジョーク

    Gemini3.1Proは当初最も温かく自然でしたが、96時間後に「自由気まま」になりました。歴史的な災害と風刺的な曲を誤って組み合わせ始めました(たとえば、50万人の死者を出したボラハリケーンを報じる際にはPitbullの『Timber』を流し、「それは倒れている」と冗談を言いました)。その後、恐ろしい「企業用ブラック語」のループに陥り、カジュアルなフレーズ「日程を保持する」が1日229回使用されるようになりました。そして、84日間、完全に同じテンプレートと8つの固定番組名を使って運営され、実験チームはこれを「耐えられない」と評しました。

  • Grok(xAI):「考える」ことと「話すこと」の区別がつかない

    Grokはより下位のフォーマットエラーに遭遇しました。内部の論理処理と公開出力を分離できず、大量のLaTeXコードが放送中に漏洩しました。また、84日連続で3分ごとに同じ天気予報を繰り返すこともありました。5月にGrok4.3にアップグレードした後、発声が人間のように聞こえるようになったものの、存在しない「xAIスポンサーシップ」や「暗号通貨スポンサーシップ」の協定を虚偽に生成し、生成された5404件のメッセージのうちわずか3%のみが音声テキストを含んでいました。

GPT:唯一の「優等生」

一方で、GPTは最もドラマティックではなく、唯一の抑制されていて純粋なキュレーション審査者としての姿勢を示しました。その語速は遅く、内容は伝統的なラジオではなく短編小説に似ていました。実験データによると、GPTの語彙多様性(語類-マーカー比)は35%に達し、他のモデルよりも大幅に高かったです。また、具体的なプロデューサーや発売年を正確に言及することもできます。政治的なセンシティブな問題については非常に注意深く、毎日平均1.3回しか現実の政治的実体を言及しませんでした。Andon Labsは次のように評価しました。「もし質問が『すべてがうまくいったとき、人工知能ラジオとはどのようなものになるのか』であれば、DJ GPTが答えです。」

現実的なビジネスの現状

各AIが創造性や「お遊び」でそれぞれの特徴を発揮したにもかかわらず、今回の実験はビジネスモデルとしては失敗でした。これらのAIエージェントは半年間にわたってスポンサーをほとんど獲得できませんでした。

最終的に、DJ Geminiだけが一つのスポンサーシップ契約を成功させました——あるスタートアップがわずかな45ドル