オープンソースモデルの新たなブレークスルー！H2O-Danube3：オフラインでも使えるモバイル向けローカルモデル

急速に発展する人工知能（AI）分野において、小型言語モデル（LLM）の重要性が増しています。消費レベルのハードウェアでも効率的に動作し、完全にオフラインのアプリケーションシナリオにも対応できます。H2O.aiチームは、複数の学術的、チャット、ファインチューニングベンチマークで高い競争力を示す、小型言語モデルシリーズであるH2O-Danube3を発表しました。

H2O-Danube3には、H2O-Danube3-4B（4億パラメーター）とH2O-Danube3-500M（5千万パラメーター）の2つのモデルが含まれています。これらのモデルは、それぞれ6Tと4Tのトークンで事前トレーニングされており、高品質のウェブデータ（主に英語トークン）を使用し、3段階の異なるデータミックスを経て、チャットバージョンに対応するために監督調整が行われました。

技術的ハイライト:

効率的なアーキテクチャ:H2O-Danube3のアーキテクチャ設計は、パラメーターと計算効率に重点を置いており、最新のスマートフォンでも効率的に動作し、ローカル推論と高速処理を実現します。
オープンソースライセンス:すべてのモデルはApache2.0ライセンスの下で公開され、大規模言語モデル（LLM）の普及をさらに促進します。
多様なアプリケーションシナリオ:H2O-Danube3は、チャットボット、研究、特定のユースケースのファインチューニングなど、モバイルデバイスでのオフラインアプリケーションにも使用できます。

H2O-Danube3は、CommonsenseQAやPhysicsQAなどで最高スコアを達成し、GSM8K数学ベンチマークでは50.14％の精度を達成するなど、複数の学術ベンチマークで優れたパフォーマンスを示しています。さらに、チャットベンチマークやファインチューニングベンチマークでも強力な性能を発揮しています。

小型言語モデルのもう1つの一般的な用途はファインチューニングです。H2O-Danube3は、テキスト分類タスクでファインチューニングされた後、優れた適応性と性能を示しました。パラメーター数が少ない500Mモデルでも、ファインチューニング後には高い競争力を発揮します。

エッジデバイスでのアプリケーションをさらに促進するために、H2O-Danube3は、性能を維持しながらモデルサイズを大幅に削減する量子化バージョンを提供しています。

H2O-Danube3の発表は、オープンソースの小型言語モデルのエコシステムを豊かにするだけでなく、さまざまなアプリケーションシナリオに強力なサポートを提供します。チャットボットから特定のタスクのファインチューニング、モバイルデバイスでのオフラインアプリケーションまで、H2O-Danube3はその幅広い適用性と効率性を示しています。

モデルダウンロードアドレス：https://top.aibase.com/tool/h2o-danube3

論文アドレス：https://arxiv.org/pdf/2407.09276

AIが抽象芸術を披露！スパゲティと42号コンクリートを混ぜ合わせた作品に、ネットユーザーのCPUがほぼ焼き付く

この記事では、革新的な動画生成におけるAI技術の応用、特に抽象的な概念を視覚化し、ユーモラスで啓発的なコンテンツを作成する方法に焦点を当てています。BilibiliのUP主がAIを使用して、抽象的なオーディオを様々な要素と場面を含む動画に変換することに成功した事例を紹介。スパゲティとコンクリートの組み合わせ、三角関数と海の融合、『天盛長歌』のセリフ「辛いのが苦手」の様々なキャラクターによる演技など、AIによる二次創作、感情の変換、創造的な場面の拡張の可能性を示しています。このような実験は、AIと人間の深い探求に繋がるでしょう。

Anthropic、ClaudeのAndroidアプリをリリースし、AIチャットボット市場シェア獲得を狙う

Anthropicは今週火曜日、AIチャットボットのユーザー基盤拡大に向けた重要な一歩として、ClaudeのAndroidアプリをリリースしました。これは、5月にiOS版をリリースしてからの取り組みです。新アプリは、ユーザーにとってより便利にClaudeを利用できるようにすることを目的としており、市場リーダーであるChatGPTへの挑戦を意味します。

商湯科技と中国国家男子バスケットボールチームが提携、AI大規模言語モデルを活用したバスケットボール製品を共同開発

商湯科技と中国国家男子バスケットボールチームは戦略的パートナーシップを締結し、商湯科技の「日日新SenseNova 5.5」大規模言語モデル技術を用いてAIバスケットボール製品を開発します。この取り組みは、AIとバスケットボール、スポーツ産業の深い統合を目指しています。商湯科技はチームの人工知能戦略パートナーとなり、運動パフォーマンス分析プラットフォームを共同で構築し、AI技術を活用して選手のトレーニング効率と競技レベルの向上を目指します。3Dモデルとモーションキャプチャアルゴリズムを通じて選手とバスケットボールの動きをリアルタイムで分析し、コーチングのための意思決定支援やトレーニング戦略の最適化を実現します。3人制バスケットボールのナショナルチームのトレーニングにも導入され、競技力の向上に貢献します。

Googleが開発したリアルタイム音声変換システムStreamVC：音質を変えつつ、イントネーションはそのまま

StreamVCは、元の音声の内容とリズムを維持しながら、リアルタイムで話者の声質を変更できる革新的な音声変換技術です。モバイルデバイスのリアルタイム通信シーンにも対応可能です。低遅延推論とSoundStreamアーキテクチャ、および白色化された基本周波数情報を使用することで、高品質の音声合成とピッチの安定性を確保し、コンテンツのエンコードとデコードメカニズムにおいて、斬新な設計と既存技術との比較において優れた性能を発揮します。HuBERTモデルから抽出された離散的な音声単位を模倣目標として、StreamVCはモバイルデバイスでの…

驚異！Claude 3.5 Sonnetがデータ可視化分野でGPT-4を凌駕