スマートフォンで大規模モデルを実行する壁を打破　面壁インテリジェントと清华大学がエッジ側新製品BitCPM-CANNをオープンソース化

面壁インテリジェントは近日、清华大学およびOpenBMBオープンソースコミュニティと共同で、低ビット大規模モデル訓練分野における最新の突破成果であるBitCPM-CANNを正式に発表し、オープンソース化しました。この成果は华为昇腾プラットフォーム上でネイティブに実行され、エッジ側AI大規模モデルにおいて軽量化と工学的実装の面で重要な一歩を踏み出しました。

6倍のメモリリターンを解放し、ハードウェアの制限を打ち破る

今回のオープンソース化されたBitCPM-CANNには、0.5B、1B、3B、8Bの4つのモデルサイズが含まれており、同じサイズの全精度バージョンモデルと比較してテストを行った結果、非常に優れた性能を示しました。従来のBF16精度に比べて、このモデルは推論フェーズにおいて約6倍のメモリリターンを解放でき、大規模モデルを動作させるハードウェアの要件を大幅に下げています。

スマートフォン業界において、6倍のメモリリターンは、もともと高い仕様要件を必要としていた8Bパラメータレベルの大規模モデルが、現在では主流のハイエンドスマートフォンでもスムーズに動作できるようになることを意味しています。このメモリ空間の最大限の解放により、エッジ側AI技術がモバイルデバイスでの普及と商用化を加速することになります。

高い能力保持率により工学的再現性を証明

モデルの体積を縮小しながらも、BitCPM-CANNは極めて高い性能を維持しており、モデルの能力保持率は90％から97.2％の間で安定しています。そのうち、3つの主要なモデルサイズの能力保持率はすべて95.7％〜97.2％に達しており、最も小さな0.5Bモデルでも保持率は90％を超えています。

このような目覚ましい評価結果は、低ビット訓練技術ルートの強い拡張性と工学的な再現性を体系的に証明しています。面壁インテリジェントは、関連する主なフレームワークを基盤として、完全な低ビット訓練の基盤を構築し、環境の適合、32K長シーケンスのサポート、統合演算子などの包括的なエンジニアリングシステムを含んでおり、昇騰向けの低ビット訓練作業の後続のための公共インフラストラクチャを強固に構築しました。

面壁インテリジェントが清华大学と共同で中国初の1.58ビット大モデルBitCPM-CANNを発表

面壁智能、清華大学、OpenBMBオープンソースコミュニティが協力し、中国初の华为昇腾プラットフォームに基づく三値（1.58ビット）大規模モデルBitCPM-CANNを公開・オープンソース化。低ビット訓練分野でブレークスルーを達成し、量子化演算子から訓練アルゴリズムまでの全チェーンをネイティブ開発。0.5Bから8Bの4サイズ版を提供し、国産計算プラットフォームの強力な実力を示した。....

面壁智能と追知工科が戦略的提携、産業AI垂直領域モデルを共同開発

北京面壁智能科技有限責任公司と上海追知工程科技有限公司は先日、戦略的提携を発表しました。これは、産業分野向けの人工知能エッジモデルを共同開発することを目的としています。本提携は、面壁智能のエッジ大規模モデル、画像大規模モデル、および具象知能の多様なシナリオにおける応用技術の強みと、追知工科の製造業市場、シナリオ、工程、工学経験における豊富な蓄積を組み合わせ、産業の高度化を推進します。

面壁智能、数億元規模の新たな資金調達を実施　エッジ側AI大規模モデル等の商業化を加速

北京市に拠点を置く面壁智能科技有限責任公司は、このほど数億元規模の新たな資金調達を実施したことを発表しました。本ラウンドは、龍芯創投、鼎暉百孚、中関村科学城基金、賽富投資基金が共同でリードインベスターとなり、北京市人工知能産業投資基金と清科創投が追加投資、万甲資本が独占的な財務アドバイザーを務めました。面壁智能は、この資金を活用してエッジ側AI大規模モデルの商業化を加速させ、同等のパラメーター数でより高い性能、より低い消費電力、より高速な処理を実現する高効率大規模モデルサービスを提供することにより、各業界への高度なサービス提供とユーザーへの具体的な価値創出を目指します。

面壁智能と百度智能云が協力し、大規模モデルのエンドクラウド協調ソリューションを共同開発

10月30日、面壁智能と百度智能云は戦略的提携を発表しました。両社は、大規模モデルのエンドクラウド協調ソリューションの開発に共同で取り組む予定です。この協力協定に基づき、百度智能云の千帆大規模モデルプラットフォーム、文心シリーズ大規模モデル、および面壁MiniCPMシリーズの端末側大規模モデル、複数の端末と様々なシナリオにおける最先端技術蓄積を活用し、エンドクラウド協調技術ソリューションを共同で開発・普及させます。これにより、具象知能、スマート端末、エッジコンピューティングなど、実際の適用シナリオにおける大規模モデルの効果をさらに向上させ、大規模モデルの推論コストを削減します。

面壁智能と長城汽車が連携、大規模言語モデル技術の自動車分野への応用を深化

北京面壁智能科技有限責任公司と長城汽車股份有限公司は先日、戦略的協力協定を締結しました。これは両社の大規模言語モデル技術の自動車分野における研究開発と応用における協力を深化させることを目的としています。協定に基づき、面壁智能は端側大規模言語モデル技術の研究開発と応用能力を生かし、長城汽車のAI大規模言語モデル技術とデータ蓄積とを組み合わせることで、自動車製品における大規模言語モデル技術の応用とイノベーションを推進します。これにより、長城汽車のスマートモビリティとユーザーサービスに新たな技術的な推進力を与え、ユーザーエクスペリエンスの向上に繋がる見込みです。

スマートフォンで大規模モデルを実行する壁を打破 面壁インテリジェントと清华大学がエッジ側新製品BitCPM-CANNをオープンソース化