アマゾン SageMaker AI が OpenAI API と互換性のあるリアルタイムの推論エンドポイントをリリース

最近、アマゾン SageMaker AI は OpenAI 互換 API をサポートするリアルタイムの推論エンドポイントをリリースしました。ユーザーはエンドポイント URL を変更するだけで、OpenAI SDK や LangChain または Strands Agents などのツールを使用して SageMaker AI 上のモデルを呼び出すことができ、追加のクライアントカスタマイズや SigV4 ラッピング、コードの再実装を行う必要がありません。

このアップデートにより、SageMaker AI エンドポイントは /openai/v1 パスを開設し、チャット補完のリクエストを受け付け、ストリーミング出力を含む応答を直接返すことが可能です。標準的な SageMaker AI API と SDK を使用しているすべてのエンドポイントおよび推論コンポーネントは OpenAI エンドポイントが有効になっています。URL の変更により、既存のアプリケーションがスムーズに接続できます。

SageMaker AI は豊富な機能を持ち、自前のインフラストラクチャ上でマルチステップの AI エージェントワークフローを構築することができます。例えば、Strands Agents または LangChain を使用することが可能です。ユーザーのエージェントは、もともとのフレームワークと同じ OpenAI インターフェースを使用してモデルを呼び出すことができますが、推論処理は自身の GPU インスタンスで行われます。さらに、ユーザーは同じ SageMaker AI エンドポイント上に複数のモデルをホストすることもでき、たとえば汎用的な Llama、特定の分野に微調整された Mistral モデル、そして分類用の小さなモデルなど、すべてが同じ OpenAI SDK を通じてアクセス可能です。

これらの機能を使用するには、いくつかの前提条件が必要です。AWS アカウントとその権限を持っていること、SageMaker および OpenAI の Python SDK をインストールすること、そして Amazon S3 に保存されているモデルを準備しておく必要があります。また、SageMaker AI の OpenAI 互換エンドポイントを使用するには Bearer Token 認証が必要であり、SageMaker Python SDK にはトークンを生成するためのツールが含まれており、認証プロセスを簡略化します。

実際に操作する際には、単一モデルエンドポイントまたは推論コンポーネントエンドポイントを簡単にデプロイし、複数のモデルを1つのエンドポイントでホストすることが可能です。OpenAI Python SDK を使用することで、ユーザーはこれらのモデルを簡単に呼び出し、必要な推論結果を得ることができます。この新機能のリリースにより、SageMaker AI は既存の AI アプリケーションとシームレスに統合され、ユーザーにより効率的で柔軟な推論ソリューションを提供します。

ポイント：
🌟 新規 OpenAI 互換 API：SageMaker AI のリアルタイム推論エンドポイントは OpenAI API をサポートしており、URL を変更するだけでモデルを呼び出すことができます。
🛠️ 複数モデルのホスティング：ユーザーは同じエンドポイントに複数のモデルをホストでき、同じ OpenAI SDK を使ってアクセスできます。
🔑 認証プロセスの簡略化：Bearer Token 認証をサポートしており、ユーザーが安全に SageMaker AI エンドポイントにアクセスできるようにします。

Tencentがオープンソースした多言語翻訳ツールHy-MT2の軽量版は440MBでローカルで動作可能、小程序がリリースされました

テンセント・ハンユアンは近日、多言語翻訳モデルHy-MT2をオープンソースし、「テンセントHy翻訳」の小程序も同時にリリースしました。このモデルシリーズには3つのサイズがあり、33言語間の相互翻訳および5つの民族語/方言の翻訳をサポートしています。そのうち、軽量型のHy-MT2-1.8Bは独自のAngelSlim 1.25-bit極限量化技術を使用しており、モバイル端末向けに最適化されており、品質と効率の両立を実現しています。

香港IPOの前奏：月之暗面、VIE構造の解消を開始、200億ドル規模の資本市場へ向けた突進

月之暗面（Moonshot AI）が20億ドルの出資を完了した後、組織再編を開始し、VIEおよび紅籌構造を解消しました。これは香港でのIPOに向けた規制上の障害を取り除くためです。再編の中心は、海外実体を国内合弁会社に転換し、中国のテクノロジー企業が海外で上場する際の法令遵守要件を確保することで、香港上場への道を整えることです。

グーグルのAndroid版AIプログラミングツールがアプリ作成をサポート

グーグルがAI StudioのAndroid版をリリースし、アプリ開発を簡略化するプログラミングツールです。現在Google Playでプレ登録が開始されています。このツールは直感的なインターフェースとスマートな提案により、ユーザーが指示に従って操作するだけで、人工知能を利用してアプリを作成することが可能です。初心者から経験者までにおすすめです。

腾讯会议がAI通訳機能をリリース：リアルタイム翻訳の遅延は3秒にまで低下

腾讯会议はAI通訳機能を正式リリースし、初めてすべてのユーザーに中国語と英語のリアルタイム翻訳を開放しました。これにより、国際会議や遠隔協力のコミュニケーション効率を向上させることを目指しています。この機能では、翻訳の遅延を3秒以内に制御し、発言と翻訳をほぼ同時に行うことが可能になります。従来の通訳における遅延や断層問題を効果的に解決し、参加者がよりスムーズな会話ができるようにし、情報の見逃しや誤解を防ぎます。

15人14日で映画を制作！ビットテックのSeedance2.0がカンヌでAIの破壊力を見せつける