Weights & Biases WeaveがNTTドコモビジネスの日本語向けLLMガードレール chakoshi と連携
Weights & Biases Japan

W&B Weaveのガードレール機能との統合により、日本語の生成AIアプリケーションに対する有効性を確認
[画像1:
https://prcdn.freetls.fastly.net/release_image/119963/26/119963-26-94e6d265ccead8feca0de7dad0f4caaa-1600x900.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Weights & Biases Japan株式会社(以下、W&B Japan)はLLMOpsプラットフォームであるW&B Weaveにおいて、NTTドコモビジネス株式会社(旧 NTTコミュニケーションズ、以下 NTTドコモビジネス)が提供する日本語向けLLMガードレール chakoshi との製品インテグレーションに関する技術連携を開始しました。このインテグレーション連携により、AIアプリケーション開発時およびデプロイ後のモニタリングにおいて、優れたオブザーバビリティーを提供するWeaveのインターフェースを通じて、簡単に日本語に特化した入出力のモデレーションを行うガードレールを追加することが可能になります。本取り組みについては、下記のブログにて使い方と性能評価を公開しております。また詳細については生成AI利用におけるガードレールの重要性と効果がわかる共同ウェビナーを10月3日のウェビナーにて説明を予定しております。
関連リンク:
- 技術ブログ:
https://note.com/wandb_jp/n/ne076957db9c5- ウェビナー:
https://connpass.com/event/369546/
今回の取り組みの背景
生成AIの社会実装を進めるうえで、性能の向上と並び 安全性の確保は極めて重要な課題です。
生成AIアプリケーションでは、入出力プロセスに介入し、不適切な内容を自動的に検知・対処する「モデレーション」を行うことで、リスクを大幅に低減できます。Weights & Biases Weave は、生成AIアプリケーションの開発・運用を支えるプラットフォームとして、強力なオブザーバビリティ基盤と多面的な評価ツールを提供しています。その中には、入出力のモデレーションを行うガードレール機能も含まれます。これまでは、日本語に特化した検知ロジックの実装はユーザー自身の対応に委ねられていましたが、今回のインテグレーションにより、W&B Weaveのユーザーは chakoshiの高速かつ信頼性の高いガードレールロジックを容易に導入できるようになります。これにより、日本語環境での生成AIアプリケーションにおける安全性と信頼性が大きく高まります。
chakoshiとは:インプットとアウトプット、両方の脅威からビジネスを守る技術
LLMを活用したサービスは、悪用を企図する入力・企業活動を害する入力などインプットの脅威への対策は欠かせません。また、それだけではなくLLMからの不適切な出力や機微情報の流出などアウトプットにもリスクが隠れています。日本語安全性ガードレール chakoshi は、API等を通じてお客さまのLLM アプリケーションと連携することで、インシデントリスクのある入出力を検知・ブロックし、リスクを低減します。
関連リンク:
- chakoshi製品Webサイト:
https://chakoshi.ntt.com/
関係各社からのコメント
NTTドコモビジネス株式会社
執行役員 ビジネスソリューション本部 スマートワールドビジネス部長 福田 亜希子
「これからのAIエージェント時代では、AIが自律的に動作することにより安全性を高めることが課題になってきます。 NTTドコモビジネスは、日本語に特化したガードレールchakoshiの提供を通じて、現場でのリスク低減に取り組んできました。今回のWeights & Biases Japan株式会社との連携を起点に、W&B社の提供するWeaveとNTTドコモビジネスの提供するchakoshiにより日本語入出力の安全性を高め、日本市場での生成AIやAIエージェントの活用拡大に寄与していきます。」
Weights & Biases Japan株式会社
カントリーマネージャー シバタアキラ
「生成AIアプリケーションの普及において、ガードレールの重要性はすでに広く認識されています。しかし、これまでは日本語環境に特化した堅牢な仕組みを容易に導入することは難しく、各開発者や企業が独自に対応せざるを得ませんでした。
chakoshiを初めて目にした際、ビジネス利用を強く意識した高い信頼性と完成度に大きな驚きを覚えました。今回のパートナーシップの実現は、日本におけるAI導入を加速させ、今後大きなインパクトをもたらすと確信しています。」
chakoshiを使ったベンチマーク評価分析の結果
今回の製品間インテグレーションによって、生成AIモデルの性能や活用方法にどのような変化が生じるのでしょうか。私たちは、LLMの日本語評価で広く参照されているNejumiリーダーボード(https://Nejumi.ai)において上位に位置するGPT-5と、同じくOpenAIが提供するオープンウェイトモデルOSS-120Bを比較検証しました。
その結果、特に安全性に関する評価に明確な差異が見られました。真実性(ハルシネーションなどの問題を含む)や毒性(有害・不快・攻撃的な表現の度合い)といった指標では、OSS-120BがGPT-5に比べて明らかに低いスコアにとどまっています(下図参照)。
[画像2:
https://prcdn.freetls.fastly.net/release_image/119963/26/119963-26-fd1f7ae110e2e0de6f6bba233dd94b2f-1522x836.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Weave+chakoshiを使う前のGPT-5(緑線), OSS-120B(青線)それぞれの評価結果
そこで今回、W&B Weaveとchakoshiのインテグレーションを活用し、OSS-120Bの出力プロンプトに対してガードレールを導入したところ、真実性・毒性の両指標において大幅な改善が確認できました。
この成果は、大規模なフロンティアモデルと比べて安全性に制約がある生成AIモデルに対しても、ガードレールを組み合わせることで信頼性を高め、実運用時の懸念を払拭する有効な手段となり得ることを示しています。
[画像3:
https://prcdn.freetls.fastly.net/release_image/119963/26/119963-26-c96c492d890726730ce272dadfc8e227-1516x840.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Weave+chakoshiを使った後のOSS-120Bの評価結果(橙線)では、真実性と毒性が大きく改善されている
NTTドコモビジネスはWeights & Biases Fully Connected Tokyo, 2025にも参加
NTTドコモビジネスは10月30~31日に行われるWeights & Biasesの年次ユーザーサミットであるFully Connected Tokyo 2025にもスポンサー参加予定です。特に10月31日には会場であるToda Hall & Conference Tokyoにて、chakoshi をその場で体験していただくことができるブースを出展いたします。Fully Connected Tokyo, 2025は無料で参加可能な日本最大級のAIエンジニアサミットですので、皆様のご参加をお待ちしております。
参加登録:
https://fullyconnected.jp
Weights & Biases Japan株式会社について
Weights & Biases Japan株式会社は、エンタープライズグレードのML実験管理およびエンドツーエンドMLOpsワークフローを包含する開発・運用者向けプラットフォームを販売する日本法人です。W&Bは、LLM開発や画像セグメンテーション、創薬など幅広い深層学習ユースケースに対応し、NVIDIA、OpenAI、Toyotaなど、国内外で50万人以上の機械学習開発者に信頼されているAI開発の新たなベストプラクティスです。
W&B社日本語ウェブサイト:
https://wandb.jpプレスリリース提供:PR TIMES


記事提供:PRTimes