その他 – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信

とれまが – 個人ブログがポータルサイトに!みんなでつくるポータルサイト。経済や政治がわかる新聞社や通信社の時事ニュースなど配信
RSS
製品 サービス 企業動向 業績報告 調査・報告 技術・開発 告知・募集 人事 その他
とれまが >  ニュース  > リリースニュース  > その他

FlashLabs、日本独占提供のLLMルーター「OrcaRouter」研究論文を公開 ― 独立ベンチマーク「RouterArena」で第2位(2026年5月提出時点)

FlashLabs株式会社

FlashLabs、日本独占提供のLLMルーター「OrcaRouter」

精度とコストを統合した評価で高スコアを記録 ― プロンプトの難易度を判定する自動ルーティングで、品質を保ちながらLLM支出を約40%削減


FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一、以下「FlashLabs」)が日本独占販売するAIルーティングゲートウェイ「OrcaRouter」が、LLMルーター評価のオープンプラットフォーム「RouterArena」において論文提出時点(2026年5月20日)の公開リーダーボードで第2位にランクインしたことを発表します。2026年5月20日の提出時点で、OrcaRouterは精度75.54%、Arenaスコア72.08を記録しました。
[画像: https://prcdn.freetls.fastly.net/release_image/138449/40/138449-40-3b09e0412a3d605d04eab3343598da5c-1376x768.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


背景
AI活用が本格化する中、企業は200以上のLLMモデルから最適なモデルを選択する必要に迫られています。しかし、単一の高性能モデルをすべての処理に使用すると、定型処理にも高コストを支払い続けることになり、AI原価が急増します。一方、手作業でのモデル選択は、新モデルのリリースごとにルールが陳腐化し、保守負担が開発チームに残ります。

この課題を解決するため、OrcaRouterは「プロンプトごとの難易度判定」と「最適モデルへの自動ルーティング」を組み合わせた適応型推論ゲートウェイとして開発されました。今回のRouterArena第2位獲得は、この技術アプローチの有効性を客観的に証明するものとなります。

研究論文の概要
発表日: 2026年5月20日(水)
論文タイトル: OrcaRouter: A Production-Oriented LLM Router with Hybrid Offline-Online Learning(arXiv:2605.30736)

OrcaRouter-Adaptive の成績:
- ランキング: 第2位(2026年5月20日提出時点)- 精度: 1,000クエリあたり1.00米ドルのコストで75.54%- 精度とコストを統合したArenaスコア: 72.08- 比較対象: GPT-5、Microsoft Azure routers、その他主要LLMルーター
Arenaスコアは、精度と金銭的コストの両方を考慮した総合評価指標であり、OrcaRouterは高精度を維持しながら極めて低コストでの運用を実現していることが証明されました。

※RouterArenaはLLMルーターを包括的に評価・比較するための初のオープンプラットフォームです。新しいルーターが随時追加・更新される継続評価型のライブ・リーダーボードであり、順位は時期により変動します。最新の順位は公式リーダーボードをご確認ください。

OrcaRouterの技術的特徴
主要機能:
1. Embedding強化LinUCBバンディットアルゴリズム:
OrcaRouterは、コンテキスト・バンディット問題としてLLMルーティングを定式化し、Embedding強化LinUCB(Linear Upper Confidence Bound)アルゴリズムを採用しています。このアプローチにより、プロンプトとLLMの親和性を共有埋め込み空間で表現し、オフライン学習とオンライン学習を組み合わせた適応的なモデル選択を実現します。

2. ハイブリッドオフライン・オンライン学習:
オフラインの人間評価データとオンラインのバンディットフィードバックを統合することで、初期段階から高精度なルーティングを提供しつつ、実トラフィックから継続的に学習します。これにより、過学習を避けながら実環境に適応します。

3. スマートウォームアップ機能:
新規モデルや未知のプロンプトパターンに対しても、スマートウォームアップ機能により、探索と活用のバランスを最適化します。実トラフィックに適応しながら、品質を維持したまま段階的に最適化を進めます。

4. 200+モデルを1エンドポイントで統合:
OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDanceを含む15社以上、合計200以上のLLMへのAPI呼び出しを、ひとつのエンドポイント・ひとつのAPIキー・ひとつの請求書に統合します。

対応環境/URL:
OrcaRouter 公式サイト
OrcaRouter 公式ドキュメント

利用可能モデル例
- Anthropic Claude Opus 4.8 API- OpenAI GPT 5.5 API- Gemini 3.5 Flash- MiniMax M3- DeepSeek V4 Pro API- Qwen3.7 Max

企業にもたらす価値
1. 高精度と低コストの両立:
RouterArenaでの第2位獲得が示すように、OrcaRouterは精度75.54%を維持しながら、極めて低コストでのルーティングを実現します。GPT-5やAzure routersと比較しても、同等以上の性能を大幅に低いコストで提供します。

2. 実トラフィックへの継続的適応:
Embedding強化LinUCBバンディットアルゴリズムにより、実際のトラフィックパターンから学習し、過学習を避けながら継続的に最適化します。新モデルのリリースや業務パターンの変化にも自動的に対応します。

3. 開発者体験の向上:
OpenAI互換のAPIにより、既存のコードを1行変更するだけで導入可能です。Base URLとAPIキーを書き換えるだけで、既存のOpenAI SDKコードは無改修で動作します。再設計も調達サイクルも書き直しも不要です。

技術的背景:コンテキスト・バンディット問題としてのLLMルーティング
従来のLLMルーティングは、事前に定義されたルールや静的な分類器に依存していました。しかし、この手法では新モデルのリリースや業務パターンの変化に対応できず、保守負担が増大します。

OrcaRouterは、LLMルーティングを「コンテキスト・バンディット問題」として定式化することで、この課題を解決しました。コンテキスト・バンディットは、強化学習の一種で、各プロンプト(コンテキスト)に対して最適なモデル(アーム)を選択する問題です。LinUCB(Linear Upper Confidence Bound)アルゴリズムは、探索と活用のバランスを取りながら、リアルタイムで最適なモデルを選択します。
さらに、OrcaRouterはプロンプトとLLMの埋め込み表現を活用することで、類似のプロンプトに対する学習を効率化し、未知のプロンプトに対しても高精度なルーティングを実現します。

今後の展開
FlashLabsは、OrcaRouterの日本市場での展開を加速し、企業のAI活用における「品質を守りながらコストを削減する」という課題解決を支援します。
RouterArenaでの継続的な評価を通じて、技術的優位性を維持しつつ、実トラフィックからのフィードバックを活用した継続的な改善を進めます。

代表コメント
FlashLabs株式会社 代表取締役 細井 洋一
「OrcaRouterがRouterArenaで第2位を獲得したことは、私たちの技術アプローチの1つの成果としてとらえています。単なる安価なモデルへの置き換えではなく、プロンプトごとの難易度を判定し、最適なモデルを選択することで、品質を守りながらコストを削減するという、本質的な価値を提供しています。
今後も、日本市場のニーズに応えるべく、円建て請求や適格請求書対応、国内データルーティングなど、日本企業が安心して導入できる環境を整備してまいります。」

OrcaRouterについて
OrcaRouterは、次世代AI推論ゲートウェイを開発する研究機関Continuum AI(本社:米国)が開発し、FlashLabs株式会社が日本独占販売するAIルーティングゲートウェイです。200以上のLLMをひとつのAPIで利用でき、マークアップ手数料ゼロ、5分で移行完了、そして本番AIコストを最大70%削減しながらフラグシップモデル並みの出力品質を維持する適応型推論ゲートウェイです。
Embedding強化LinUCBバンディットアルゴリズムにより、プロンプトごとの難易度を判定し、難しい推論はフロンティアモデルへ、定型処理は高性能なオープンモデルへ自動ルーティングします。判断根拠はリクエスト単位で可視化され、トークン上乗せは0%。導入は1行から可能です。
OrcaRourter 公式サイト

FlashLabs株式会社について
FlashLabsは、営業とカスタマーエクスペリエンスを自動化、そして最終的には自律化へ導くことを目指すAI応用研究所です。機械の処理速度・精度と人間の戦略的洞察を融合させた"Human-AI Hybrid"で、従来手法を凌駕する成果を企業にもたらします。
オープンソース音声モデルChromaシリーズの開発元として、NTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者・機械学習エンジニアに利用されています。また、Continuum AIとの日本独占ディストリビューション提携により、次世代AI推論ゲートウェイ「OrcaRouter」を日本市場に提供しています。
会社名: FlashLabs株式会社
所在地: 東京都千代田区
代表者: 代表取締役 細井 洋一
事業内容: AI応用研究、AI製品開発、AIインフラ提供
FlashLabs 公式サイト

Continuum AIについて
Continuum AIは、次世代AI推論インフラを開発する米国の研究機関です。OrcaRouterをはじめとする適応型AI技術の研究開発を行い、企業のAI活用における品質とコストの最適化を支援しています。FlashLabsとの日本独占ディストリビューション提携により、日本市場への本格展開を開始しました。
Continuum AI 公式サイト

本件に関するお問い合わせ先
FlashLabs株式会社 マーケティング部
担当: 小林 光喜
Email: koki.kobayashi@myflashcloud.com
URL: https://www.flashlabs.ai/

プレスリリース提供:PR TIMES

記事提供:PRTimes

記事引用:アメーバ?  ブックマーク: Google Bookmarks  Yahoo!ブックマークに登録  livedoor clip  Hatena ブックマーク  Buzzurl ブックマーク

ニュース画像

一覧

関連ニュース

とれまがマネー

とれまがマネー

IR動画

一覧

とれまがニュースは、時事通信社、カブ知恵、Digital PR Platform、BUSINESS WIRE、エコノミックニュース、News2u、@Press、ABNNewswire、済龍、DreamNews、NEWS ON、PR TIMES、LEAFHIDEから情報提供を受けています。当サイトに掲載されている情報は必ずしも完全なものではなく、正確性・安全性を保証するものではありません。当社は、当サイトにて配信される情報を用いて行う判断の一切について責任を負うものではありません。

とれまがニュースは以下の配信元にご支援頂いております。

時事通信社 IR Times カブ知恵 Digital PR Platform Business Wire エコノミックニュース News2u

@Press ABN Newswire 済龍 DreamNews NEWS ON PR TIMES LEAF HIDE

Copyright (C) 2006-2026 sitescope co.,ltd. All Rights Reserved.