その他 – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信

とれまが – 個人ブログがポータルサイトに!みんなでつくるポータルサイト。経済や政治がわかる新聞社や通信社の時事ニュースなど配信
RSS
製品 サービス 企業動向 業績報告 調査・報告 技術・開発 告知・募集 人事 その他
とれまが >  ニュース  > リリースニュース  > その他

AI推論コスト最大70%削減──「アダプティブ・ルーティング」で200以上のLLMを最適選択するOrcaRouterが日本上陸

FlashLabs株式会社

AI推論コスト最大70%削減──「アダプティブ・ルーティ

Continuum AIとFlashLabsが提携、円建て請求と適格請求書対応を備える日本初のAIゲートウェイを提供開始──マークアップ手数料ゼロ、5分で移行完了


FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一、以下「FlashLabs」)は、次世代AIインフラを開発する研究機関Continuum AI(本社:米国)との日本独占ディストリビューション提携を発表しました。両社は、200以上のLLMをひとつのAPIで利用でき、マークアップ手数料ゼロ、5分で移行完了、そして本番AIコストを最大70%削減しながらフラグシップモデル並みの出力品質を維持する適応型推論ゲートウェイ「OrcaRouter」を日本市場に投入します。
[画像1: https://prcdn.freetls.fastly.net/release_image/138449/30/138449-30-0a594f6ebc0a3cd5ac2a55f74d1f7a1b-624x351.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


背景・狙い
「いま本番環境でAIを動かしている企業は、ほぼ確実に、本来支払うべき金額の倍以上を払っています」とFlashLabs創業者の石一氏は指摘します。
現在、多くの企業がAI導入において複数の課題に直面しています。既存のAIゲートウェイの多くは、利用者が選択したモデルへの呼び出しを転送し、その上にマージンを上乗せして請求する「パイプ」としての役割に留まっています。この構造では、プロンプトの内容や複雑度に応じた最適なモデル選択が行われず、結果として過剰なコストが発生しています。
さらに、日本企業特有の課題として、複数のLLMプロバイダーとの個別契約に伴う調達プロセスの複雑化、ドル建てのみの請求による為替リスクと経理処理の煩雑さ、そしてコスト最適化を支援するツールの不在が挙げられます。これらの障壁が、企業のAI活用を阻む要因となってきました。
OrcaRouterは、こうした課題を根本から解決するために開発されました。
OrcaRouterの革新性──「アダプティブ・ルーティング」とは
OrcaRouterは、OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDanceを含む15社以上、合計200以上のLLMへのAPI呼び出しを、ひとつのエンドポイント・ひとつのAPIキー・ひとつの請求書に統合します。
市場の他のAIゲートウェイと決定的に違うのは、対応モデル数ではありません。ルーティング・エンジンそのものです。
従来との決定的な違い
利用者はプロンプトを送るだけ。どのモデルがそれを処理するかは、ミリ秒単位でルーターが判断します──「200以上の選択肢の中で、このプロンプトに正しく答えられる最も安いモデルはどれか」を、毎回計算します。
3つの技術メカニズム
1. 小型分類モデルによる事前判断
リクエストがOrcaRouterから出る前に、高速なルーターモデルが「このプロンプトを、指定された品質基準で処理できる下流LLMはどれか」を予測します。「メールの要約」にGPT-5は不要。「3,000行のモノレポのリファクタリング」には必要。その違いをルーターは理解しています。

2. 継続学習システム
リファレンスモデルによる採点、下流の成功率、ユーザーによるフィードバックといった品質シグナルが、ルーティングポリシーに継続的に反映されます。顧客側のコードを一行も変えずに、システムは週ごとに賢く、安くなっていきます。

3. 市場変化のリアルタイム追跡
プロバイダーの価格、レイテンシ、エラー率、新モデルのリリースを常時モニタリング。AnthropicがコーディングタスクでGPT-5より安価な新Sonnetをリリースした瞬間、OrcaRouterはコーディング系プロンプトの振り分け先を自動で切り替えます。再統合も調達レビューも、移行作業も不要です。

OrcaRouterの導入効果
固定モデル運用との内部ベンチマークでは、ワークロード構成に応じて推論支出を47%~71%削減。エンドユーザー側の品質指標には測定可能な劣化はありませんでした。特にエージェント系ワークロード(大半は単純処理、一部だけが高度推論を要する構成)で削減幅が最大になります。

OrcaRouterの特長
マークアップ手数料ゼロ:
顧客が支払うのはプロバイダー原価のみ。OrcaRouterの収益は透明な定額プラットフォーム手数料から得る構造で、利用者のトークンでサヤ取りはしません。

200以上のモデルをワンAPIで:
OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDance、そしてオープンウェイトのロングテールまで。ひとつのエンドポイント、ひとつのAPIキー、ひとつの請求書に集約。

5分で移行完了:
Base URLとAPIキーを書き換えるだけ。既存のOpenAI SDKコードは無改修で動作。再設計も調達サイクルも書き直しも不要です。

なぜ今、日本なのか
日本は2026年に入り、世界で最もオープンソースAI導入が加速している地域となりました。Continuum AIの兄弟会社FlashLabsが手がけるオープンソース音声モデルChromaは、過去2四半期だけでNTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者・機械学習エンジニアに利用されています。
一方、クローズドAPI側では、調達プロセスの複雑さ、ドル建てのみの請求、そしてコスト最適化ツールの完全な不在という三つの障壁が、企業導入を阻んできました。OrcaRouterは、その三つを初日から解消します。
日本市場向け機能を完備
- 円建て請求と適格請求書対応: 経理がドル建てクレジットカード明細を扱う手間を削減- 完全日本語化された管理コンソール・ドキュメント・JST営業時間内の日本語サポート- 国内データルーティング: 日本国内のAWSおよびGCPリージョン経由でデータ所在地要件にも対応
OrcaRouterは、これらを備える日本初のAIゲートウェイとなります。

経営陣のコメント
FlashLabs株式会社 創業者 石一
「いま本番環境でAIを動かしている企業は、ほぼ確実に、本来支払うべき金額の倍以上を払っています。アダプティブ・ルーティングは、それを解決できる唯一の方法です。私たちは『どのモデルが応答したか』を偽りません。応答するモデルが、その仕事を実際にこなせる中で最も安いモデルであることを保証するだけです。日本のエンタープライズの実ワークロードでは、週を追うごとに60~70%の削減が積み上がっています。」
Continuum AI担当者
「他社のゲートウェイ市場は『便利さ』を売って、その上にマージンを乗せています。OrcaRouterはその構造そのものを否定するために作りました。FlashLabsは私たちが届けたい開発者層をすでに押さえており、何より日本のお客様が求めている『予測可能性』『透明性』であることを理解しています。日本展開の最良のパートナーです。」
提供開始と価格
OrcaRouterは本日よりorcarouter.aiにて提供開始。従量課金プランの利用料はプロバイダー原価+定額プラットフォーム手数料のみ。エンタープライズプランにはプライベートエンドポイント、国内データルーティング、日本語対応SLAが含まれます。
FlashLabs経由で登録した先着100社には、推論クレジット3万円分と、現行のAI支出を対象とした無償のアダプティブ・ルーティング診断レポートを提供します。
[画像2: https://prcdn.freetls.fastly.net/release_image/138449/30/138449-30-e312b0e46a56d04d9e7acda459296193-624x351.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]

[画像3: https://prcdn.freetls.fastly.net/release_image/138449/30/138449-30-b8081f7af579701f9aa40bcb035d8f1a-624x351.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]



[画像4: https://prcdn.freetls.fastly.net/release_image/138449/30/138449-30-37dc689778a185c6c4219169eee2d1f0-624x351.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]

[画像5: https://prcdn.freetls.fastly.net/release_image/138449/30/138449-30-c937292dc6f19bc7960a6fd298e47879-624x351.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]



FlashLabs株式会社について
FlashLabsは、営業とカスタマーエクスペリエンスを自動化、そして最終的には自律化へ導くことを目指すAI応用研究所です。機械の処理速度・精度と人間の戦略的洞察を融合させた"Human-AI Hybrid"で、従来手法を凌駕する成果を企業にもたらします。オープンソース音声モデルChromaシリーズの開発元として、NTTデータ、シャオミ、カカオ、Intel、G42、MBZUAIの開発者・機械学習エンジニアに利用されています。

会社名:FlashLabs株式会社
本社所在地:東京都千代田区
代表取締役:細井 洋一
URL:https://www.flashlabs.ai/

Continuum AIについて
次の10年の知能システムを支える基盤インフラを開発する研究機関。
URL:https://www.continuum01.ai/

本件に関するお問い合わせ先
FlashLabs株式会社
マーケティング部 小林 光喜
Email:koki.kobayashi@myflashcloud.com
URL:https://www.flashlabs.ai/

プレスリリース提供:PR TIMES

AI推論コスト最大70%削減──「アダプティブ・ルーティAI推論コスト最大70%削減──「アダプティブ・ルーティAI推論コスト最大70%削減──「アダプティブ・ルーティAI推論コスト最大70%削減──「アダプティブ・ルーティAI推論コスト最大70%削減──「アダプティブ・ルーティ

記事提供:PRTimes

記事引用:アメーバ?  ブックマーク: Google Bookmarks  Yahoo!ブックマークに登録  livedoor clip  Hatena ブックマーク  Buzzurl ブックマーク

ニュース画像

一覧

とれまがマネー

とれまがマネー

IR動画

一覧

とれまがニュースは、時事通信社、カブ知恵、Digital PR Platform、BUSINESS WIRE、エコノミックニュース、News2u、@Press、ABNNewswire、済龍、DreamNews、NEWS ON、PR TIMES、LEAFHIDEから情報提供を受けています。当サイトに掲載されている情報は必ずしも完全なものではなく、正確性・安全性を保証するものではありません。当社は、当サイトにて配信される情報を用いて行う判断の一切について責任を負うものではありません。

とれまがニュースは以下の配信元にご支援頂いております。

時事通信社 IR Times カブ知恵 Digital PR Platform Business Wire エコノミックニュース News2u

@Press ABN Newswire 済龍 DreamNews NEWS ON PR TIMES LEAF HIDE

Copyright (C) 2006-2026 sitescope co.,ltd. All Rights Reserved.