その他 – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信

とれまが – 個人ブログがポータルサイトに!みんなでつくるポータルサイト。経済や政治がわかる新聞社や通信社の時事ニュースなど配信
RSS
製品 サービス 企業動向 業績報告 調査・報告 技術・開発 告知・募集 人事 その他
とれまが >  ニュース  > リリースニュース  > その他

電通総研、東北大学 言語AI研究センターとStudio Ousiaとともに、AI分野における世界最高峰の国際会議「NeurIPS 2025」のコンペティションでオープンソース技術部門 優勝

株式会社電通総研

電通総研、東北大学 言語AI研究センターとStudio Ousi

- オープンソース技術を活用したDeep Researchにおける長文質問応答システム構築で高い評価を獲得 -


テクノロジーで企業と社会の進化を実現する株式会社電通総研(本社:東京都港区、代表取締役社長:岩本 浩久、以下「電通総研」)は、国立大学法人東北大学 言語AI研究センター(拠点:宮城県仙台市、センター長:鈴木 潤、以下「東北大学」)および株式会社Studio Ousia(本社:東京都千代田区、代表取締役社長:渡邉 安弘、以下「Studio Ousia」)とともに、AI分野における世界最高峰の国際会議である「NeurIPS(ニューリプス) 2025」のコンペティションへ参加し、Best Static Evaluationとして優勝したことをお知らせします。

[画像: https://prcdn.freetls.fastly.net/release_image/43138/419/43138-419-18547f9701c4f2080f1bd58ba2a8eb4e-1893x237.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
各社ロゴ


「NeurIPS」は、機械学習・深層学習・強化学習・学習理論などの分野において世界最高峰の規模と権威を持つAI研究の国際会議です。コンペティション「MMU-RAG」では、「Deep Research」と呼ばれる長文形式の質問応答を高精度かつ効率的に処理するシステムの性能が問われました。東北大学、Studio Ousia、電通総研の3者は、オープンソース技術を活用して長文質問応答に特化したシステムを構築し、高い精度と再現性が評価されました。

■ コンペティション「MMU-RAG」の概要
「NeurIPS 2025」で実施されたコンペティション「MMU-RAG(Massive Multi-Modal User-Centric Retrieval-Augmented Generation)」におけるtext-to-textトラックのオープンソース技術部門においては、Deep Research型の長文質問応答システムの性能を競いました。Deep Researchとは、ChatGPTやGeminiなどの生成AIに搭載されている自律的な情報探索・要約・回答生成までを行う高度なリサーチ機能を指します。しかし、これらは商用サービス向けに提供されるクローズドな技術であるため、学術研究やオープンな検証用途で直接利用することは困難です。そのためアカデミアでは、オープンソース技術を用いてこれらの仕組みを再現・発展させる研究が活発に進められています。
従来の研究の多くは短文形式の質問応答に焦点が当てられてきました。これは、短文であればモデルの出力と正解データを比較しやすく、検証信号を用いた学習が相対的に容易であるためです。一方、本コンペティションの課題は長文形式の質問応答であり、従来困難とされてきた長文回答の自動評価の設計と、その評価を活用した効率的な訓練手法が重要なテーマとなりました。今回のコンペティションを通じて得られた知見は、オープンソースのDeep Researchシステムを今後さらに高度化・実用化していくうえで、学術機関・企業の双方にとって有用なベンチマークと指針となることが期待されます。

■ Deep Research技術について
Deep Researchシステムは、生成AI(大規模言語モデル:LLM)を中心に、さまざまな「ツール」と呼ばれる機能を統合した高度な情報検索・分析システムです。ユーザの質問に対して、専門家による調査レポートに匹敵する精緻な回答を自動生成できる技術として注目されており、以下のような用途で活用が進みつつあります。
・市場調査や競合分析
・学術論文のサーベイや最新動向の把握
・マーケティングリサーチ
・金融データや経済指標の分析 など

こうした高度な調査能力を支える仕組みとして、従来のキーワード検索とは異なる以下の特徴があります。

1.検索意図の深い理解と調査計画の自動立案
ユーザの質問文をそのまま検索式として扱うのではなく、質問の背景や目的を推定し、複数ステップからなる調査手順を自動的に計画します。

2.広範な情報源からの自動収集
計画に従い、LLM内部の知識やインターネット上の多様な情報源、各種データベースなどから、必要な情報を段階的かつ網羅的に収集します。

3.情報の信頼性評価と出典の提示
収集した情報について、信頼性や一貫性といった複数の指標で評価し、回答に利用した情報の出典を明示します。

4.多角的な分析と高品質な洞察の生成
情報同士の関連性や整合性を検証しながら、多面的な視点から分析を行うことで、単なる要約にとどまらない質の高い洞察を提供します。

■ コンペティション「MMU-RAG」参加の背景と目的
電通総研は、自社ソリューションにおける生成AI活用の中でも、Deep Researchを重要な機能の一つとして位置付けています。特に、デジタルファイナンス領域をはじめとする知的単純作業の効率化に向けた研究開発において、これまでは主にクローズドな商用Deep Research機能を活用してきました。しかし、一般的なSaaSとして提供されるDeep Research機能は、個社ごとの要件に合わせた細かなカスタマイズが難しく、利用コストの面でも課題がありました。
そこで電通総研は、将来的にオープンソース技術を用いたDeep Research機能の内製化を現実的な選択肢とすることを見据え、東北大学およびStudio Ousiaと連携して先端技術の調査・技術検証を継続的に行うことを目的に、本コンペティションに参加しました。

■ コンペティション「MMU-RAG」の取り組みと結果
今回の取り組みではStudio Ousiaの山田氏による指揮のもと、Qwen3-Next-80B-A3B※1 をベースにDirect Preference Optimization※2を用いることで長文回答の生成精度を高めました。特に、自動評価が難しい「事実性」を適切に評価するため、Key Point Recall※3を指標とした自動評価のフレームワークを構築しました。さらに、高度な検索モジュール※4を組み込み、ハイパーパラメータを適切に調整することで、長文形式の質問応答を効率的に処理するシステムを実現しています。これらの結果、text-to-textトラックのオープンソース部門において、Best Static Evaluationとしてのトップスコアを記録し、優勝という成果につながりました。

■ 成果と将来的な応用
今回の成果により、オープンソース技術のみを用いて、Deep Researchシステムを設計・実装・評価するための知見と、再利用可能なアーキテクチャを獲得しました。この基盤を活用することで、学術研究、企業内のナレッジ活用、公共分野など、さまざまな領域で長文質問応答を中心とした高度なリサーチ機能をシステムに組み込んでいくことが可能になります。
電通総研は、自社ソリューション群にこのDeep Research機能を段階的に組み込むことで、調査・企画・文書作成・問い合わせ対応といった知的業務の効率化と高度化を図っていきます。例えば、製造業における技術文書や障害事例の横断検索、公共分野における政策立案のための資料調査、コンサルティングプロジェクトにおけるリサーチの自動化など、幅広いユースケースへの展開が見込まれます。
その中でも重要な応用分野の一つがデジタルファイナンスです。決済や融資などの金融機能が個別のサービスとして切り出されるアンバンドル化が進む中、Deep Research技術を組み込むことで、規制・ガイドラインや市場データ、企業開示情報など多様な情報源を横断的に分析し、新たな金融サービスの企画・審査・モニタリングを高度化していくことを目指します。電通総研は、デジタルネイティブな設計思想に基づくファイナンス機能群の提供を拡充し、金融を含むさまざまな産業領域での高度な意思決定を支えるプラットフォーム構築に貢献します。

■ 論文情報
タイトル:An Open and Reproducible Deep Research Agent for Long-Form Question Answering
邦訳  : 長文質問応答のためのオープンで再現可能なDeep Researchエージェント
著者 :  Ikuya Yamada, Wataru Ikeda, Ko Yoshida, Mengyu Ye, Hinata Sugimoto,Masatoshi Suzuki, Hisanori Ozaki, Jun Suzuki

<株式会社電通総研 事業開発室 データサイエンティスト 尾崎 尚憲 のコメント>
この度、 「NeurIPS 2025」 におけるコンペティション「MMU-RAG」において、現在大きな注目を集めている Deep Research アプローチを核としたシステムで優勝できたことを大変光栄に思います。多段階の情報探索と推論を組み合わせるのみならず、リーズニングモデルのチューニングを行なった今回のアプローチは、LLMの検索を人間に寄せることを目指した取り組みです。本コンペティションの参加においては、Studio Ousiaの山田氏、鈴木氏、東北大学の鈴木教授および研究室の皆さまに、心より感謝申し上げます。今回の成果を出発点として、実用的な本当に役立つ Deep Research システムの実用化・高度化に、今後も継続して取り組んでいきます。

<東北大学 言語AI研究センター センター長 鈴木潤氏 のコメント>
従来から日々利用しているWeb検索の発展形として期待され、今後の様々な調べ物において中心的な方式になる可能性を秘めたDeep Research方式に連なる技術を自分たちで独自に組み上げる貴重な機会となりました。今後の研究に有益な知見や経験を得ることができました。

<株式会社Studio Ousia チーフサイエンティスト 山田育矢氏 のコメント>
最近、ChatGPTやGeminiなどに搭載されているLLMによる自律的なリサーチ機能であるDeep Researchは、主にクローズドな商用LLMを用いて実現されていますが、オープンな技術で同様の機能を実現することは難しい課題です。今回のコンペティションで開発したオープンで再現可能なDeep Researchが、その解決の一助となり、この分野の研究がさらに発展していくことを期待します。

※1 アリババクラウド社が提供しているオープンソース大規模言語モデル
※2 スタンフォード大学から発表された報酬関数の設計や、報酬モデルの作成を行わずに、モデルを直接最適化する強化学習手法
※3 生成された文章を評価する指標で、正解の文章に含まれる重要な文章や単語が、生成された文章にどれだけ含まれているかを示す指標
※4 文書再ランク付けと要約化を用いて、生成された回答に含まれる各文章に、対応する検索文書を引用として添付するモジュール

■東北大学 言語AI研究センターについて https://langai.tohoku.ac.jp/
東北大学は、人工知能研究の一分野である自然言語処理の分野において国内最大級の研究グループを有し、人工知能研究における最高峰の国際会議に多数の論文が採択されるなど、その研究力の高さを示しています。言語AI研究センターは、これらの優れた研究者を中心として、2023年10月に設立され、生成AIを含む高度なAI技術の原理解明、AIアラインメントやセーフティ研究、およびそれらの研究で得られた知見を用いたAI基盤技術の発展を推進する役割を担っています。さらに、AI駆動型研究の推進、AI人材育成、社会実装なども含めて、幅広い領域でAI技術の発展に貢献することを目標としています。
センター名 :東北大学 言語AI研究センター
センター所在地 :宮城県仙台市青葉区荒巻字青葉6番3号09
代表者    :センター長 鈴木潤

■株式会社Studio Ousiaについて https://www.ousia.jp/
Studio Ousia(スタジオ ウーシア)は、「テキストを「使えるナレッジ」へ」をビジョンとし、自然言語処理を活用して、組織が有する情報資産から新たな付加価値を生み出すことを目的に活動をしています。
ウェブ上の知識だけではなく、組織固有の知識も活用できる大規模言語モデル(LLM)の開発に強みを持ち、プロダクト提供をはじめ、共同研究、受託開発、技術コンサルティングにより、組織の付加価値向上、課題解決を実現しています。

■電通総研について https://www.dentsusoken.com
電通総研は、「HUMANOLOGY for the future~人とテクノロジーで、その先をつくる。~」という企業ビジョンの下、「システムインテグレーション」「コンサルティング」「シンクタンク」という3つの機能の連携により、企業・官庁・自治体や生活者を含めた「社会」全体と真摯に向き合い、課題の提言からテクノロジーによる解決までの循環を生み出し、より良い社会への進化を支援・実装することを目指しています。
テクノロジーや業界、企業、地域の枠を超えた「X Innovation(クロスイノベーション)」を推進し、これからも人とテクノロジーの力で未来を切り拓き、新しい価値を創出し続けます。

* 電通国際情報サービス(ISID)は、電通総研へ社名を変更しました。
* 本リリースに記載された会社名・商品名は、それぞれ各社の商標または登録商標です。

プレスリリース提供:PR TIMES

記事提供:PRTimes

記事引用:アメーバ?  ブックマーク: Google Bookmarks  Yahoo!ブックマークに登録  livedoor clip  Hatena ブックマーク  Buzzurl ブックマーク

ニュース画像

一覧

関連ニュース

とれまがマネー

とれまがマネー

IR動画

一覧

とれまがニュースは、時事通信社、カブ知恵、Digital PR Platform、BUSINESS WIRE、エコノミックニュース、News2u、@Press、ABNNewswire、済龍、DreamNews、NEWS ON、PR TIMES、LEAFHIDEから情報提供を受けています。当サイトに掲載されている情報は必ずしも完全なものではなく、正確性・安全性を保証するものではありません。当社は、当サイトにて配信される情報を用いて行う判断の一切について責任を負うものではありません。

とれまがニュースは以下の配信元にご支援頂いております。

時事通信社 IR Times カブ知恵 Digital PR Platform Business Wire エコノミックニュース News2u

@Press ABN Newswire 済龍 DreamNews NEWS ON PR TIMES LEAF HIDE

Copyright (C) 2006-2025 sitescope co.,ltd. All Rights Reserved.