その他 – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信

とれまが – 個人ブログがポータルサイトに!みんなでつくるポータルサイト。経済や政治がわかる新聞社や通信社の時事ニュースなど配信
RSS
製品 サービス 企業動向 業績報告 調査・報告 技術・開発 告知・募集 人事 その他
とれまが >  ニュース  > リリースニュース  > その他

世界最大級のAIデータ分析コンペティション「Kaggle」で金メダルを獲得

株式会社NTTドコモ

世界最大級のAIデータ分析コンペティション「Kaggle」


 株式会社NTTドコモ(以下、ドコモ)の鈴木明作(すずきめいさく)、宮木健一郎(みやきけんいちろう)を含むチーム(以下、本チーム)は、世界最大級のAIデータ分析コンペティションプラットフォーム「Kaggle(カグル)」※1で2025年7月から開催された国際コンペティション「Jigsaw - Agile Community Rules Classification」(以下、本コンペティション)※2において、全2,445チーム中11位に入賞し、金メダルを獲得しました。
また鈴木社員は、「Kaggle」コンペティションに参加している約20万人※3の上位約1%に相当する「Kaggle Master※4」の称号を獲得しました。
[画像1: https://prcdn.freetls.fastly.net/release_image/118641/652/118641-652-424b5791743f3097c30f0ef8c5fa3109-328x219.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
       左から鈴木明作、宮木健一郎

 「Kaggle」は、2,700万人以上※3のデータサイエンティストや機械学習エンジニアなどが登録をしており、実社会の課題に対して最先端のアルゴリズムを活用し、その精度を競うAIデータ分析コンペティションプラットフォームです。本コンペティションでは、コミュニティルール配下におけるテキスト分類がテーマであり、オンライン掲示板「Reddit」※5に投稿されたコメントが、コミュニティごとに設けられたルール(広告掲載の禁止など)に違反しているかを判定するタスクが設定され、本チームではコミュニティのルールと投稿文の文脈理解に対して、多様なAIモデルにより予測を行う手法を提案し、タスクの解決につなげることができました。

 ドコモでは、ビッグデータを活用した広告ターゲティングのための顧客理解エンジン「docomo
Sense(R)※6」など、大規模言語モデルを始めとするAIを活用した技術開発に取り組んでいます。ドコモは、今後もデータサイエンス分野の人材育成に向け、「Kaggle」を始めとするさまざまなコンペティションへの社員参加を推奨し、最先端かつ世界最高峰のAI技術を習得すると共に、得られた知見や技術を活用した新たな付加価値をお客さまに提供できるよう取り組んでまいります。

※1 https://www.kaggle.com/
※2 https://www.kaggle.com/competitions/jigsaw-agile-community-rules
※3 2025年11月21日時点
※4 Kaggleでは個人のメダル獲得枚数に応じて4つのランクが設定されており、上から2番目のKaggle Masterは金メダル1枚と銀メダル2枚以上の獲得が条件となっている
※5 https://www.reddit.com/
※6 https://ssw.web.docomo.ne.jp/marketing/strengths/sense/

*「docomo Sense」は、株式会社NTTドコモの登録商標です。
別紙
            本コンペティションの概要

1. テーマ:
本コンペティションでは、オンライン掲示板(Reddit)のコメントがコミュニティのルールに違反しているかの分類精度を競うテーマが設定されました。参加チームは提供された詳細データから問題設定に適した手法を考案し、そのテキスト分類精度を競いました。

- 提供データ(主なデータを抜粋)
 ➣ コミュニティルール︓掲示板のコミュニティごとに設けられたルールテキスト(計6つ)
     ✧ 例. 広告禁止、法的助言の禁止 など
 ➣ 正例サンプル︓コミュニティルールに違反しているサンプルテキスト
 ➣ 負例サンプル︓コミュニティルールに違反していないサンプルテキスト
 ➣ 違反判定結果︓0 or 1の二値情報

- 問題設定 本コンペティションでは、以下の図1に示す通り、オンライン掲示板であるRedditへの投稿コメンが、6つのコミュニティごとに設けられた各ルールに違反しているかを判定します。
[画像2: https://prcdn.freetls.fastly.net/release_image/118641/652/118641-652-4189c60d64c65b822aaf865589d844ce-593x227.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
               図1. 本コンペティションの問題設定


2. 提案した解法:
  鈴木社員、宮木社員を含むチームは、提供データにあるサンプルが実際にRedditに投稿された場合に、コミュニティルールの違反になるかをという情報を各AIモデルにオンラインで学習させる手法を元に、今回の解法の検討を行いました。オンライン学習を行うAIモデルには、下記のように得意分野が異なるAIモデルを13個使い、各AIモデルの予測結果を組み合わせ、更に予測対象データを予測後に作成されたラベルを使って再度予測対象データにより学習を行う疑似ラベル(Pseudo Label)や、一部のAIモデルではルールごとにAIモデルを作成するなどの工夫を行うことで、精度が高い予測結果を導く手法を提案しました(図2)。

- 活用したAIモデル
➣ LLM ※1︓テキストの次の単語を予測することが得意なAI
➣ 埋め込みモデル ※2︓テキストの意味情報の近さを扱うことが得意なAI
➣ 分類モデル ※3︓テキストの分類が得意なAI
[画像3: https://prcdn.freetls.fastly.net/release_image/118641/652/118641-652-89edd9b0f84c09702a3b595e2c312416-613x330.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
図2. 金メダル獲得解法

※1 大規模言語モデル
※2 テキストや画像などのデータを数値ベクトルに変換するモデル
※3 入力データをあらかじめ定義されたカテゴリ(クラス)に分類するための機械学習モデル

プレスリリース提供:PR TIMES

世界最大級のAIデータ分析コンペティション「Kaggle」世界最大級のAIデータ分析コンペティション「Kaggle」

記事提供:PRTimes

記事引用:アメーバ?  ブックマーク: Google Bookmarks  Yahoo!ブックマークに登録  livedoor clip  Hatena ブックマーク  Buzzurl ブックマーク

ニュース画像

一覧

関連ニュース

とれまがマネー

とれまがマネー

IR動画

一覧

とれまがニュースは、時事通信社、カブ知恵、Digital PR Platform、BUSINESS WIRE、エコノミックニュース、News2u、@Press、ABNNewswire、済龍、DreamNews、NEWS ON、PR TIMES、LEAFHIDEから情報提供を受けています。当サイトに掲載されている情報は必ずしも完全なものではなく、正確性・安全性を保証するものではありません。当社は、当サイトにて配信される情報を用いて行う判断の一切について責任を負うものではありません。

とれまがニュースは以下の配信元にご支援頂いております。

時事通信社 IR Times カブ知恵 Digital PR Platform Business Wire エコノミックニュース News2u

@Press ABN Newswire 済龍 DreamNews NEWS ON PR TIMES LEAF HIDE

Copyright (C) 2006-2025 sitescope co.,ltd. All Rights Reserved.