その他 – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信

とれまが – 個人ブログがポータルサイトに!みんなでつくるポータルサイト。経済や政治がわかる新聞社や通信社の時事ニュースなど配信
RSS
製品 サービス 企業動向 業績報告 調査・報告 技術・開発 告知・募集 人事 その他
とれまが >  ニュース  > リリースニュース  > その他

Qlean Dataset、「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」を提供開始

Visual Bank株式会社

Qlean Dataset、「日本語・2話者・教育テーマトーク音

~GENIAC採択企業のVisual Bank、教育精度・進路相談・学習環境を巡る対話音声データでASR/NLP/LLM開発を支援~


[画像1: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-22e0a69920f9f48fba3e4866e3036e3d-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)、NLP(自然言語処理)、LLMなどの音声・言語系AI開発に向けた「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」の提供を開始しました。

本データセットは、教育制度や進路相談、学習環境と個人の意思決定が交差するテーマなどについて、2名の話者が対話形式で意見や考えを交わす日本語音声と、その発話内容を書き起こしたトランスクリプトを組み合わせたものです。
収録にあたっては台本に依存せず、質問と応答、具体的な体験の共有、考えの整理といったやり取りが自然な流れで進行する対話構造を前提としています。2話者による発話の切り替わりや相互参照を含む音声とテキストが対応付けられており、単発発話では捉えにくい文脈理解や対話構造を伴う検証に利用できる構成としています。
Qlean Datasetは、研究用途から商用開発までを見据え、権利処理や利用条件を整理した形でAI開発用データを提供しており、本データセットもその一環として、教育・進路・学習といった領域に関する日本語対話データを必要とする研究者・開発者の検証環境整備を目的に提供されます。

今回提供を開始する「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」の概要
[表1: https://prtimes.jp/data/corp/108024/table/126_1_9888a7c6bbcc02c91ae34b9986611036.jpg?v=202601091215 ]

「日本語・2話者・教育テーマトーク音声コーパスとトランスクリプト」のユースケースイメージ

【研究用途】

- 対話音声を用いたASRモデルの評価・分析教育や進路に関する対話音声を用い、話者交替や相互応答を含む条件下での日本語音声認識精度や誤認識傾向の分析に利用できます。- 教育・進路テーマにおける対話理解研究進路選択や学習方針に関する対話トランスクリプトを用いて、話題遷移や意見形成の流れを対象とした対話理解・文脈解析手法の研究に利用できます。

【産業用途】

- 教育・進路相談を想定した対話AIの検証進路や学習に関する相談シーンを想定し、対話型AIやチャットボットにおける意図理解や応答設計の検証用データとして利用できます。- LLMの日本語対話評価・事前検証教育や学習を巡る価値観・判断を含む対話テキストを用いて、LLMの日本語対話処理能力や文脈保持性能を評価する用途に利用できます。

【その他実需要】

- 教育・学習相談サービスにおける対話品質検証進路選択や受験、子育て方針などの話題を含む対話音声を用い、教育・学習相談サービスにおける対話の自然さや応答の流れを検証するための参考データとして利用できます。- 教育関連サポート窓口における音声認識検証教育分野特有の語彙や話題を含む対話音声を用いて、問い合わせ対応や相談窓口を想定した音声認識・書き起こし精度の検証に利用できます。

『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup
[画像2: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-86db785767eb24937c8c3750aa0a26ac-1813x1116.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


[画像3: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-03ed522f5d695799a49414766ec2ac1f-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


[画像4: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-8d79506ed6f3c4d688eeb19abbd242a4-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


[画像5: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-7eb0521cc0a5292870c0d6139f8ca3b1-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]



『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴
- すべての被写体から同意取得- 既存データは最短1日で納品可能- カスタム撮影・収録・収集による独自データ構築にも対応
お問い合わせ

Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL:https://amanaimages.com/about/
【Translation】
Qlean Dataset Launches a Japanese Educational Dialogue Speech Corpus for AI Development
Supporting ASR, Conversational AI, and Dialogue Understanding in Education
[画像6: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-053bb308e7d6356faa59394b8457df2d-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai), through its subsidiary Amana Images Inc., has begun offering a “Japanese Two-Speaker Education-Themed Dialogue Speech Corpus and Transcripts” via its AI training data solution, Qlean Dataset.
This dataset is designed to support the development of speech- and language-based AI technologies, including Automatic Speech Recognition (ASR), Natural Language Processing (NLP), LLMs.

The dataset consists of Japanese dialogue audio in which two speakers discuss topics related to education, career guidance, learning environments, and personal decision-making. Each recording is provided with aligned transcripts reflecting the spoken content.
All conversations are unscripted and progress naturally through questions, responses, and the sharing of experiences. Speaker turn-taking and contextual references are preserved, making the dataset suitable for evaluating dialogue understanding and conversational structure.
Qlean Dataset provides rights-cleared data for both research and commercial AI development. This dataset is offered to support researchers and developers who require Japanese educational dialogue data for evaluation and validation purposes.

Overview of the Japanese Two-Speaker Education Dialogue Corpus
[表2: https://prtimes.jp/data/corp/108024/table/126_2_82adbff307e3394633b95996f5d91838.jpg?v=202601091215 ]

Use Case Examples for the Japanese Two-Speaker Education Dialogue Corpus

[Research Applications]

- Evaluation and Analysis of ASR Models Using Dialogue SpeechDialogue audio related to education and career guidance can be used to analyze Japanese speech recognition accuracy and error patterns under conditions involving speaker alternation and interactive responses.- Dialogue Understanding Research in Education and Career Guidance ContextsDialogue transcripts related to career choices and learning policies can be used to study dialogue understanding and contextual analysis methods, including topic transitions and opinion formation processes.

Industrial Applications

- Validation of Dialogue AI for Education and Career CounselingThe dataset can be used as evaluation data for intent understanding and response design in conversational AI and chatbots designed for education and career consultation scenarios.- Preliminary Evaluation of Japanese Dialogue Processing in LLMsDialogue text that includes values and decision-making related to education and learning can be used to evaluate Japanese dialogue handling capabilities and contextual retention performance of LLMs.

Additional Practical Use Cases

- Dialogue Quality Evaluation for Education and Learning Support ServicesDialogue audio covering topics such as career selection, entrance examinations, and parenting policies can serve as reference data for evaluating the naturalness and flow of conversations in education-related consultation services.- Speech Recognition Evaluation for Education Support Contact CentersDialogue audio containing education-specific vocabulary and topics can be used to assess speech recognition and transcription accuracy for inquiry handling and consultation desk scenarios.

About Qlean Dataset
Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.
Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”
By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.
▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en
▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineup
[画像7: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-97c191f8f305aaf5b2a2138ccb940e6f-1813x1116.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


[画像8: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-7131027df4baa2930e972b7267c1c57f-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


[画像9: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-21cceb8a2a9f240ec01b3012a1d7d68f-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


[画像10: https://prcdn.freetls.fastly.net/release_image/108024/126/108024-126-86f277bf4a80bc2d2661fbc2317b4d69-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


Key Features of Qlean Dataset
- Existing datasets deliverable within one business day- Custom data collection and recording services available
Contact

About Visual Bank Inc.
Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.
Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.

CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo
Corporate Site: https://visual-bank.co.jp/en
Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview

プレスリリース提供:PR TIMES

Qlean Dataset、「日本語・2話者・教育テーマトーク音Qlean Dataset、「日本語・2話者・教育テーマトーク音Qlean Dataset、「日本語・2話者・教育テーマトーク音Qlean Dataset、「日本語・2話者・教育テーマトーク音Qlean Dataset、「日本語・2話者・教育テーマトーク音

記事提供:PRTimes

記事引用:アメーバ?  ブックマーク: Google Bookmarks  Yahoo!ブックマークに登録  livedoor clip  Hatena ブックマーク  Buzzurl ブックマーク

ニュース画像

一覧

関連ニュース

とれまがマネー

とれまがマネー

IR動画

一覧

とれまがニュースは、時事通信社、カブ知恵、Digital PR Platform、BUSINESS WIRE、エコノミックニュース、News2u、@Press、ABNNewswire、済龍、DreamNews、NEWS ON、PR TIMES、LEAFHIDEから情報提供を受けています。当サイトに掲載されている情報は必ずしも完全なものではなく、正確性・安全性を保証するものではありません。当社は、当サイトにて配信される情報を用いて行う判断の一切について責任を負うものではありません。

とれまがニュースは以下の配信元にご支援頂いております。

時事通信社 IR Times カブ知恵 Digital PR Platform Business Wire エコノミックニュース News2u

@Press ABN Newswire 済龍 DreamNews NEWS ON PR TIMES LEAF HIDE

Copyright (C) 2006-2026 sitescope co.,ltd. All Rights Reserved.