Qlean Dataset、「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」を提供開始
Visual Bank株式会社

~GENIAC採択企業のVisual Bank、サブカルチャー/精神世界領域の音声・言語データで音声系AI・言語モデル開発を支援~
[画像1:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-c0841ef0abecdea424767532eb4ca7d9-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)、音声理解、音声×言語系の基盤モデル開発などに利用される「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。
本データセットは、サブカルチャーやスピリチュアル、ヒーリングといったテーマに関する日本語文章を、日本人話者一人が落ち着いた語り口で朗読した音声データと、その発話内容を忠実に記録したトランスクリプトで構成されています。思想や概念、内省的な内容を含む文章が連続的に読み上げられる構成となっており、自然な朗読音声とテキストの対応関係を学習・検証する用途を想定しています。
単一話者による一貫した音声で構成されているため、話者特性のばらつきによる影響を抑えたモデル評価や、音声と言語の対応関係に着目した学習データとして利用しやすい点が特長です。また、会話音声ではなく朗読形式を採用していることから、構文構造や語彙の流れを含めた音声・言語表現の検証にも適しています。
本データセットは、Qlean Datasetが展開するAI開発用オリジナルデータラインナップ「AIデータレシピ」の一つとして提供され、研究用途から商用利用を前提としたAI開発まで、幅広いフェーズでの活用を想定しています。Visual Bankおよびアマナイメージズは、今後も生成AIおよび音声・言語系AI開発の現場ニーズを踏まえたデータ提供を通じて、国内外のAI研究・開発を支援していきます。
今回提供を開始する「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」の概要
[表1:
https://prtimes.jp/data/corp/108024/table/142_1_3da56469fedf5739ffcf72e39f637678.jpg?v=202602250415 ]
「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」のユースケースイメージ
- 音声認識・音声理解モデルにおける朗読音声処理の検証日本語朗読音声と対応するトランスクリプトを用い、ASRや音声理解モデルにおいて、文章構造を持つ連続発話に対する認識精度や誤り傾向の分析に利用できます。- 音声と言語表現の対応関係に関する基礎研究思想的・概念的な文章を含む朗読音声を用い、音声信号と言語表現の関係性や、意味理解に関わるモデル挙動の検証に利用できます。
- 音声入力型AIアシスタントの音声認識精度評価ナレーションや読み上げを想定した音声入力を用い、音声認識や音声理解機能を持つAIプロダクトの精度評価や改善検証に利用できます。- 音声×言語系基盤モデルのファインチューニング単一話者による朗読音声とテキストの対データを用い、音声と言語を統合的に扱う基盤モデルの学習や挙動確認に利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト:
https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:
https://qleandataset.visual-bank.co.jp/lineup
[画像2:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-0795e2ad2ccaaed72fc0c9dc2a16089e-1813x1116.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像3:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-51d9761566bb6b3c021b1a7b7deb3f4a-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像4:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-a79b5ddf5a50bea113aecc191d8e1bcd-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像5:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-e4c7c65ae2ebdcfed4cb18fbf317aeeb-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴
- すべての被写体から同意取得- 既存データは最短1日で納品可能- カスタム撮影・収録・収集による独自データ構築にも対応
お問い合せ
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL:
https://visual-bank.co.jp/
アマナイメージズ企業URL:
https://amanaimages.com/about/
Qlean Dataset Launches Japanese Read-Aloud Speech Dataset on Subculture and Spiritual Topics
Single-Speaker Audio with Transcripts for ASR Benchmarking and Speech-Language Foundation Model Fine-Tuning
[画像6:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-4278fec35be2806387541ea8e0a68e62-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai) has launched a new dataset under its AI training data solution, Qlean Dataset, through its subsidiary amanaimages Inc. The newly released dataset, titled Japanese Single-Speaker Read Speech Corpus on Subculture and Spiritual Themes with Transcripts, is designed for use in Automatic Speech Recognition (ASR), speech understanding, and speech-language foundation model development.
This dataset consists of Japanese-language texts related to subculture, spirituality, and healing themes, read aloud in a calm and steady tone by a single native Japanese speaker. Each audio recording is paired with a transcript that faithfully reflects the spoken content. The material includes conceptual and introspective narratives delivered in continuous read-aloud form, making it suitable for training and evaluating alignment between natural spoken language and structured text.
Because the corpus is recorded by a single speaker, it enables model evaluation and training with reduced variability in speaker characteristics. The read-aloud format, rather than conversational dialogue, allows clearer analysis of syntactic structure, vocabulary flow, and the correspondence between speech signals and linguistic expressions.
The dataset is provided as part of Qlean Dataset’s original AI development lineup, AI Data Recipe, and is intended for a wide range of use cases-from academic research to commercial AI system development. Visual Bank Inc. and amanaimages Inc. will continue supporting AI research and development globally by delivering structured datasets aligned with evolving needs in generative AI and speech-language technologies.
Japanese Single-Speaker Read Speech Corpus on Subculture and Spiritual Themes with Transcripts
[表2:
https://prtimes.jp/data/corp/108024/table/142_2_883b81760ccb8c21579b588722179bd4.jpg?v=202602250415 ]
Use Case Examples
- Evaluation of Read Speech Processing in ASR and Speech Understanding ModelsUsing paired Japanese read-aloud audio and transcripts, researchers can analyze recognition accuracy and error patterns in models handling continuous, structured speech. - Foundational Research on Speech-Language CorrespondenceThe dataset enables examination of relationships between speech signals and linguistic meaning, particularly in concept-driven or introspective text, supporting studies on semantic modeling and speech-language alignment.
- Accuracy Evaluation for Voice-Input AI AssistantsThe read-aloud format can be used to assess and improve recognition performance in AI products designed to process narration-style or structured spoken input. - Fine-Tuning of Speech-Language Foundation ModelsPaired single-speaker audio and text data can support training and behavioral validation of foundation models that integrate speech and language processing.
About Qlean Dataset
Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.
Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”
By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.
▶ Qlean Dataset:
https://qleandataset.visual-bank.co.jp/en
▶ AI Data Recipe:
https://qleandataset.visual-bank.co.jp/en/lineup
[画像7:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-209b86730273a554e16637e729d28c9e-1813x1116.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像8:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-058f6030aaca2ad038391e3c2c112ee9-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像9:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-a31dc09a9b8d9fe610d60bc415e21ab8-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像10:
https://prcdn.freetls.fastly.net/release_image/108024/142/108024-142-f8e163603f17a343a7df1c247a3b68af-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Key Features of Qlean Dataset
- Existing datasets deliverable within one business day- Custom data collection and recording services available
▶ Contact:
https://qleandataset.visual-bank.co.jp/en/contact
About Visual Bank Inc.
Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.
Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.
CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo 107-0062
Corporate Site:
https://visual-bank.co.jp/en
Amana Images:
https://qleandataset.visual-bank.co.jp/en/company-overviewプレスリリース提供:PR TIMES





記事提供:PRTimes