Deepgram社とIBM、エンタープライズAI向け高度音声機能を発表
日本IBM

Deepgram社はIBM初の音声パートナーとして、高速・高信頼・スケーラブルな文字起こしおよび音声技術を提供
[画像:
https://prcdn.freetls.fastly.net/release_image/46783/698/46783-698-909d07b2b1336bcb9f6edc8fec20e260-3900x1017.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
【米ニューヨーク州アーモンクおよびカリフォルニア州サンフランシスコ - 2026年2月24日(現地時間)発】IBMとDeepgram社は、Deepgram社の業界最先端の音声認識(
Speech-to-Text)および音声合成(
Text-to-Speech)機能を、IBMの生成AIソリューション「
watsonx Orchestrate」に統合する協業を発表しました。
IBMは、お客様が求める高性能かつエンタープライズ・グレードの文字起こしおよびリアルタイム字幕機能へのニーズに対応するため、Deepgram社の技術をwatsonx Orchestrateに組み込みます。本協業により、Deepgram社はIBM初の音声パートナーとなり、ユーザーが自然な音声でデジタル・エージェントと対話できる高度な音声認識機能などの企業の業務自動化や、対話型AI技術への高まる需要に応える音声AIテクノロジーを提供します。
多くの組織が、背景雑音、多様なアクセント、実環境における自然な会話などの条件下でも高精度に動作するAI搭載の音声認識システムを導入し、文字起こし業務の自動化を推進しています。今回の統合により、数十種類におよぶアラビア語のバリエーションやインドで使われる様々な言語を含む幅広い言語・方言への対応や、地域特有のアクセントを反映した音声の提供が可能になります。さらに、カスタム・チューニング、リアルタイム字幕生成、より自然な音声出力といった機能も追加されます。
これらの技術により、医療や金融分野をはじめとするさまざまな業界において、自動化された顧客対応・サポートの高度化、通話分析、音声主導型データ入力などの新たな可能性が広がります。
Deepgram社共同創業者兼CEOのスコット・スティーブンソン (Scott Stephenson)は次のように述べています。「音声は、人とテクノロジーを結ぶ主要なインターフェースとして急速に普及しています。エンタープライズ領域での展開には、高精度、低遅延、そして大規模環境でも高い信頼性を備えたリアルタイムのプラットフォームが不可欠です。Deepgramをwatsonx Orchestrate Agent Builderに組み込むことで、IBMのお客様は、10年以上にわたり開発・高度化されてきたリアルタイム基盤の上に、音声エージェントや音声対応ワークフローを構築できます」
IBMのAIテクノロジー・パートナーシップ担当バイス・プレジデント ニック・ホルダ(Nick Holda)は次のように述べています。「Deepgram社のAPIを活用したwatsonx Orchestrateとの統合により、新たな音声認識および文字起こし機能をIBMのお客様に提供し、業務の高度化とモダナイゼーションを支援します。本協業は、企業でのAI活用の加速化を目的としており、IBMのオープン・エコシステムをさらに強化しながら、最先端の音声技術と選択肢をパートナーおよびお客様に提供します」
音声インターフェースはエンタープライズAIにおいて不可欠な要素となりつつあり、本協業はIBMがモダンで柔軟なソリューションを提供する役割を一層強化します。Deepgram社は、信頼あるエンタープライズ・パートナーを通じて新たな顧客層へのアクセスを拡大できるとともに、大規模利用に対応するリアルタイム音声プラットフォームとしてのポジションをさらに確立する機会となります。
Deepgram社について
Deepgram社は、ボイスAIエコノミーを支えるリアルタイムAPIプラットフォームを提供しています。同社のVoice AIプラットフォームは、
音声認識(STT)、
音声合成(TTS)、および
音声間変換(STS)機能を備え、すべてエンタープライズ・グレードのランタイム基盤上で提供されています。20万人以上の開発者が、クラウドAPIまたはセルフホスト/オンプレミスAPIを通じてDeepgram社の音声特化型基盤モデルを活用しています。その高い精度、低遅延、競争力のある価格設定により、音声製品やプラットフォームを開発するテクノロジーISV、大企業との共同販売パートナー、社内ユースケースに取り組む企業など、幅広い顧客に利用されています。これまでに5万年以上に相当する音声データを処理し、1兆語以上を文字起こししてきた実績を持ち、音声分野における深い知見を有しています。詳細は
http://www.deepgram.com をご覧いただくか、
開発者向けドキュメント(英語)をご参照ください。また、
Xおよび
LinkedInで @DeepgramAI をフォローしてください。
IBMについて
IBMは、世界をリードするハイブリッドクラウドとAI、およびコンサルティング・サービスを提供しています。世界175カ国以上のお客様の、データからの洞察の活用、ビジネス・プロセス効率化、コスト削減、そして業界における競争力向上を支援しています。金融サービス、通信、ヘルスケアなどの重要な社会インフラ領域における数千の政府機関や企業が、IBMのハイブリッドクラウド・プラットフォームとRed Hat OpenShiftによって、迅速に、効率良く、かつセキュアにデジタル変革を推進しています。 IBMは、AI、量子コンピューティング、業界別のクラウド・ソリューションおよびコンサルティングなどの画期的なイノベーションを通じて、オープンで柔軟な選択肢をお客様に提供します。これらはすべて、信頼性、透明性、責任、包括性、ならびにサービスに対するIBMのコミットメントに裏付けられています。
IBMの将来の方向性および意図に関する記述は、予告なしに変更または撤回される場合があり、目標および目的のみを表しています。
当報道資料は、2026年2月24日(現地時間)にIBM Corporationが発表したプレスリリースの抄訳をもとにしています。原文は
こちらを参照ください。
IBM、IBMロゴ、ibm.com、watsonxは、米国やその他の国におけるInternational Business Machines Corporationの商標または登録商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、ibm.com/trademarkをご覧ください。
プレスリリース提供:PR TIMES
記事提供:PRTimes