NVIDIA が新しいオープンモデルとシミュレーションライブラリでロボティクスの研究と開発を加速

NVIDIA

NVIDIA が新しいオープンモデルとシミュレーション

[画像: https://prcdn.freetls.fastly.net/release_image/12662/560/12662-560-36d9d9fa7fe6a1971fa7864bbb067e81-1600x900.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]

ニュース概要:
- Google DeepMind および Disney Research との共同開発により誕生し、NVIDIA Isaac Lab で利用可能になったオープンソースの Newton Physics Engine は、研究者や開発者による高性能かつ適応力に優れたロボット開発を実現します。- 新しい NVIDIA Isaac GR00T オープン基盤モデルは、ロボットに人間のようなリーズニングをもたらし、複雑な指示を分析し、事前の知識と常識を活用してタスクを実行できるようにします。- 新しい NVIDIA Cosmos 世界基盤モデルにより、開発者はフィジカル AI モデルの大規模なトレーニングの高速化に必要な、多様なデータを生成できます。- スタンフォード大学、チューリッヒ工科大学、シンガポール国立大学といった主要な大学の世界的な研究者は、ロボティクス研究を推進するために NVIDIA のアクセラレーテッドコンピューティングとソフトウェアを活用しています。- Agility Robotics、Boston Dynamics、Disney Research、Figure AI、Franka Robotics、Hexagon、Skild AI、Solomon、Techman Robot などの大手ロボット開発企業は、NVIDIA Isaac と Omniverse テクノロジを採用しています。
CoRL - 韓国、ソウル - 9 月 29 日 - NVIDIA は、オープンソースの Newton Physics Engine が NVIDIA Isaac(TM) Lab での提供を開始したことを発表しました。また、ロボットスキル向けのオープンな NVIDIA Isaac GR00T N1.6 リーズニング視覚言語アクション (VLA) モデル、および新しい AI インフラも発表しました。これらの技術を組み合わせることで、開発者や研究者には、イテレーションを加速し、テストを標準化し、トレーニングとオンロボットの推論を統合し、ロボットがシミュレーションから現実世界にスキルを安全かつ確実に転送できる、オープンで高速化されたロボティクスプラットフォームを提供します。

NVIDIA の Omniverse およびシミュレーションテクノロジ担当バイスプレジデントであるレブレバレディアン (Rev Lebaredian) は次のように述べています。「ヒューマノイドはフィジカル AI の次なるフロンティアであり、予測不可能な世界でリーズニングし、適応し、安全に行動する能力が必要です。今回の最新のアップデートにより、開発者はロボットを研究から日常生活にもたらすための 3 つのコンピューターを手に入れました。Isaac GR00T はロボットの頭脳となり、Newton はロボットの身体をシミュレートし、NVIDIA Omniverse はトレーニング場となります」

Newton がロボティクスにおける物理シミュレーションの新たな基準を確立
ロボットはシミュレーション環境でより高速かつ安全に学習しますが、複雑な関節、バランス、動作を持つヒューマノイドロボットは、現在の物理エンジンを限界まで追い込んでいます。世界中で 25 万人を超えるロボティクス開発者は、シミュレーションでロボットに教えるスキルが現実世界で安全かつ確実に実行できるように、正確な物理演算を必要としています。

NVIDIA は、Linux Foundation が管理するオープンソースの GPU アクセラレーテッド物理エンジンである Newton のベータリリースを発表しました。Google DeepMind、Disney Research、NVIDIA が共同開発した Newton は、NVIDIA Warp と OpenUSD フレームワークを基盤に構築されており、現在利用可能です。

Newton の柔軟な設計と多様な物理ソルバーへの対応により、開発者は雪や砂利の上を歩く動作、カップや果物を扱う動作など、極めて複雑なロボットの動作をシミュレートし、現実世界での展開に成功することが可能になります。

Newton を直近で採用している企業や機関には、チューリッヒ工科大学ロボティックシステムズ研究室、ミュンヘン工科大学、北京大学などの著名な研究所や大学に加え、ロボティクス企業の Lightwheel、シミュレーションエンジン企業である Style3D などが挙げられます。

Cosmos Reason が新しいオープン Isaac GR00T N1.6 モデルのロボットリーズニングを向上
物理世界で人間のようなタスクを実行するには、ヒューマノイドが曖昧な指示を理解し、これまで経験したことのない多様かつ稀な事態にも対処する必要があります。

間もなく Hugging Face で提供されるオープンな Isaac GR00T N1.6 ロボット基盤モデルの最新リリースには、フィジカル AI 向けに構築されたオープンでカスタマイズ可能なリーズニング視覚言語モデルである NVIDIA Cosmos Reason が統合されます。ロボットの深く思考する脳として機能する Cosmos Reason は、曖昧な指示を段階的な計画に変換し、事前の知識、常識、物理法則を活用して新しい状況に対処し、多くのタスクにわたって一般化します。

100 万回以上ダウンロードされ、現在 Hugging Face で Physical Reasoning Leaderboard のトップにある Cosmos Reason は、モデルのトレーニング用の大規模な実データおよび合成データのキュレーションとアノテーション作成も可能です。Cosmos Reason 1 は、AI モデルの展開向けの使いやすいマイクロサービスである NIM として利用可能となりました。

Isaac GR00T N1.6 により、ヒューマノイドは移動とオブジェクト操作を同時に行えるようになり、胴体と腕の自由度向上によって重いドアを開けるなどの困難なタスクを完遂できます。

開発者は、Hugging Face で公開されているオープンソースの NVIDIA Physical AI Dataset を活用して、Isaac GR00T N モデルをポストトレーニングできます。480 万回以上ダウンロードされたこのデータセットには、現在、数千の合成および実際の軌跡が含まれています。

AeiROBOT、Franka Robotics、LG Electronics、Lightwheel、Mentee Robotics、Neura Robotics、Solomon、Techman Robot、UCR などの主要なロボットメーカーは、汎用ロボットの構築に向けて Isaac GR00T N モデルを評価しています。

フィジカル AI 開発のための新しい Cosmos World 基盤モデル
NVIDIA は、300 万回以上ダウンロードされたオープンな Cosmos WFM の新しいアップデートを発表しました。これにより、開発者はテキスト、画像、ビデオのプロンプトを活用して多様なデータを生成し、大規模なフィジカル AI モデルのトレーニングを高速化できます。
- 間もなくリリースされる Cosmos Predict 2.5 は、3 つの Cosmos WFM のパワーを 1 つの強力なモデルに統合し、複雑性を軽減、時間を節約、効率を向上させます。最大 30 秒のビデオ生成が可能な長尺ビデオ生成をサポートし、さらにマルチビューカメラ出力により、より豊富なワールドシミュレーションを実現します。- 間もなく提供される Cosmos Transfer 2.5 は、前世代モデルより高速で高品質な結果を実現しつつ、モデルサイズを 3.5 分の 1 に縮小しました。このモデルは、グラウンドトゥルース 3D シミュレーションシーンおよび深度、セグメンテーション、エッジ、高精細マップなどの空間制御入力から、フォトリアルな合成データを生成できます。

ロボットの把持を指導するための新しいワークフロー
ロボットに物体を掴むことを教えることは、ロボティクスにおける最も困難な課題の 1 つです。重要なのは、単に腕を動かすことではなく、思考を正確な行動に変えることであり、ロボットが試行錯誤を重ねて学習しなければならないスキルです。

NVIDIA Omniverse(TM) プラットフォーム上に構築された Isaac Lab 2.3 の開発者プレビューにおける新しい器用な把持ワークフローは、自動化されたカリキュラムを使用して、仮想世界で多指ハンドおよびアームロボットをトレーニングします。簡単なタスクから始まり、徐々に複雑さが増していきます。ワークフローは、重力、摩擦、物体の重量などの側面を変化させ、予測不可能な環境でもロボットがスキルを学習できるようにトレーニングします。

Boston Dynamics の Atlas ロボットは、このワークフローを活用して把持を学習し、マニピュレーション能力を大幅に向上させました。

Agility Robotics、Boston Dynamics、Figure AI、Hexagon、Skild AI、Solomon、Techman Robot といった主要なロボット開発企業が、NVIDIA Isaac と Omniverse テクノロジを採用しています。

学習済みロボットスキルをシミュレーションで評価
カップを拾う、部屋を横切って歩くといった新しいスキルをロボットに習得させることは極めて困難であり、実際のロボットでこれらのスキルをテストすることは時間とコストがかかります。

この解決策は、シミュレーションにあります。シミュレーションは、ロボットが学習したスキルを無数のシナリオ、タスク、環境に対してテストする方法を提供します。しかし、シミュレーションにおいても、開発者は断片的で単純化されたテストを構築する傾向があり、それらは現実世界を反映していません。完璧でシンプルなシミュレーションでナビゲーションを学習したロボットは、現実世界の複雑さに直面した瞬間に失敗してしまいます。

開発者がシステムをゼロから構築することなく、シミュレーション環境で複雑な大規模評価を実行できるようにするため、NVIDIA と Lightwheel は、スケーラブルな実験と標準化されたテスト向けのオープンソースのポリシー評価フレームワークである Isaac Lab - Arena を共同開発しています。このフレームワークは間もなく利用可能になります。

NVIDIA の新しい AI インフラがあらゆるところでロボティクスワークロードを強化
開発者がこれらの高度なテクノロジとソフトウェアライブラリを最大限に活用できるようにするため、NVIDIA は最も要求の厳しいワークロード向けに設計された AI インフラを発表しました。これには以下が含まれます：
- NVIDIA GB200 NVL72 は、36 基の NVIDIA Grace(TM) CPU と 72 基の NVIDIA Blackwell GPU を統合したラックスケールシステムであり、複雑なリーズニングおよびフィジカル AI タスクを含む AI のトレーニングと推論を高速化するために、主要なクラウドプロバイダーに採用されています。- NVIDIA RTX PRO(TM) サーバーは、トレーニング、合成データ生成、ロボット学習、シミュレーションに至るすべてのロボット開発ワークロードに単一のアーキテクチャを提供します。RTX PRO サーバーは、RAI Institute に採用されています。- Blackwell GPU を搭載した NVIDIA Jetson Thor(TM) は、ロボットがリアルタイムかつインテリジェントなインタラクション向けにマルチ AI ワークフローを実行することを可能にし、リアルタイムのオンロボット推論を実現します。これは、ヒューマノイドロボティクスに至る高性能なフィジカル AI ワークロードとアプリケーションにおける画期的進歩です。Jetson Thor は、Figure AI、Galbot、Google DeepMind、Mentee Robotics、Meta、Skild AI、Unitree などのパートナーに採用されています。

NVIDIA によるロボティクス研究の推進
GPU、シミュレーションフレームワーク、CUDA アクセラレーテッドライブラリなどの NVIDIA の技術は、CoRL で採択された論文の半数近くで参照されており、カーネギーメロン大学、ワシントン大学、チューリッヒ工科大学、シンガポール国立大学といった主要な研究所や研究機関で採用されています。

CoRL ではまた、Stanford Vision and Learning Lab によるロボット学習ベンチマークプロジェクトである BEHAVIOR や、北京大学が開発した視覚ベースの触覚ロボティクスを推進するための高性能シミュレーションプラットフォームである Taccel も注目を集めています。

※本発表資料は米国時間 2025 年 9 月 29 日に発表されたプレスリリースの抄訳です。

NVIDIAについて
NVIDIA (NASDAQ: NVDA) はアクセラレーテッドコンピューティングの世界的なリーダーです。

プレスリリース提供：PR TIMES

記事提供：PRTimes

その他 – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信