DNA言語に対する生成AI基盤モデルを開発　オーソログ進化パターンに基づく遺伝子配列再設計で異種生物での高発現を可能に～バクテリアのプラスチック分解能力を最大約10倍向上～（北里大学）

北里大学

DNA言語に対する生成AI基盤モデルを開発　オーソutf-8

北里大学未来工学部データサイエンス学科の榊原康文教授、慶應義塾大学および信州大学との共同研究グループは、系統進化の過程で保持・分化してきたオーソログ（共通祖先に由来する遺伝子）の配列パターンを学習し、導入先の生物（宿主）に適したDNA配列を生成する深層学習モデル「OrthologTransformer」を開発しました。45種の細菌を対象とした大規模ベンチマーク（450通りの種間変換）で、従来のコドン最適化を上回る性能を示し、プラスチック分解酵素PETaseを枯草菌（Bacillus subtilis）で発現させる実験では、反応生成物量が最大で約10倍向上しました。この研究成果は、2026年3月3日付で国際学術誌『Nature Communications』に掲載されました。

■研究成果のポイント

◆オーソログ（Ortholog）情報を学習する生成AI「OrthologTransformer」により、同義置換だけでなく非同義変異や挿入・欠失も自然な範囲で取り入れた遺伝子配列の再設計が可能。

◆45種の細菌・450通りの種間変換で、宿主（ターゲット種）の天然オーソログに近い配列を生成し、従来のコドン最適化や既存手法を一貫して上回る性能を確認。

◆PETase遺伝子を枯草菌で発現させる実験で、コドン最適化と比べて反応生成物量が最大約10倍に向上。

◆ゲノム全体をデザインできるプラットフォームの構築に向けた生成AI基盤モデルを確立。

■研究の背景

　医薬品や酵素生産などに利用される「異種発現」では、遺伝子を本来とは異なる生物に導入してタンパク質を作らせます。しかし、生物種ごとに好んで使うコドン（DNA上の3塩基配列）が異なるため、導入した遺伝子がうまく翻訳されず、発現量が低下することがあります。一般的な対策であるコドン最適化は、アミノ酸配列を変えずに同義コドンを置き換える手法ですが、翻訳速度やmRNA構造などの文脈依存の要因や、自然界で生じる非同義変異・挿入欠失を取り込めないという限界があります。そこで本研究グループは、自然界のオーソログが示す進化的な適応パターンを学習し、宿主により適した遺伝子配列を生成できるAIモデルの開発に取り組みました。

■研究内容と成果

　本研究グループは、オーソログ遺伝子の大規模データベース（OMA）に登録された多数の遺伝子対を学習データとして、生成モデルアーキテクチャーのトランスフォーマー（Transformer）を用いた配列変換モデル「OrthologTransformer」を構築しました。入力としてある生物種の遺伝子配列を与えると、ターゲット生物種で自然に進化したオーソログに近い配列を出力します。同義コドンの置換に加えて、タンパク質機能を保ちやすい非同義変異や挿入・欠失も、自然なオーソログパターンに基づいて提案できる点が特徴です。

　OMAデータベースと既存公開深層学習モデルの両方に含まれる45種の細菌を対象に、各ターゲット種（宿主）につき10種のソース種（遺伝子配列の由来となる生物種）を用いた計450通りの種間変換を実施しました。その結果、OrthologTransformerが生成した配列は、従来の頻度ベースのコドン最適化や既存の深層学習手法よりも、ターゲット種の天然オーソログに対するコドンレベルの配列一致度が一貫して高く、アミノ酸配列の類似性も保たれることを確認しました。

　さらに、プラスチック分解酵素PETase（Ideonella sakaiensis由来）を例に、枯草菌（Bacillus subtilis）での発現実験を行いました。OrthologTransformerで再設計したPETase遺伝子は、従来手法のコドン最適化設計のPETase遺伝子（CO）を導入した場合と比べて、PETフィルム分解で生じる生成物（MHET）の生成量が最大で約10倍増加しました（図1）。AIが提案した配列が実際の酵素生産・活性向上につながることを示す成果です。

■今後の展開

　本手法は、工業微生物での酵素・タンパク質生産、バイオものづくり、合成生物学、環境分解酵素の開発など、幅広い応用が期待されます。従来は試行錯誤が必要だった宿主最適化を、進化に基づく生成AIで効率化できる可能性があります。今後は、より多様な生物種や発現条件に対応できるようモデルを拡張し、実験検証と組み合わせた設計サイクルの高度化を進めます。さらに、真核生物にモデルを拡張することで、非コーディング配列を含むmRNAの設計にも適用可能になり、医療分野への応用も期待されます。

■論文情報

掲載誌：Nature Communications

論文名：Cross-species gene redesign leveraging ortholog information and generative modeling

著　者：Manato Akiyama, Motohiko Tashiro, Ying Huang, Mika Uehara, Taiki Kanzaki, Mitsuhiro Itaya, Masakazu Kataoka, Kenji Miyamoto, Yasubumi Sakakibara（責任著者）

ＤＯＩ：10.1038/s41467-026-69966-0

・本研究は、科学技術振興機構（JST）戦略的創造研究推進事業CREST（課題番号：JPMJCR20S3）の支援を受けて実施しました。

■用語解説

※ オーソログ（Ortholog）：
異なる生物種に存在する遺伝子のうち、共通祖先に由来し、種分化に伴って対応関係がある遺伝子。同じ働きを持つことが多い。

※ コドン最適化：
宿主が好んで使うコドン頻度に合わせて、アミノ酸配列を変えずにDNA配列（同義コドン）を置き換える設計手法。

※ トランスフォーマー（Transformer）：
自己注意（Self-Attention）機構により系列データの文脈を学習できる深層学習モデル。ChatGPTをはじめとする大規模言語モデルなどに幅広く応用されている。

■問い合わせ先

【研究に関すること】
　北里大学未来工学部データサイエンス学科人工知能研究室
　教授　榊原康文（さかきばらやすぶみ）
　e-mail：sakakibara.yasubumi@kitasato-u.ac.jp

【報道に関すること】
　学校法人北里研究所広報室
　TEL：03-5791-6422
　e-mail：kohoh@kitasato-u.ac.jp

【リリース発信元】大学プレスセンター https://www.u-presscenter.jp/

DNA言語に対する生成AI基盤モデルを開発　オーソutf-8

記事提供：Digital PR Platform

インターネット – とれまがニュース

経済や政治がわかる新聞社や通信社の時事ニュースなど配信