DNA言語に対する生成AI基盤モデルを開発 オーソログ進化パターンに基づく遺伝子配列再設計で異種生物での高発現を可能に ~バクテリアのプラスチック分解能力を最大約10倍向上~(北里大学)
北里大学

北里大学未来工学部データサイエンス学科の榊原康文教授、慶應義塾大学および信州大学との共同研究グループは、系統進化の過程で保持・分化してきたオーソログ(共通祖先に由来する遺伝子)の配列パターンを学習し、導入先の生物(宿主)に適したDNA配列を生成する深層学習モデル「OrthologTransformer」を開発しました。45種の細菌を対象とした大規模ベンチマーク(450通りの種間変換)で、従来のコドン最適化を上回る性能を示し、プラスチック分解酵素PETaseを枯草菌(Bacillus subtilis)で発現させる実験では、反応生成物量が最大で約10倍向上しました。この研究成果は、2026年3月3日付で国際学術誌『Nature Communications』に掲載されました。
■研究成果のポイント
◆オーソログ(Ortholog)情報を学習する生成AI「OrthologTransformer」により、同義置換だけでなく非同義変異や挿入・欠失も自然な範囲で取り入れた遺伝子配列の再設計が可能。
◆45種の細菌・450通りの種間変換で、宿主(ターゲット種)の天然オーソログに近い配列を生成し、従来のコドン最適化や既存手法を一貫して上回る性能を確認。
◆PETase遺伝子を枯草菌で発現させる実験で、コドン最適化と比べて反応生成物量が最大約10倍に向上。
◆ゲノム全体をデザインできるプラットフォームの構築に向けた生成AI基盤モデルを確立。
■研究の背景
医薬品や酵素生産などに利用される「異種発現」では、遺伝子を本来とは異なる生物に導入してタンパク質を作らせます。しかし、生物種ごとに好んで使うコドン(DNA上の3塩基配列)が異なるため、導入した遺伝子がうまく翻訳されず、発現量が低下することがあります。一般的な対策であるコドン最適化は、アミノ酸配列を変えずに同義コドンを置き換える手法ですが、翻訳速度やmRNA構造などの文脈依存の要因や、自然界で生じる非同義変異・挿入欠失を取り込めないという限界があります。そこで本研究グループは、自然界のオーソログが示す進化的な適応パターンを学習し、宿主により適した遺伝子配列を生成できるAIモデルの開発に取り組みました。
■研究内容と成果
本研究グループは、オーソログ遺伝子の大規模データベース(OMA)に登録された多数の遺伝子対を学習データとして、生成モデルアーキテクチャーのトランスフォーマー(Transformer)を用いた配列変換モデル「OrthologTransformer」を構築しました。入力としてある生物種の遺伝子配列を与えると、ターゲット生物種で自然に進化したオーソログに近い配列を出力します。同義コドンの置換に加えて、タンパク質機能を保ちやすい非同義変異や挿入・欠失も、自然なオーソログパターンに基づいて提案できる点が特徴です。
OMAデータベースと既存公開深層学習モデルの両方に含まれる45種の細菌を対象に、各ターゲット種(宿主)につき10種のソース種(遺伝子配列の由来となる生物種)を用いた計450通りの種間変換を実施しました。その結果、OrthologTransformerが生成した配列は、従来の頻度ベースのコドン最適化や既存の深層学習手法よりも、ターゲット種の天然オーソログに対するコドンレベルの配列一致度が一貫して高く、アミノ酸配列の類似性も保たれることを確認しました。
さらに、プラスチック分解酵素PETase(Ideonella sakaiensis由来)を例に、枯草菌(Bacillus subtilis)での発現実験を行いました。OrthologTransformerで再設計したPETase遺伝子は、従来手法のコドン最適化設計のPETase遺伝子(CO)を導入した場合と比べて、PETフィルム分解で生じる生成物(MHET)の生成量が最大で約10倍増加しました(図1)。AIが提案した配列が実際の酵素生産・活性向上につながることを示す成果です。
■今後の展開
本手法は、工業微生物での酵素・タンパク質生産、バイオものづくり、合成生物学、環境分解酵素の開発など、幅広い応用が期待されます。従来は試行錯誤が必要だった宿主最適化を、進化に基づく生成AIで効率化できる可能性があります。今後は、より多様な生物種や発現条件に対応できるようモデルを拡張し、実験検証と組み合わせた設計サイクルの高度化を進めます。さらに、真核生物にモデルを拡張することで、非コーディング配列を含むmRNAの設計にも適用可能になり、医療分野への応用も期待されます。
■論文情報
掲載誌:Nature Communications
論文名:Cross-species gene redesign leveraging ortholog information and generative modeling
著 者:Manato Akiyama, Motohiko Tashiro, Ying Huang, Mika Uehara, Taiki Kanzaki, Mitsuhiro Itaya, Masakazu Kataoka, Kenji Miyamoto, Yasubumi Sakakibara(責任著者)
DOI:10.1038/s41467-026-69966-0
・本研究は、科学技術振興機構(JST)戦略的創造研究推進事業CREST(課題番号:JPMJCR20S3)の支援を受けて実施しました。
■用語解説
※ オーソログ(Ortholog):
異なる生物種に存在する遺伝子のうち、共通祖先に由来し、種分化に伴って対応関係がある遺伝子。同じ働きを持つことが多い。
※ コドン最適化:
宿主が好んで使うコドン頻度に合わせて、アミノ酸配列を変えずにDNA配列(同義コドン)を置き換える設計手法。
※ トランスフォーマー(Transformer):
自己注意(Self-Attention)機構により系列データの文脈を学習できる深層学習モデル。ChatGPTをはじめとする大規模言語モデルなどに幅広く応用されている。
■問い合わせ先
【研究に関すること】
北里大学 未来工学部 データサイエンス学科 人工知能研究室
教授 榊原 康文(さかきばら やすぶみ)
e-mail:sakakibara.yasubumi@kitasato-u.ac.jp
【報道に関すること】
学校法人北里研究所 広報室
TEL:03-5791-6422
e-mail:kohoh@kitasato-u.ac.jp
【リリース発信元】 大学プレスセンター
https://www.u-presscenter.jp/

記事提供:Digital PR Platform