論文概要
ウイルスメタゲノム解析やシングルウイルスゲノム解析によって、未知の環境ウイルスゲノムの個別ゲノム情報を取得することが可能になっています。しかし、このウイルスゲノムには他種のウイルス配列が混ざってしまっている状態、DNA配列の「コンタミネーション」が生じていることが懸念されてきました。しかし、この「コンタミネーション」を検出するツールがありませんでした。本研究では、機械学習を適用し、ウイルスゲノムの塩基配列や遺伝子パターンの特徴を学習し、対象ゲノム中の「コンタミネーション」を検出するツール"vClean"を開発しました。
本ツールを利用することで、ウイルスメタゲノム解析やシングルウイルスゲノム解析によって得られたウイルスゲノム中の「コンタミネーション」を検出し、信頼度の高い情報を選別することができます。
早稲田大学竹山研究室 博士課程学生 我妻さんが主として進めた研究成果です。
vClean: assessing virus sequence contamination in viral genomes.
Wagatsuma R, Nishikawa Y, Hosokawa M, Takeyama H.
NAR Genom Bioinform. 2025 Jan 7;7(1):lqae185. doi: 10.1093/nargab/lqae185.