Abstract
ウイルスはヒトの体内をはじめとする地球上の様々な場所に存在し、バイロームを構成する。このバイロームを解析するのにはメタゲノムデータまたはメタトランスクリプトームデータを用い、バイオインフォマティクス技術を駆使したウイルスゲノムの網羅的探索が必要となる。ウイルスゲノムの探索には既知のウイルスゲノム配列を基にした相同性検索に加え、近年では様々な手法が用いられるようになった。さらに、こうして探索された多数のウイルスゲノムを基に、バイロームを構成するウイルス組成や宿主との関連性が調べられている。本稿ではウイルスの探索とバイローム解析に使われるバイオインフォマティクス解析手法を紹介し、バイローム研究結果の概要や問題点などを概説する。
1.はじめに
ウイルスは地球上に大量に存在し、その数は約1031個と推定されている[1, 2]。これらのウイルスは生態系の中でバイロームを構成し、他の生物と相互作用しながら存在する。ヒトのバイロームにおいてもRNAウイルスとDNAウイルスの両方が存在し、そのゲノムのサイズやウイルス粒子の構造などの特徴は非常に多様である[3]。また、ヒトなどの宿主の疾患などとも密接に関連している[4]。このようなバイロームの全貌解明が期待されるようになった。そのきっかけとして、2006年に次世代シーケンサー(NGS)が登場したことが挙げられる。それまではウイルス配列のクローニングとサンガーシーケンスによって、動植物の組織などから単離されたウイルスのゲノム配列を決めていた。NGSの登場と発展に伴い、環境中の微生物のゲノムを網羅的に解読するメタゲノム解析・メタトランスクリプトーム解析が行われるようになった。これらのゲノム解析では、海水や土壌、動植物の組織などのサンプルから培養を介さずに抽出されたDNAやRNAを直接シーケンスにかけるため、未培養のウイルスゲノム(UViG)も新規に大量に獲得することができる[5]。図1にこれまでにデータベース上に登録されたウイルス配列数の遷移例を示す。National Center for Biotechnology Information (NCBI)のデータベース上には1980年代からウイルス配列が登録されはじめ、現在では20万を超えるゲノムが登録されており、その数は指数関数的に急激に増加していることがわかる(https://www.ncbi.nlm.nih.gov/nuccore)[6]。また、Joint Genome Institute (JGI)が管理するIntegrated Microbial Genomes / Virus (IMG/VR)にはUViGを含む配列が登録されており、2016年に公開されて以来、4回の更新を経て2023年現在では15,677,623の配列が登録されている[7, 8, 9, 10]。シーケンスデータの蓄積に伴い、今後もより多くのウイルスゲノム配列が同定されると考えられるが、これらのウイルスゲノムの同定・解析にはバイオインフォマティクス技術が必要不可欠である。本稿では、バイローム解析におけるバイオインフォマティクス技術がどのように寄与しているのか、バイローム解析の現状などを紹介する。
2.ウイルスの網羅的探索手法
メタゲノムデータやメタトランスクリプトームデータからウイルスを探索する際にはバイオインフォマティクス解析を実施する。取得されたショートリードのシーケンシングデータを使って初めにアダプターの除去などの前処理を行う。その後ゲノムのde novoアセンブリやビニングを実施することにより、シーケンシングのために断片化された配列(リード)から元のゲノムの構造を反映した長いゲノム配列(コンティグ)を取得する。これらの配列を用いてウイルス探索を行うが、この際に用いられる解析手法とツールを下記にて紹介する(表1)。また、ウイルス解析の流れを図2に示す。
表1:ウイルス探索やバイローム解析に用いられるツール例
図2:バイローム解析の流れ
最も使われる手法として、既知のゲノム配列との相同性を基にして新規のゲノム配列を探索する相同性検索が挙げられる[11]。相同性を基にした手法ではBasic Local Alignment Search Tool (BLAST)と呼ばれるペアワイズアライメントを取り入れたアルゴリズムや、それを高速にしたDIAMONDなどが用いられている[12, 13]。この相同性検索を実施する際に必要となるウイルスのリファレンスゲノムは第1章で紹介したNCBIのRefSeq Viral genomeやJGIのIMG/VR databaseなどが挙げられる。他にもヒト腸内や口腔内をはじめ様々なバイローム解析で探索されたウイルス配列がリファレンスとして使われる[14, 15, 16, 17]。
このようにゲノム同士の相同性検索によって多くのウイルスが同定されてきたが、相同性を持たないウイルスについては、同定が非常に困難である。その理由として、ウイルスは普遍的なマーカー遺伝子を持たないことや、そのゲノム配列が非常に多様であることが挙げられる[18]。より多くのウイルスを同定するために、遺伝子に注目した手法、ヌクレオチド組成を基にした手法、宿主のCRISPRを使った手法によってウイルスの同定が行われている。以降でそれらの詳細を説明する。
遺伝子に注目した手法
遺伝子の内容の組み合わせやゲノムの構造的特徴を考慮した機械学習を取り入れた手法が多く開発されている(図3a)。具体的にはVirSorter2やMARVEL、VIBRANTなどが挙げられる[19, 20, 21]。この手法では遺伝子の内容を考慮することから、初めにウイルス候補配列を用いて遺伝子のアノテーションを行う。アノテーション結果を基に、ウイルスに特徴的な遺伝子(キャプシドタンパク質、ターミナーゼなど。ホールマーク遺伝子と呼ばれる)の数や遺伝子の長さ、遺伝子間距離、遺伝子の密度、ATGで始まるコドンの割合などを算出し、これらの情報を特徴量として分類を行う。これらの分類に用いられる特徴量の種類はツールによって異なる。事前に用意する学習データとしては、RefSeqに登録のあるウイルス配列などが用いられる。さらに、宿主細菌のゲノム中に含まれるプロファージ配列を標的とした探索手法も挙げられる。既知のウイルスリファレンスを用い、宿主細菌ゲノム上で相同性検索を行う。ProphinderやPHASTESTなどをはじめとするツールが開発されている[22, 23]。
図3:ウイルスの探索手法。(a)遺伝子の内容を基にしたウイルスの探索手法を示した。(b)宿主とファージの関係性を示し、この関係性を基にウイルスを探索する手法を示した。(c)塩基組成を基にしたウイルス探索手法を示した。
ヌクレオチド組成を基にした手法
既知のウイルスのk-mer頻度を基に機械学習によってウイルス配列を同定する手法が開発されている(図3b)。これはウイルスと宿主が使用するk-mer頻度の違いを利用してウイルスと宿主の配列を区別し、ウイルスを探索する手法である[24, 25]。この時のk-mer頻度はコーディングまたはノンコーディング領域関係なく算出され、ウイルス遺伝子の探索が必要ない。そのため、既知のウイルス遺伝子と相同な配列が少ない場合や断片配列に対して優れた性能を発揮することができる[25]。k-merに基づく探索ツールとしてはVirFinderやDeepVirFinderが挙げられる[25, 26]。また、先に紹介した遺伝子配列に基づく手法と組み合わせたgeNomadというツールも開発されている[27]。
宿主のCRISPRを使った手法
CRISPRとはClustered regularly interspaced short palindromic repeatsの略語で原核生物における獲得免疫記憶のことである。CRISPR座位にある数十塩基の反復配列(ダイレクトリピート、DR)の間に、細菌に感染するウイルス(ファージ)やプラスミドなどの可動遺伝因子(MGE)の断片配列をスペーサーとして挿入することで、同一配列に対して耐性を獲得する機能がある[28, 29]。つまり、CRISPR座位を解析することによって、ファージの部分配列を取得することが可能で、その部分配列を基にCRISPRの標的となったファージの配列を取得することが可能である[29, 30, 31]。一例として、本稿の著者らのグループから発案されたファージ配列同定の解析の流れを概説する(図3c)[32]。初めにアセンブルされたコンティグからDRを含むCRISPR座位を見つけ出し、DR配列を取得する。得られたDR配列を2つ含むリード配列を取り出し、その間に挟まれたスペーサー配列を獲得する。続いてCRISPR座位をマスクしたコンティグを用い、ファージ側にあるプロトスペーサー配列(スペーサー配列と同一)を探索する。プロトスペーサーの共起ネットワークによりプロトスペーサーをクラスタリングし、プロトスペーサーが多く存在する場所を獲得することでCRISPRの標的になっている配列を抜き出すことが可能である。他にも、マイクロアレイを用いることでCRISPRの標的となったファージやプラスミドを同定する手法も知られている[30]。
3.バイローム解析手法
2章で紹介した手法によって多様なウイルスを同定できることが明らかとなった。こうして得られたウイルス配列を用いた代表的なバイオインフォマティクス解析手法を下記に紹介する。図2に解析の流れを示した。また、表1にも本稿で紹介するツールを記載した。ここで紹介しきれなかったツールはCapsid Community (https://github.com/Tomikent/Capsid_community)がまとめたリストなどを参照されると良いだろう。
配列のクオリティチェック
ウイルス探索に用いるメタゲノムデータの多くは、その環境中に存在するDNAやRNA配列をランダムにシーケンサーで配列解読を行ったものである。そのため、存在量の少ないウイルスでは完全長のゲノム配列を復元できずに、断片化したクオリティの低いウイルスゲノム配列が多く獲得されてしまう。また、メタゲノムデータにはウイルス配列以外にもウイルスの宿主由来の配列が含まれる可能性が高い。そのため、宿主由来の配列が誤ってアセンブリデータに含まれてしまうだけでなく、宿主のゲノムにプロウイルスとして挿入されている配列も存在し、宿主配列との境界が曖昧な場合がある。そのため、配列クオリティに応じて後の解析を実施することが推奨されている[5]。例えばCheckVと呼ばれる解析ツールでは、獲得された配列の完全性を推定し、さらに宿主のゲノム中のプロウイルス配列については宿主領域を除去することができる[33]。こうして獲得されたゲノムのクオリティによって種や属レベルの解析を実施する。また、断片的な配列しか得られなかったものはウイルスホールマーク遺伝子とされるキャプシドタンパク質やポリメラーゼなどの系統解析に用いられる。
遺伝子アノテーション
上記で獲得されたウイルス配列を特徴づけるために、遺伝子のアノテーションが実施される。ウイルスゲノムの探索の場合と同様に相同性検索を基にした手法としてBLASTなどが用いられるだけでなく、隠れマルコフモデル(HMM)を取り入れたHMMER (v3.3.2, http://hmmer.org/)やHHPredといったより検出感度の高い手法を用いられることが多い[34, 35, 36]。ウイルス遺伝子のアノテーションに特化した解析ツールとしてはDRAMなどが開発されている[37]。また、ウイルス遺伝子の探索に用いられるデータベースとしてはNCBI RefSeqのviral proteinsやIMG/VRデータベースのタンパク配列、Virus Orthologous Groups (VOGDB release: v218, http://vogdb.org/)などが挙げられる。
ウイルス系統分類
ウイルスの分類において重要な役割を担うのがInternational Committee on Taxonomy of Viruses (ICTV)と呼ばれる団体で、50年以上にわたってウイルスやその他のMGEの分類と命名に取り組んできた[38]。歴史的にはウイルスの宿主の範囲や複製サイクル、ウイルス粒子の構造と特性などをもとに分類が行われてきた[39]。しかし、メタゲノムデータを使用した大規模なウイルスの探索により、実験に基づいて特性評価されたウイルスよりも多くのウイルスゲノム配列が同定されている[39]。近年こうして同定されたウイルスゲノムが指数関数的に増えていることから、ウイルスを配列データのみに基づいてICTVの分類体系に組み込む場合のガイドラインも発表されている[40]。例えば種レベルの分類 (vOTU)では85%のアライメント率で95%の塩基相同性を持つことが提案されている[5]。一方、種レベルよりも高い分類レベルでは複数のアプローチが提案されており、現状ではどの分類手法を採用すべきか一致した見解は得られていない[16, 41, 42]。実際に、メタゲノムデータで得られた大量のウイルスゲノムの系統分類に用いられる手法として、分類情報がすでにわかっているRefSeqのウイルスゲノムとのクラスタリングやウイルスホールマーク遺伝子の有無、既知のウイルス遺伝子との相同性やゲノム中の遺伝子数などを基にした分類方法などが実施されている[10, 14, 16, 43]。このように複数手法が提案されているため、論文中にどのような手法や条件で系統分類を行ったのか明記すべきだとされている[5]。
ウイルス種間の系統関係はゲノム配列や特定の遺伝子のアライメントから推測される[44, 45]。同じファミリー内のウイルスなど近縁なウイルスを対象に、進化的に保存されたウイルスホールマーク遺伝子の配列や内容を比較することで関係性を推測できる[46]。例えばViPTreeやVICTOR、GraViTyといったツールが用いられる[41, 47, 48]。また、ウイルスホールマーク遺伝子を用いた系統解析の例として、RNAウイルスにおいてはRNA依存性RNAポリメラーゼ(RdRp)がホールマーク遺伝子として用いられ、複数のRdRpのマルチプルアライメントの結果に基づき、最尤法などによって系統解析が実施されている[49, 50]。また、複数の保存されたタンパク質を連結させてアライメントを行うことで系統解析を行うこともあるが、ウイルスでは水平伝播などによって各遺伝子が異なる進化の歴史を辿っていることが多く、誤った系統的シグナルが得られる可能性があることには留意すべきである[44, 51]。上記に加え、ネットワーク解析によってウイルスの系統関係を調べる手法も開発されており、ウイルスゲノム間で共有するタンパク質のクラスターを基にした遺伝子共有ネットワークから系統分類を行うことができる。例えばvConTACT v.2.0というツールなどが開発されている[52]。
ウイルス宿主の推定
ウイルスの宿主は古典的には実験的に検証されており、宿主細胞の溶解が起こるかどうかが指標となり得る[53, 54]。一方、これまで紹介してきたような培養を介さずに直接メタゲノムデータから取得されたウイルスについては、ゲノム配列から宿主を予測する必要がある。原核生物と真核生物のウイルスどちらにも適応可能な手法として、遺伝子の内容やゲノムを構成する核酸の種類、塩基組成情報などを用いた機械学習法による分類が挙げられる[55, 56, 57, 58, 59]。例えば、ウイルスの遺伝子を基にしたRaFAHというツールが使われている[60]。塩基組成についてはk-mer頻度(k=1-4)やコドン使用頻度がウイルスとその宿主のゲノムと類似するという事例に基づいており、HostPhinder をはじめとするツールが開発されている[61, 62]。また、原核生物においてはCRISPR座位に含まれるウイルスの断片配列や、宿主のゲノム中に挿入されたウイルス配列からウイルスと宿主を対応づけて宿主の推定を行うことが可能である[63]。例えばCRISPR座位の情報を用いたSpacePHARERというツールも開発されている[64]。
4.これまでに明らかになっていること
上記の解析によって多様な環境から大量のウイルスゲノム配列が同定されてきた。下記にいくつかの研究例を紹介する。
ヒトのバイローム
糞便中のウイルス粒子数の測定結果などからヒトの体内には数千億から数十兆のウイルス粒子が含まれているとされ、全体でヒトのウイルスから細菌に感染するファージ、植物のウイルスなどその種類は多岐にわたる[3, 11, 65]。これまでの研究により口腔、肺、消化管、血中、神経系、皮膚、泌尿器、生殖器など様々な部位からウイルスが同定されている[14, 15, 16, 43, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76]。ウイルスの大半は消化管に存在し、中でもCaudoviralesに分類される尾部を持ったファージが大部分を占める[3]。新生児では無菌状態の腸内に出生後数週間でファージとその宿主の細菌が入り込む[77]。母親から乳児へのウイルスの伝播が起こることやウイルスを介して食事関連の適応に関連した遺伝子が腸内細菌間で水平伝播することなどが示されている[77, 78]。ヒトバイロームに大きく影響を与える要素としては、食べ物、健康状態、地理的要因、年齢などが挙げられる[3, 4, 14, 67, 79, 80]。健康状態については炎症性腸疾患をはじめとして様々な疾患を対象に、患者と健常人のバイロームを比較することによって、ウイルス組成の違いなどが明らかにされている[81]。また、地理的要因については、ヒト集団間で異なるバイロームの特徴が見られることが明らかとなっており、日本人集団のバイロームを特徴付けた研究などが行われている[82, 83]。
動物のバイローム
動物のウイルスは他の動物に感染して重篤な疾患を引き起こす可能性があるため、動物のバイロームを理解するためだけでなく、ヒトに疾患を引き起こす可能性の高いウイルスを探索する上でも重要である[84, 85, 86]。しかし、動物のバイローム解析は人間社会に強く関係のある動物に感染して疾患をもたらすウイルスに偏っている[87]。また、メタトランスクリプトームデータの解析によって多様な脊椎動物のウイルスを同定して系統解析を行ったことで、宿主の系統発生史を反映した系統関係が見られた[88]。一方、近年精力的にシーケンスが実施され、様々な動物種からゲノムデータを取得できるようになってきたことから、節足動物をはじめとする動物のRNAウイルスの存在が解明されつつある[89]。
古代人のバイローム
現代人と同様に、古代人の体内にもウイルスが存在していたはずである[90]。数百年から数万年前の古代人由来の古代DNAを抽出し、シーケンスを行うことで、古代人体内に存在したウイルスのゲノム情報も取得することができる。古代ウイルス研究は医学的な重要性から、B型肝炎ウイルスや天然痘ウイルスなどヒトに病原性をもたらすウイルスに注目したものが多いが、古代人体内のバイロームを構成していた古代ファージの存在も明らかになりつつある[91, 92, 93]。古代ウイルス探索においては、古代DNAの特徴である「DNAの5'末端でシトシンからチミンへの置換が多いこと」などの指標をもとに、現代のウイルスのコンタミネーションを最小限に抑えた解析を行う必要がある点は常に念頭に置かなければならない。また、古代RNAウイルスについてはRNAの安定性の低さから探索数は少ないが、700~1000年ほど前の植物RNAウイルスのゲノムが複数取得されており、今後さらなる探索が必要となるであろう[94, 95, 96]。
巨大ウイルスのバイローム
巨大ウイルスとはゲノムサイズが70 kbから2.5 Mbと長く、ウイルス粒子長も大きいものである。メタゲノム解析によってより多くの巨大ウイルスが発見されるようになり、海水や淡水をはじめとする環境から同定され、地球の生物圏全体に分布していることが明らかとなった[97]。宿主の代謝に関係する遺伝子を多数含んでおり、地球規模の栄養循環に影響を及ぼしている可能性が示唆されている[98]。
5. バイローム研究の直面する問題と今後の展望
これまでの章でバイローム解析を行う方法やそれによってわかることなどを概説してきた。本章ではバイローム研究における問題点を簡単に紹介する[5]。
ウイルスゲノム配列の探索不足と探索の難しさ
メタゲノムデータやメタトランスクリプトームデータが取得されるまで、ウイルスゲノムはヒトなどで疾病をもたらすものや実験室条件下で培養できるものなどに偏って探索が進められていた[99]。そのため、探索されているウイルスに偏りが生じている。さらに、宿主のゲノムデータにも偏りがあり、ウイルス探索がより多く進んでいる宿主とそうでないもので差がある[87]。特にヒトの生活に関連のある動植物に感染するウイルスに偏りがある。ウイルスの多様性や進化への理解を深めるためには、このような偏りなくより多くの分類群の宿主から多くのウイルスを大規模に解析する必要がある。
このようにウイルスに関する知見に偏りがある中で、ウイルスゲノムの相同性を基に探索を行うことは困難である。例えば、2333のファージ同士を塩基配列や遺伝子の内容を基にペアワイズ比較したところ、97%の場合において検出可能な相同性が見られなかったという報告がある[100]。また、真核生物に感染するRNAウイルスではウイルスホールマーク遺伝子としてRdRpの存在が知られているが、その配列は非常に多岐に渡り、その長さも460から1930アミノ酸残基と多様である[101]。加えて、最近では異なるゲノムのセグメント上にコードされることも明らかになっている[102]。このような多様な配列は従来の相同性検索を基にした手法では探索しきれないとされる。さらに、ウイルスでも非AUG開始コドンや非標準的な遺伝暗号を用いること、同じ領域において異なるフレームで遺伝子がコードされることなどによってその配列解析が難しくなっている[103, 104, 105]。
ウイルスの分類体系のばらつきやデータベース上での表記ゆれ
ICTVでは既存のウイルス分類群に対して分類方法などが提案されているが、メタゲノム解析で取得されたウイルスの属や科レベルでの分類においては研究グループごとに異なる解析手法や閾値を設定しており、研究者間で一致した基準がない[5]。本稿においても様々なウイルス解析ツールを紹介してきたが、ここで紹介しきれなかった解析ツールや解析パイプラインなども多く存在し、どれを採用すべきか慎重に検討する必要がある。他にも、データベースに登録されている情報の表記ゆれも散見される。例えば、ウイルスゲノム配列を公開データベース上に登録する際にCapsidまたはcapsidと表記するような表記揺れなど、記載方法が一貫しておらず情報の取得に支障が出る場合がある。また、異なるアノテーション方法や進行中の実験結果によって、不正確なアノテーションが生じていることも問題である[106]。
種々のエラー
メタゲノムデータ中には宿主の細胞に由来する配列も含まれているために、宿主細胞由来の配列をウイルス配列と誤って認定してしまうといった事例が考えられる[107]。特にプロウイルスのように宿主のゲノムに挿入された配列を調べる場合には、ウイルスゲノムと宿主ゲノムの境界を明確にする必要があり、マニュアルでのアノテーションが必要だとされている。また、カバレッジの低いデータではアセンブリが上手くいかずに、断片的な配列が取得されてしまう[108]。他のエラーとして、既知の遺伝子との相同性が低いことによる遺伝子や遺伝子機能の推定のエラーなどが挙げられる[5]。
今後の展望
シーケンス技術が日々発展していることを考えると、ゲノムデータは引き続き指数関数的に蓄積すると考えられる。これらのゲノムデータを用いることで、より多くの環境から多様なウイルスを探索することができると推測される。このような状況で、より多様なウイルスを探索するには、既知のウイルス配列と相同性を示さないウイルス配列を探索する技術の更なる開発が重要となってくるであろう。本稿で紹介したような塩基組成やCRISPRに基づく手法に加え、今後はタンパク質の構造に基づいた探索手法なども取り入れる必要があると考えられる[87]。特に、RdRpのように塩基配列レベルではその相同性が見られないようなものでも、酵素活性に関わる複数の残基やモチーフの存在が明らかになっていることや、形態学的に異なるウイルス間でもいくつかのウイルスタンパク質は三次元構造レベルでの保存性を示すことを踏まえると、構造解析によって新規のウイルスを探索できる可能性がある[109, 110, 111]。構造解析に加えて、他の生物と異なる遺伝子コード様式を持つウイルスにおいては、翻訳されているウイルス遺伝子にターゲットを絞って解析を行うことも有用だと考えられる。例えば、翻訳中の遺伝子を調べることのできるRibo-seqのデータ解析と実験による機能解析などと組み合わせた方法が挙げられる[112]。これまで得られている知見を基に、より多くのウイルスを高感度かつ高精度に同定するようなバイオインフォマティクス解析ツールの開発が求められる。このように新しい手法を取り入れてウイルスゲノムの解析を進める上では、解析に用いた探索条件などを明確にし、研究者間での連携によって新たな基準を制定することも今後重要になってくるであろう。
謝辞
この原稿を執筆するにあたってアドバイスをくださった京都工芸繊維大学ショウジョウバエ遺伝資源センターの杉本竜太研究員に感謝申し上げます。本稿は科研費研究課題22KJ1416の支援を受けたものです。
References
- [1] Hendrix RW, Smith MCM, Burns RN, Ford ME, Hatfull GF. Evolutionary relationships among diverse bacteriophages and prophages: All the world's a phage. Proc Natl Acad Sci U S A. 1999; 96: 2192-2197. doi:10.1073/pnas.96.5.2192
- [2] Mushegian AR. Are There 10 31 Virus Particles on Earth, or More, or Fewer? Margolin W, editor. J Bacteriol. 2020; 202. doi:10.1128/JB.00052-20
- [3] Liang G, Bushman FD. The human virome: assembly, composition and host interactions. Nat Rev Microbiol. 2021; 0123456789. doi:10.1038/s41579-021-00536-5
- [4] Cadwell K. The Virome in Host Health and Disease. Immunity. 2015; 42: 805-813. doi:10.1016/j.immuni.2015.05.003
- [5] Roux S, Adriaenssens EM, Dutilh BE, Koonin E V., Kropinski AM, Krupovic M, et al. Minimum Information about an Uncultivated Virus Genome (MIUViG). Nat Biotechnol. 2019; 37: 29-37. doi:10.1038/nbt.4306
- [6] Brister JR, Ako-Adjei D, Bao Y, Blinkova O. NCBI viral Genomes resource. Nucleic Acids Res. 2015; 43: D571-D577. doi:10.1093/nar/gku1207
- [7] Paez-Espino D, Chen IMA, Palaniappan K, Ratner A, Chu K, Szeto E, et al. IMG/VR: A database of cultured and uncultured DNA viruses and retroviruses. Nucleic Acids Res. 2017; 45: D457-D465. doi:10.1093/nar/gkw1030
- [8] Paez-Espino D, Roux S, Chen IMA, Palaniappan K, Ratner A, Chu K, et al. IMG/VR v.2.0: An integrated data management and analysis system for cultivated and environmental viral genomes. Nucleic Acids Res. 2019; 47: D678-D686. doi:10.1093/nar/gky1127
- [9] Roux S, Páez-Espino D, Chen IMA, Palaniappan K, Ratner A, Chu K, et al. IMG/VR v3: An integrated ecological and evolutionary framework for interrogating genomes of uncultivated viruses. Nucleic Acids Res. 2021; 49: D764-D775. doi:10.1093/nar/gkaa946
- [10] Camargo AP, Nayfach S, Chen IMA, Palaniappan K, Ratner A, Chu K, et al. IMG/VR v4: an expanded database of uncultivated virus genomes within a framework of extensive functional, taxonomic, and ecological metadata. Nucleic Acids Res. 2023; 51: D733-D743. doi:10.1093/nar/gkac1037
- [11] Mokili JL, Rohwer F, Dutilh BE. Metagenomics and future perspectives in virus discovery. Curr Opin Virol. 2012; 2: 63-77. doi:10.1016/j.coviro.2011.12.004
- [12] Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer K, et al. BLAST+: Architecture and applications. BMC Bioinformatics. 2009; 10: 1-9. doi:10.1186/1471-2105-10-421
- [13] Buchfink B, Xie C, Huson DH. Fast and sensitive protein alignment using DIAMOND. Nat Methods. 2014; 12: 59-60. doi:10.1038/nmeth.3176
- [14] Gregory AC, Zablocki O, Zayed AA, Howell A, Bolduc B, Sullivan MB. The Gut Virome Database Reveals Age-Dependent Patterns of Virome Diversity in the Human Gut. Cell Host Microbe. 2020; 28: 724-740.e8. doi:10.1016/j.chom.2020.08.003
- [15] Camarillo-Guerrero LF, Almeida A, Rangel-Pineros G, Finn RD, Lawley TD. Massive expansion of human gut bacteriophage diversity. Cell. 2021; 184: 1098-1109.e9. doi:10.1016/j.cell.2021.01.029
- [16] Nayfach S, Páez-Espino D, Call L, Low SJ, Sberro H, Ivanova NN, et al. Metagenomic compendium of 189,680 DNA viruses from the human gut microbiome. Nat Microbiol. 2021; 39. doi:10.1038/s41564-021-00928-6
- [17] Tisza MJ, Buck CB. A catalog of tens of thousands of viruses from human metagenomes reveals hidden associations with chronic diseases. Proc Natl Acad Sci U S A. 2021; 118: 1-11. doi:10.1073/pnas.2023202118
- [18] Sullivan MB. Viromes, Not Gene Markers, for Studying Double-Stranded DNA Virus Communities. J Virol. 2015; 89: 2459-2461. doi:10.1128/jvi.03289-14
- [19] Guo J, Bolduc B, Zayed AA, Varsani A, Dominguez-Huerta G, Delmont TO, et al. VirSorter2: a multi-classifier, expert-guided approach to detect diverse DNA and RNA viruses. Microbiome. 2021; 9: 37. doi:10.1186/s40168-020-00990-y
- [20] Amgarten D, Braga LPP, da Silva AM, Setubal JC. MARVEL, a tool for prediction of bacteriophage sequences in metagenomic bins. Front Genet. 2018; 9: 1-8. doi:10.3389/fgene.2018.00304
- [21] Kieft K, Zhou Z, Anantharaman K. VIBRANT: Automated recovery, annotation and curation of microbial viruses, and evaluation of viral community function from genomic sequences. Microbiome. 2020; 8: 1-23. doi:10.1186/s40168-020-00867-0
- [22] Lima-Mendez G, Van Helden J, Toussaint A, Leplae R. Prophinder: A computational tool for prophage prediction in prokaryotic genomes. Bioinformatics. 2008; 24: 863-865. doi:10.1093/bioinformatics/btn043
- [23] Wishart DS, Han S, Saha S, Oler E, Peters H, Grant JR, et al. PHASTEST: faster than PHASTER, better than PHAST. Nucleic Acids Res. 2023; 51: 443-450. doi:10.1093/nar/gkad382
- [24] Ahlgren NA, Ren J, Lu YY, Fuhrman JA, Sun F. Alignment-free d2* oligonucleotide frequency dissimilarity measure improves prediction of hosts from metagenomically-derived viral sequences. Nucleic Acids Res. 2017; 45: 39-53. doi:10.1093/nar/gkw1002
- [25] Ren J, Ahlgren NA, Lu YY, Fuhrman JA, Sun F. VirFinder: a novel k-mer based tool for identifying viral sequences from assembled metagenomic data. Microbiome. 2017; 5: 69. doi:10.1186/s40168-017-0283-5
- [26] Ren J, Song K, Deng C, Ahlgren NA, Fuhrman JA, Li Y, et al. Identifying viruses from metagenomic data using deep learning. Quant Biol. 2020; 8: 64-77. doi:10.1007/s40484-019-0187-4
- [27] Camargo AP, Roux S, Schulz F, Babinski M, Xu Y, Hu B, et al. You can move, but you can't hide: identification of mobile genetic elements with geNomad. bioRxiv. 2023; 2023.03.05.531206. Available: https://www.biorxiv.org/content/10.1101/2023.03.05.531206v1.abstract
- [28] Barrangou R, Fremaux C, Deveau H, Richards M, Boyaval P, Moineau S, et al. CRISPR Provides Acquired Resistance Against Viruses in Prokaryotes. Science. 2007; 315: 1709-1712. doi:10.1126/science.1138140
- [29] Shmakov SA, Sitnik V, Makarova KS, Wolf YI, Severinov K V., Koonin E V. The CRISPR spacer space is dominated by sequences from species-specific mobilomes. MBio. 2017; 8. doi:10.1128/mBio.01397-17
- [30] Zhang Q, Rho M, Tang H, Doak TG, Ye Y. CRISPR-Cas systems target a diverse collection of invasive mobile genetic elements in human microbiomes. Genome Biol. 2013; 14. doi:10.1186/gb-2013-14-4-r40
- [31] Sugimoto R, Nishimura L, Nguyen PT, Ito J, Parrish NF, Mori H, et al. Comprehensive discovery of CRISPR-targeted terminally redundant sequences in the human gut metagenome: Viruses, plasmids, and more. Borenstein E, editor. PLOS Comput Biol. 2021; 17: e1009428. doi:10.1371/journal.pcbi.1009428
- [32] Sugimoto R, Nishimura L, Nguyen PT, Inoue I. Extraction of CRISPR-targeted sequences from the metagenome. STAR Protoc. 2022; 3: 101525. doi:10.1016/j.xpro.2022.101525
- [33] Nayfach S, Camargo AP, Schulz F, Eloe-Fadrosh E, Roux S, Kyrpides NC. CheckV assesses the quality and completeness of metagenome-assembled viral genomes. Nat Biotechnol. 2021; 39: 578-585. doi:10.1038/s41587-020-00774-7
- [34] Eddy SR. Accelerated profile HMM searches. PLoS Comput Biol. 2011; 7. doi:10.1371/journal.pcbi.1002195
- [35] Reyes A, P. Alves JM, Durham AM, Gruber A. Use of profile hidden Markov models in viral discovery: current insights. Adv Genomics Genet. 2017; Volume 7: 29-45. doi:10.2147/agg.s136574
- [36] Söding J, Biegert A, Lupas AN. The HHpred interactive server for protein homology detection and structure prediction. Nucleic Acids Res. 2005; 33: 244-248. doi:10.1093/nar/gki408
- [37] Shaffer M, Borton MA, McGivern BB, Zayed AA, La Rosa SL 0003 3527 8101, Solden LM, et al. DRAM for distilling microbial metabolism to automate the curation of microbiome function. Nucleic Acids Res. 2020; 48: 8883-8900. doi:10.1093/nar/gkaa621
- [38] Adams MJ, Lefkowitz EJ, King AMQ, Harrach B, Harrison RL, Knowles NJ, et al. 50 years of the International Committee on Taxonomy of Viruses: progress and prospects. Arch Virol. 2017; 162: 1441-1446. doi:10.1007/s00705-016-3215-y
- [39] Simmonds P, Adams MJ, Benkő M, Breitbart M, Brister JR, Carstens EB, et al. Virus taxonomy in the age of metagenomics. Nat Rev Microbiol. 2017; 15: 161-168. doi:10.1038/nrmicro.2016.177
- [40] Adriaenssens EM, Roux S, Brister JR, Karsch-Mizrachi I, Kuhn JH, Varsani A, et al. Guidelines for public database submission of uncultivated virus genome sequences for taxonomic classification. Nat Biotechnol. 2023. doi:10.1038/s41587-023-01844-2
- [41] Aiewsakun P, Simmonds P. The genomic underpinnings of eukaryotic virus taxonomy: Creating a sequence-based framework for family-level virus classification. Microbiome. 2018; 6: 1-24. doi:10.1186/s40168-018-0422-7
- [42] Bolduc B, Jang H Bin, Doulcier G, You ZQ, Roux S, Sullivan MB. vConTACT: An iVirus tool to classify double-stranded DNA viruses that infect Archaea and Bacteria. PeerJ. 2017; 2017: 1-26. doi:10.7717/peerj.3243
- [43] Li S, Guo R, Zhang Y, Li P, Chen F, Wang X, et al. A catalog of 48,425 nonredundant viruses from oral metagenomes expands the horizon of the human oral virome. iScience. 2022; 25: 104418. doi:10.1016/j.isci.2022.104418
- [44] Low SJ, Džunková M, Chaumeil P-A, Parks DH, Hugenholtz P. Evaluation of a concatenated protein phylogeny for classification of tailed double-stranded DNA viruses belonging to the order Caudovirales. Nat Microbiol. 2019; 4: 1306-1315. doi:10.1038/s41564-019-0448-z
- [45] Gorbalenya AE, Lauber C. Bioinformatics of virus taxonomy: foundations and tools for developing sequence-based hierarchical classification. Curr Opin Virol. 2022; 52: 48-56. doi:10.1016/j.coviro.2021.11.003
- [46] Simmonds P, Adriaenssens EM, Murilo Zerbini F, Abrescia NGA, Aiewsakun P, Alfenas-Zerbini P, et al. Four principles to establish a universal virus taxonomy. PLoS Biol. 2023; 21: 1-23. doi:10.1371/journal.pbio.3001922
- [47] Nishimura Y, Yoshida T, Kuronishi M, Uehara H, Ogata H, Goto S. ViPTree: The viral proteomic tree server. Bioinformatics. 2017; 33: 2379-2380. doi:10.1093/bioinformatics/btx157
- [48] Meier-Kolthoff JP, Göker M. VICTOR: genome-based phylogeny and classification of prokaryotic viruses. Kelso J, editor. Bioinformatics. 2017; 33: 3396-3404. doi:10.1093/bioinformatics/btx440
- [49] Wolf YI, Kazlauskas D, Iranzo J, Lucía-Sanz A, Kuhn JH, Krupovic M, et al. Origins and evolution of the global RNA virome. MBio. 2018; 9: 1-31. doi:10.1128/mBio.02329-18
- [50] Zayed AA, Wainaina JM, Dominguez-Huerta G, Pelletier E, Guo J, Mohssen M, et al. Cryptic and abundant marine viruses at the evolutionary origins of Earth's RNA virome. Science. 2022; 376: 156-162. doi:10.1126/science.abm5847
- [51] Hatfull GF. Bacteriophage genomics. Curr Opin Microbiol. 2008; 11: 447-453. doi:10.1016/j.mib.2008.09.004
- [52] Bin Jang H, Bolduc B, Zablocki O, Kuhn JH, Roux S, Adriaenssens EM, et al. Taxonomic assignment of uncultivated prokaryotic virus genomes is enabled by gene-sharing networks. Nat Biotechnol. 2019; 37: 632-639. doi:10.1038/s41587-019-0100-8
- [53] Hyman P. Phages for phage therapy: Isolation, characterization, and host range breadth. Pharmaceuticals. 2019; 12. doi:10.3390/ph12010035
- [54] Pagnier I, Reteno DGI, Saadi H, Boughalmi M, Gaia M, Slimani M, et al. A decade of improvements in mimiviridae and marseilleviridae isolation from amoeba. Intervirology. 2013; 56: 354-363. doi:10.1159/000354556
- [55] Li H, Sun F. Comparative studies of alignment, alignment-free and SVM based approaches for predicting the hosts of viruses based on viral sequences. Sci Rep. 2018; 8: 1-9. doi:10.1038/s41598-018-28308-x
- [56] Gałan W, Bąk M, Jakubowska M. Host Taxon Predictor - A Tool for Predicting Taxon of the Host of a Newly Discovered Virus. Sci Rep. 2019; 9: 1-13. doi:10.1038/s41598-019-39847-2
- [57] Mock F, Viehweger A, Barth E, Marz M. VIDHOP, viral host prediction with deep learning. Bioinformatics. 2021; 37: 318-325. doi:10.1093/bioinformatics/btaa705
- [58] Mollentze N, Babayan SA, Streicker DG. Identifying and prioritizing potential humaninfecting viruses from their genome sequences. PLoS Biol. 2021; 19: 1-25. doi:10.1371/journal.pbio.3001390
- [59] Bartoszewicz JM, Seidel A, Renard BY. Interpretable detection of novel human viruses from genome sequencing data. NAR Genomics Bioinforma. 2021; 3: 1-14. doi:10.1093/nargab/lqab004
- [60] Coutinho FH, Zaragoza-Solas A, López-Pérez M, Barylski J, Zielezinski A, Dutilh BE, et al. RaFAH: Host prediction for viruses of Bacteria and Archaea based on protein content. Patterns. 2021; 2. doi:10.1016/j.patter.2021.100274
- [61] Roux S, Hallam SJ, Woyke T, Sullivan MB. Viral dark matter and virus-host interactions resolved from publicly available microbial genomes. Elife. 2015; 4: 1-20. doi:10.7554/elife.08490
- [62] Villarroel J, Kleinheinz KA, Jurtz VI, Zschach H, Lund O, Nielsen M, et al. HostPhinder: A phage host prediction tool. Viruses. 2016; 8: 1-22. doi:10.3390/v8050116
- [63] Coclet C, Roux S. Global overview and major challenges of host prediction methods for uncultivated phages. Curr Opin Virol. 2021; 49: 117-126. doi:10.1016/j.coviro.2021.05.003
- [64] Zhang R, Mirdita M, Karin EL, Norroy C, Galiez C, Söding J. SpacePHARER: sensitive identification of phages from CRISPR spacers in prokaryotic hosts. Bioinformatics. 2021; 37: 3364-3366. doi:10.1093/bioinformatics/btab222
- [65] Hoyles L, McCartney AL, Neve H, Gibson GR, Sanderson JD, Heller KJ, et al. Characterization of virus-like particles associated with the human faecal and caecal microbiota. Res Microbiol. 2014; 165: 803-812. doi:10.1016/j.resmic.2014.10.006
- [66] Young JC, Chehoud C, Bittinger K, Bailey A, Diamond JM, Cantu E, et al. Viral metagenomics reveal blooms of anelloviruses in the respiratory tract of lung transplant recipients. Am J Transplant. 2015; 15: 200-209. doi:10.1111/ajt.13031
- [67] Minot S, Sinha R, Chen J, Li H, Keilbaugh SA, Wu GD, et al. The human gut virome: Inter-individual variation and dynamic response to diet. Genome Res. 2011; 21: 1616-1625. doi:10.1101/gr.122705.111
- [68] Yutin N, Makarova KS, Gussow AB, Krupovic M, Segall A, Edwards RA, et al. Discovery of an expansive bacteriophage family that includes the most abundant viruses from the human gut. Nat Microbiol. 2018; 3: 38-46. doi:10.1038/s41564-017-0053-y
- [69] Li R, Wang Y, Hu H, Tan Y, Ma Y. Metagenomic analysis reveals unexplored diversity of archaeal virome in the human gut. Nat Commun. 2022; 13: 7978. doi:10.1038/s41467-022-35735-y
- [70] Edwards RA, Vega AA, Norman HM, Ohaeri M, Levi K, Dinsdale EA, et al. Global phylogeography and ancient evolution of the widespread human gut virus crAssphage. Nat Microbiol. 2019; 4: 1727-1736. doi:10.1038/s41564-019-0494-6
- [71] Castillo DJ, Rifkin RF, Cowan DA, Potgieter M. The healthy human blood microbiome: Fact or fiction? Front Cell Infect Microbiol. 2019; 9: 1-12. doi:10.3389/fcimb.2019.00148
- [72] Ghose C, Ly M, Schwanemann LK, Shin JH, Atab K, Barr JJ, et al. The Virome of Cerebrospinal Fluid: Viruses Where We Once Thought There Were None. Front Microbiol. 2019; 10: 1-14. doi:10.3389/fmicb.2019.02061
- [73] Foulongne V, Sauvage V, Hebert C, Dereure O, Cheval J, Gouilh MA, et al. Human skin Microbiota: High diversity of DNA viruses identified on the human skin by high throughput sequencing. PLoS One. 2012; 7. doi:10.1371/journal.pone.0038499
- [74] Garretto A, Miller-Ensminger T, Wolfe AJ, Putonti C. Bacteriophages of the lower urinary tract. Nat Rev Urol. 2019; 16: 422-432. doi:10.1038/s41585-019-0192-4
- [75] Jakobsen RR, Haahr T, Humaidan P, Jensen JS, Kot WP, Castro-Mejia JL, et al. Characterization of the Vaginal DNA Virome in Health and Dysbiosis. Viruses. 2020; 12: 1143. doi:10.3390/v12101143
- [76] Li J, Yang F, Xiao M, Li A. Advances and challenges in cataloging the human gut virome. Cell Host Microbe. 2022; 30: 908-916. doi:10.1016/j.chom.2022.06.003
- [77] Beller L, Deboutte W, Vieira-Silva S, Falony G, Tito RY, Rymenans L, et al. The virota and its transkingdom interactions in the healthy infant gut. Proc Natl Acad Sci U S A. 2022; 119. doi:10.1073/pnas.2114619119
- [78] Vatanen T, Jabbar KS, Ruohtula T, Honkanen J, Avila-Pacheco J, Siljander H, et al. Mobile genetic elements from the maternal microbiome shape infant gut microbial assembly and metabolism. Cell. 2022; 185: 4921-4936.e15. doi:10.1016/j.cell.2022.11.023
- [79] Liang G, Zhao C, Zhang H, Mattei L, Sherrill-Mix S, Bittinger K, et al. The stepwise assembly of the neonatal virome is modulated by breastfeeding. Nature. 2020; 581: 470-474. doi:10.1038/s41586-020-2192-1
- [80] Zuo T, Sun Y, Wan Y, Yeoh YK, Zhang F, Cheung CP, et al. Human-Gut-DNA Virome Variations across Geography, Ethnicity, and Urbanization. Cell Host Microbe. 2020; 28: 741-751.e4. doi:10.1016/j.chom.2020.08.005
- [81] Clooney AG, Sutton TDS, Shkoporov AN, Holohan RK, Daly KM, O'Regan O, et al. Whole-Virome Analysis Sheds Light on Viral Dark Matter in Inflammatory Bowel Disease. Cell Host Microbe. 2019; 26: 764-778.e5. doi:10.1016/j.chom.2019.10.009
- [82] Nishijima S, Nagata N, Kiguchi Y, Kojima Y, Miyoshi-Akiyama T, Kimura M, et al. Extensive gut virome variation and its associations with host and environmental factors in a population-level cohort. Nat Commun. 2022; 13: 5252. doi:10.1038/s41467-022-32832-w
- [83] Tomofuji Y, Kishikawa T, Maeda Y, Ogawa K, Otake-Kasamoto Y, Kawabata S, et al. Prokaryotic and viral genomes recovered from 787 Japanese gut metagenomes revealed microbial features linked to diets, populations, and diseases. Cell Genomics. 2022; 2: 100219. doi:10.1016/j.xgen.2022.100219
- [84] He W-T, Hou X, Zhao J, Sun J, He H, Si W, et al. Virome characterization of game animals in China reveals a spectrum of emerging pathogens. Cell. 2022; 185: 1117-1129.e8. doi:10.1016/j.cell.2022.02.014
- [85] Wang LF, Anderson DE. Viruses in bats and potential spillover to animals and humans. Curr Opin Virol. 2019; 34: 79-89. doi:10.1016/j.coviro.2018.12.007
- [86] Jonas O, Seifman R. Do we need a Global Virome Project? Lancet Glob Heal. 2019; 7: e1314-e1316. doi:10.1016/S2214-109X(19)30335-3
- [87] Harvey E, Holmes EC. Diversity and evolution of the animal virome. Nat Rev Microbiol. 2022; 1993: 30-33. doi:10.1038/s41579-021-00665-x
- [88] Shi M, Lin X-D, Chen X, Tian J-H, Chen L-J, Li K, et al. The evolutionary history of vertebrate RNA viruses. Nature. 2018; 561: E6-E6. doi:10.1038/s41586-018-0310-0
- [89] Li CX, Shi M, Tian JH, Lin XD, Kang YJ, Chen LJ, et al. Unprecedented genomic diversity of RNA viruses in arthropods reveals the ancestry of negative-sense RNA viruses. Elife. 2015; 2015: 1-26. doi:10.7554/eLife.05378
- [90] Nishimura L, Fujito N, Sugimoto R, Inoue I. Detection of Ancient Viruses and Long-Term Viral Evolution. Viruses. 2022; 14: 1336. doi:10.3390/v14061336
- [91] Appelt S, Fancello L, Le Bailly M, Raoult D, Drancourt M, Desnues C. Viruses in a 14th-century coprolite. Appl Environ Microbiol. 2014; 80: 2648-2655. doi:10.1128/AEM.03242-13
- [92] Nishimura L, Sugimoto R, Inoue J, Nakaoka H, Kanzawa-Kiriyama H, Shinoda K, et al. Identification of ancient viruses from metagenomic data of the Jomon people. J Hum Genet. 2021; 66: 287-296. doi:10.1038/s10038-020-00841-6
- [93] Rozwalak P, Barylski J, Wijesekara Y, Dutilh BE, Zielezinski A, Mickiewicz A, et al. Ultra-conserved bacteriophage genome sequence identified in 1300-year- old human paleofaeces. 2023.
- [94] Smith O, Clapham A, Rose P, Liu Y, Wang J, Allaby RG. A complete ancient RNA genome: Identification, reconstruction and evolutionary history of archaeological Barley Stripe Mosaic Virus. Sci Rep. 2014; 4: 1-6. doi:10.1038/srep04003
- [95] Ng TFF, Chen LF, Zhou Y, Shapiro B, Stiller M, Heintzman PD, et al. Preservation of viral genomes in 700-y-old caribou feces from a subarctic ice patch. Proc Natl Acad Sci U S A. 2014; 111: 16842-16847. doi:10.1073/pnas.1410429111
- [96] Peyambari M, Warner S, Stoler N, Rainer D, Roossinck MJ. A 1,000-Year-Old RNA Virus. Pfeiffer JK, editor. J Virol. 2019; 93: e01188-18. doi:10.1128/JVI.01188-18
- [97] Schulz F, Roux S, Paez-Espino D, Jungbluth S, Walsh DA, Denef VJ, et al. Giant virus diversity and host interactions through global metagenomics. Nature. 2020; 578: 432-436. doi:10.1038/s41586-020-1957-x
- [98] Schulz F, Abergel C, Woyke T. Giant virus biology and diversity in the era of genome-resolved metagenomics. Nat Rev Microbiol. 2022; 20: 721-736. doi:10.1038/s41579-022-00754-5
- [99] Dutilh BE, Varsani A, Tong Y, Simmonds P, Sabanadzovic S, Rubino L, et al. Perspective on taxonomic classification of uncultivated viruses. Curr Opin Virol. 2021; 51: 207-215. doi:10.1016/j.coviro.2021.10.011
- [100] Mavrich TN, Hatfull GF. Bacteriophage evolution differs by host, lifestyle and genome. Nat Microbiol. 2017; 2: 17112. doi:10.1038/nmicrobiol.2017.112
- [101] Jia H, Gong P. A structure-function diversity survey of the rna-dependent rna polymerases from the positive-strand rna viruses. Front Microbiol. 2019; 10: 1-11. doi:10.3389/fmicb.2019.01945
- [102] Chiba Y, Oiki S, Zhao Y, Nagano Y, Urayama SI, Hagiwara D. Splitting of RNA-dependent RNA polymerase is common in Narnaviridae: Identification of a type II divided RdRp from deep-sea fungal isolates. Virus Evol. 2021; 7: 1-9. doi:10.1093/ve/veab095
- [103] Firth AE, Brierley I. Non-canonical translation in RNA viruses. J Gen Virol. 2012; 93: 1385-1409. doi:10.1099/vir.0.042499-0
- [104] Wolf YI, Silas S, Wang Y, Wu S, Bocek M, Kazlauskas D, et al. Doubling of the known set of RNA viruses by metagenomic analysis of an aquatic virome. Nat Microbiol. 2020. doi:10.1038/s41564-020-0755-4
- [105] Wright BW, Molloy MP, Jaschke PR. Overlapping genes in natural and engineered genomes. Nat Rev Genet. 2022; 23: 154-168. doi:10.1038/s41576-021-00417-w
- [106] O'Leary NA, Wright MW, Brister JR, Ciufo S, Haddad D, McVeigh R, et al. Reference sequence (RefSeq) database at NCBI: Current status, taxonomic expansion, and functional annotation. Nucleic Acids Res. 2016; 44: D733-D745. doi:10.1093/nar/gkv1189
- [107] Roux S, Krupovic M, Debroas D, Forterre P, Enault F. Assessment of viral community functional potential from viral metagenomes may be hampered by contamination with cellular sequences. Open Biol. 2013; 3. doi:10.1098/rsob.130160
- [108] Roux S, Emerson JB, Eloe-Fadrosh EA, Sullivan MB. Benchmarking viromics: An in silico evaluation of metagenome-enabled estimates of viral community composition and diversity. PeerJ. 2017; 2017: 1-26. doi:10.7717/peerj.3817
- [109] Mönttinen HAM, Ravantti JJ, Poranen MM. Structure unveils relationships between rna virus polymerases. Viruses. 2021; 13: 59-60. doi:10.3390/v13020313
- [110] Te Velthuis AJW. Common and unique features of viral RNA-dependent polymerases. Cell Mol Life Sci. 2014; 71: 4403-4420. doi:10.1007/s00018-014-1695-z
- [111] Dion MB, Oechslin F, Moineau S. Phage diversity, genomics and phylogeny. Nat Rev Microbiol. 2020; 18: 125-138. doi:10.1038/s41579-019-0311-5
- [112] Lulla V, Firth AE. A hidden gene in astroviruses encodes a viroporin. Nat Commun. 2020; 11. doi:10.1038/s41467-020-17906-x
用語説明
1.メタゲノムデータ
環境サンプルから取得された核酸を網羅的にシーケンスで配列解析を行ったデータ
2.メタトランスクリプトームデータ
環境サンプルから取得された核酸の中でも特にRNAを網羅的にシーケンスで配列解析を行ったデータ
3.de novoアセンブリ
シーケンシングのために断片化された配列(リード)をコンピューター上で繋ぎ合わせて元の配列を復元したコンティグを取得する手法
4.コンティグ
リードからde novoアセンブリによって復元された長い配列
5.ビニング
コンティグやリードから配列組成や存在量を基に配列を分類することでMetagenome Assembled Genomes (MAGs)を構築する手法
6.プロファージ配列
細菌のゲノム中に挿入された状態のファージのゲノム配列
7.スペーサー
CRISPR座位に存在する、過去にCRISPRのターゲットとなったファージなどの可動遺伝因子(MGE)の断片配列
8.プロトスペーサー
MGEゲノム上のCRISPRにターゲットとなったスペーサーと同一の配列
9.ダイレクトリピート(DR)
CRISPR座位に存在する、スペーサーの間に存在する繰り返し配列
著者略歴
|
西村 瑠佳 北海道大学理学部生物科学科卒業。現在、総合研究大学院大学生命科学研究科遺伝学専攻五年一貫博士課程に在籍し、国立遺伝学研究所人類遺伝研究室にて古代ウイルス研究に取り組む。2021年度より日本学術振興会特別研究員(DC1)。生命情報科学若手の会と遺伝学若手の会の運営に携わり、若手研究者間のネットワーク作りに取り組む。 |
井ノ上 逸朗 鹿児島大学医学部卒、鹿児島大学大学院にて生化学で学位取得。徳島大学酵素化学研究所を経て、米国ユタ大学医学部生化学へポストドクとして留学。その後、ユタ大学ハワードヒューズ医学研究所の研究員として遺伝学を学ぶ。帰国後は群馬大学生体調節研究所の助教授、東京大学医科学研究所客員助教授、東海大医学部教授、国立遺伝学研究所人類遺伝研究室教授。2023年度より同研究室特任教授。 |