RNA-seqをはじめとするトランスクリプトーム解析は、細胞機能や疾患メカニズムの解明に不可欠な手法として急速に普及してきた。しかし、従来のRNA-seqでは組織内での細胞の局在といった空間情報が失われるため、組織レベルでの生命現象を包括的に理解することは困難であった。こうした課題を解決する手法として登場した空間トランスクリプトームは、遺伝子発現データに組織内の位置情報を付加することで、細胞間ネットワークや微小環境を空間的な視点から解析できる画期的な技術として確立しつつある。本稿では、空間トランスクリプトームの代表的な実験技術と解析手法を概説し、脳神経科学や腫瘍免疫学をはじめとする最新の応用事例を紹介する。
生命科学分野で取得されるデータ集合は、雑多(ヘテロ)な構造になり、ヘテロなデータ構造を扱える理論的な枠組みがもとめられている。本連載では、汎用的なヘテロバイオデータの解析手法である行列・テンソル分解を紹介していく。第6回では、データに順序がある系列データで利用される行列・テンソル分解手法を紹介する。
系列データに基づく様々な行列に対し行列分解を行うと、固有ベクトルなどに三角関数のような形状が現れることが経験的に知られている。この様な現象は馬蹄効果・ファントム振動・正弦波効果などと呼ばれ、多様なシナリオで現れることが報告されてきた。本稿では、そのような三角関数様のパターンが現れるメカニズムを、パスグラフに対するラプラシアン固有マップの理論的な結果を軸とし、多様な問題が類似の問題に帰着できることを利用し、直感的に説明することを目指す。
生命活動を支配するシステムの全貌解明は、生命科学の究極的な目標の一つと言える。現在、一細胞、空間オミクスの発展により、特定の生命活動コンテキストにおける現象の網羅的な写像を得ることができるようになってきた。これらからその背後にある生体システムを同定する上で、深層生成モデルが注目を集めている。本総説では、まず、生成モデルが生体システムの同定になぜ有用なのか、並びに、その限界を深層生成モデルがどのように拡張するかを、細胞の遺伝子発現を生成する低次元の因子、細胞状態の推定問題を通して概説する。次に、細胞状態ごとの摂動に対する応答の予測、確率的ダイナミクスの推定、空間オミクスに対する微小環境の状態学習を通して、次元削減に留まらない、深層生成モデルの応用可能性を示す。最後に、さらなるオミクス技術、深層学習技術の発展が、高解像度のオミクスデータに対する深層生成モデルに何をもたらすのか、その展望を述べる。
バイオインフォマティクス分野の飛躍的な進展により、大規模なエピゲノムデータの解析が可能となった。その中で、複数のエピゲノム情報を用いて各ゲノム領域の状態を網羅的に推定する「クロマチン状態解析」の研究が盛んに行われている。クロマチン状態(chromatin state)は遺伝子発現や細胞機能の制御に密接に関与しており、その解析手法の進化はエピゲノム研究の重要な課題である。本稿では、クロマチン状態解析に関する最新の技術をレビューし、これらの手法の技術的な側面に着目し、その詳細を整理する。クロマチン状態の分類、進化的解析、時間的変化の解析、機能特性データの統合、クロマチン状態配列情報を活用したアプローチなど、多角的な解析手法の進展を取り上げ、それぞれの特徴と応用可能性について議論する。さらに、我々の開発した新規手法であるChromBERTについて述べ、本手法がクロマチン状態のより精緻な理解にどのように寄与するかを紹介する。
すでにアカウントをお持ちの場合 サインインはこちら