情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
記事
ゲノム,エピゲノムからヌクレオームへ:遺伝情報発現制御機構の包括的理解に向けて
木村 宏佐藤 優子
著者情報
ジャーナル フリー HTML

2017 年 60 巻 8 号 p. 555-563

詳細
著者抄録

生物の遺伝情報はゲノムDNAに刻まれている。ゲノムDNAからいかにして必要な情報を必要に応じて取り出すことができるのか,という問題を解明できれば,生命現象の理解に大きく近づくことができる。遺伝子の発現制御には,DNAに直接結合する転写因子が必須であるが,ヒストンの翻訳後修飾を介したエピジェネティクス制御や細胞核内でのゲノム高次構造なども重要な役割を果たすことがわかってきた。そこで,最近,細胞核を包括的かつ時空間的に理解する「ヌクレオーム(Nucleome)」研究が注目を集めている。ヌクレオーム研究という視点に立ち,顕微鏡解析,ゲノム解析,情報・数理解析を融合させることで,ゲノムの発現制御機構を理解できると考えられている。ヌクレオーム研究は米国ですでに予算措置されている他,ヨーロッパでの動きや国際コンソーシアム発足に向けた活動も進んでいる。わが国でもヌクレオーム研究を推進することが生命科学の発展に重要であると考えられる。

1. はじめに

生物の遺伝情報はDNAに刻まれている。近年の解析技術の進歩により,さまざまな生物種の遺伝情報や個人レベルでの遺伝情報を簡単に解読することができるようになってきた。また,iPS(induced pluripotent stem)細胞(誘導性多能性幹細胞)をはじめとして,特定の転写因子を導入することで人為的に細胞を操作する技術の開発も進んでいる。しかしながら,ゲノムDNA注1)の配列とそこに結合する転写因子だけでは,ゲノム機能の発現制御を理解することはできない。実際,引き伸ばすと2メートルに及ぶDNAが直径数マイクロメートルのヒト細胞の細胞核中に収納されているが,この長大なるDNAがどうやって機能的に折りたたまれ,どのようにして必要な情報が必要なときに取り出されるのか,というのは古くからの疑問であった。最近,解析技術が発展してきたことにより,細胞の3次元空間の中でのゲノム配置,および,時間の流れの中でのダイナミックな変化を知ることの重要性が再認識され,「ヌクレオーム」という視点での遺伝子・ゲノム研究が注目されている1)2)。ヌクレオーム(Nucleome)とは,ゲノムが存在する場所である細胞核(Nucleus)に「総体・全体」という意味をもつ-omeを付加した造語である。

2. 生物の遺伝情報

DNAは,糖,リン酸,塩基から構成されるヌクレオチドを基本単位とするポリマーである。ヌクレオチドを構成する成分のうち,糖とリン酸は共通だが,塩基は,アデニン(A),シトシン(C),グアニン(G),チミン(T)の4種類存在する。DNAの構造はすべての生物で共通であり,A,C,G,Tの4つが並ぶ順番と長さが個々の生物個体の遺伝情報を規定している。たとえば,原核生物である大腸菌は,約4,000の遺伝子が存在する4.6×106塩基対の長さの環状ゲノムDNAをもつ。細胞核をもつ真核生物では,DNAは細胞核とミトコンドリアに存在する注2)が,ほとんどの遺伝子は細胞核のDNAにコードされている。細胞核DNAは末端をもつ直鎖状の構造であり,ヒトの体細胞では6×109塩基対のDNAが46本の染色体に分かれて存在する注3)

細胞が分裂するとき,DNAの情報は娘細胞に受け継がれる。1つの受精卵から出発する単一の生物個体では,すべての細胞は基本的に同じDNA塩基配列をもっている注4)。すなわち,体の中には特定の機能をもった細胞やその集合体である組織・臓器(たとえば,肝臓や皮膚,神経など)が存在するが,それぞれの細胞の中では遺伝情報であるDNAは同一である(1)。

図1 ゲノムと遺伝子発現

3. 遺伝情報の発現

同一の遺伝情報をもつ細胞が,どうして異なる形や性質をもつことができるのだろうか。それは,細胞によって使われる遺伝子が異なるからである。つまり,ゲノムDNAには,異なる細胞を形成するための必要な情報が含まれているが,個々の細胞では,情報の一部のみが使われる。「遺伝情報が使われる」とは,DNAの情報がRNA(リボ核酸)へ「転写」され,さらにアミノ酸配列に「翻訳」されてタンパク質が産生されることである(1)。DNAの構造は塩基の種類や配列によらず比較的単純・安定であるのに対して,RNAやタンパク質は多様な構造をとることができるため,酵素や構造体として働き,細胞に構造や機能を与えることができる。特に,タンパク質は20種類のアミノ酸から構成され,さまざまな立体構造をとりうるため,多様な活性を保持することができる。このように,一部の遺伝情報が読み取られて特定のRNAやタンパク質が産生されることを「遺伝子が発現する」という。たとえば病気の細胞や組織で,どのようなRNAやタンパク質が存在しているか(どのような遺伝子が発現しているか)を網羅的・包括的に調べて,正常な場合と比較することができる注5)

4. 遺伝情報発現の制御

4.1 転写因子

次に,ある特定の細胞で特定の遺伝子が発現する仕組みについて考えたい。遺伝子が転写されるためには,RNAポリメラーゼや転写因子というタンパク質が必要である。RNAポリメラーゼは,RNAを転写する酵素そのものであり,転写因子はRNAポリメラーゼが働くことを助けるタンパク質である。転写因子には,すべての遺伝子の転写に必要な基本転写因子と特定の遺伝子の転写を促す特異的転写因子がある。遺伝子の選択には,特定のDNA配列に結合する特異的転写因子が重要である(2)。

たとえば,iPS細胞の作製に用いられたのは,Oct3/4,Sox2,Klf4等の特異的転写因子であり3),これらの転写因子が未分化幹細胞で働く遺伝子群の調節領域に結合することで,基本転写因子やRNAポリメラーゼなどが働き,それらの遺伝子の発現が促進される。したがって,これらの幹細胞特異的転写因子を分化した皮膚細胞等に強制的に発現させることで,未分化細胞で働く遺伝子群の発現が誘導されて,細胞の性質が未分化状態に変化しiPS細胞が作製できる。

図2 転写因子による発現制御

4.2 転写因子以外の制御によるX染色体の不活性化

上述のように,特定の細胞でどの遺伝子が使われるか(発現するか)という選択には,DNA配列情報が使われる。つまり,特異的転写因子とその結合配列の組み合わせで発現する遺伝子の選択が決まる注6)。しかし,特異的転写因子とその結合配列が存在しても,必ずしも遺伝子が発現するわけではない。

ヒトの体細胞では,父親と母親から由来するDNA配列が極めて類似した2セットのゲノムが存在する。しかしながら,1つの細胞中で,母親もしくは父親由来の遺伝子しか発現しない場合がある。その最も顕著な例は,不活性X染色体である(3)。ヒトを含めたほ乳類では,雌雄の差は性染色体により決まっている。すなわち,雌はX染色体を2本,雄はX染色体とY染色体を1本ずつもつ。Y染色体には精子形成等に関わる少数(数百)の遺伝子しか存在しないのに対して,X染色体には生存に必須な遺伝子を含めて数千の遺伝子が存在している。常染色体は雌雄ともに2本ずつもっていることから,X染色体と常染色体の比が雌雄で異なること(雌で2倍)になる注7)。このX染色体上の遺伝子の発現量を雌雄でそろえるため,ほ乳類の雌体細胞では,1本のX染色体からの遺伝子発現を抑制する仕組みがある4)。つまり,1つの細胞核中で同じDNA配列をもつ染色体が2本あるにもかかわらず,片方の遺伝子は発現し,もう片方は発現しない(3)。この現象は,転写因子の有無だけでは説明できず,「別の階層」での制御が必要となる。その別の階層の一つは,DNAやヒストンの化学修飾である。

図3 転写因子とは異なる階層による不活性X染色体の制御

4.3 エピジェネティクス制御

真核生物の細胞核DNAは,ヒストンタンパク質に強く結合し,ヌクレオソーム構造をとって存在している(4)。ヌクレオソームが連結したものがクロマチンである。ヌクレオソームは,約150塩基対のDNAがヒストン複合体の周りを約2回取り巻く構造で,細胞核の中にDNAを収納するための基本単位となっている注8)。そのため,DNAへの直接の化学修飾に加えて,ヒストンの翻訳後修飾注9)が遺伝子発現の制御に働く。

DNAの修飾に関しては,CG配列中のCのメチル化が転写抑制に働くことが知られている。ヒストンの翻訳後修飾は多様であるが,遺伝子の制御にはH3のメチル化,アセチル化,ユビキチン化などが重要である。たとえば,発現が抑制されている遺伝子の制御領域では,H3の27番目のリジン残基(H3K27)がトリメチル化されていることが多く,逆に発現する遺伝子ではH3K27のアセチル化が見られる(5)。実際,不活性X染色体では,遺伝子制御領域においてDNAのメチル化とH3K27のトリメチル化が顕著に濃縮されており,染色体全体が凝縮した構造をとっている4)6)。これらの抑制的に働く修飾は,細胞が分裂しても通常維持されるため,一度不活性化したX染色体の不活性化状態は娘細胞に維持される。このように,DNAの配列自体に変化はなくとも,DNAやヒストンに付加されたメチル化等の標識により遺伝子発現の抑制状態などが継承される現象を「エピジェネティクス(epigenetics)」注10)という。

図4 ヌクレオソームとヒストンの翻訳後修飾
図5 ChIP-seqによるエピゲノムランドスケープの模式図
図6 トリメチル化ヒストンH3K27(矢印)が濃縮する不活性X染色体

4.4 エピゲノム

近年,クロマチン免疫沈降(ChIP: chromatin immunoprecipitation)注11)と大規模塩基配列解析(sequencing)を用いて,細胞集団や組織における転写因子やヒストン修飾の分布の全貌をとらえることが可能になった5)6)5)。また,DNAメチル化部位も全ゲノムレベルで明らかにすることができる。これら遺伝子発現制御に関わる標識のゲノム上での分布を「エピゲノム(epigenome)」という。

生物個体の中では,すべての細胞のゲノムは基本的に同一であると考えられるが,エピゲノムは細胞の種類によって異なる。それは,細胞種によって発現する遺伝子,発現しない遺伝子が異なるからである。エピゲノムは,発生過程のみならず,環境変化や加齢によっても変化する。エピゲノム解析には,特に米国やEUで多くの予算措置がなされ,さまざまな生物種・細胞種での情報が得られている他,解析手法の開発も行われている。また,ヒトの種々の正常組織のエピゲノムを明らかにするための国際組織(国際ヒトエピゲノムコンソーシアム)も発足し,日本もCRESTのチームとして参加している6)

4.5 3次元ゲノム構造

エピゲノムや転写因子の局在を1次元のゲノム情報のうえにマッピングすると,遺伝子の抑制と活性化に働く標識が異なる場所に存在していることがわかる。このすみ分けがうまくできていることにより,発現する遺伝子と発現しない遺伝子の区別と継承が行われる。しかしながら,これらのエピジェネティクス標識は必ずしも安定に保持されるわけではなく,むしろダイナミックに変化しつつ定常状態として維持されることがわかってきた。また,ヒストンの修飾は,両隣に広がり抑制された領域を拡大する傾向があるため,抑制的な修飾と遺伝子活性化に働く修飾がせめぎあう境界領域が形成されるが,この境界もダイナミックに変動しうる。その一方で,ゲノムはより明瞭な空間的に近接する領域(TAD: topologically associating domain)を形成することもわかっている(7注12)7)8)

実際の細胞核中では,1次元的にはゲノム上の距離が離れているにもかかわらず,ループ構造を作ることで2つの領域が空間的に近接して存在したり,近傍にあるにもかかわらず空間的に離れて存在したりする場合がある。たとえば,ある遺伝子が転写活性化する際に,転写開始領域から離れた場所にあるエンハンサー(転写因子が結合するゲノム領域)が働くことが多いが,エンハンサー領域と転写開始領域が同一のTADに存在する場合は転写が活性化されるが,2つのTADに分れている場合は転写が活性化しない(7注13)

このような空間的局在性は,転写因子間の結合や転写そのものに影響される場合もあるが,2本のDNAをつなぎ留めるタンパク質注14)も寄与すると考えられている。

したがって,遺伝子発現の制御機構を理解するためには,転写因子やエピゲノム情報のみならず,細胞核内の高次構造を知ることやその制御機構を解明することが重要である。実際,ある病気の原因となるゲノムの変異を調べた結果,ドメイン形成の異常をもたらす変異が生じていた例なども見つかっている8)

図7 Hi-C解析の模式図とゲノム高次構造のモデル図

5. ヌクレオーム

5.1 ヌクレオーム研究の現状

上述のような背景から,細胞核内の遺伝子制御機構を解明するためには,ゲノム配列,転写因子,エピゲノム状態,空間配置と凝縮状態,さらには,核内構造体注15)の役割,分子動態等を統合的に理解する必要があるとの機運が高まり,また解析技術も進歩してきたことから,細胞核の包括的な理解という意味で「ヌクレオーム(Nucleome)」という概念が形成された1)2)8)。細胞核の3次元構造(3D)に時間軸を加えた「4Dヌクレオーム」として称される場合が多いが,より広い意味を考えて,必ずしも4Dを付加する必要がないとの議論もある9)

ヌクレオームに関する初めての国際会議は,Cremer兄弟らにより2013年にドイツで開催された10)。ちょうどその頃,顕微鏡技術が著しい進歩を遂げ,生細胞観察技術や超解像技術で細胞核内構造のダイナミクスを微細にとらえることが可能になってきた。また,次世代シーケンサーを用いたゲノム解析技術も発展し,エピゲノム情報が蓄積していた。これらの技術を融合し,かつ情報解析やモデリングなどにより,細胞核内のゲノム制御機構が解明できる可能性が考えられた。

ヌクレオーム研究は,ゲノムプロジェクト,エピゲノムプロジェクトと続いたゲノム解析の流れにも合致し,2015年に,米国国立衛生研究所(NIH)で4D Nucleome Programとしていち早く予算化された11)。米国以外にも,ヨーロッパで4D Nucleome Initiative in EuropeのWebサイトが開設され12),また2015年に広島で行われた4D Nucleomeミーティングの参加者を中心とした「国際ヌクレオームコンソーシアム」発足の動きがある9)13)。日本国内においても,筆者らを中心としてヌクレオーム研究の重要性についての発信を続けている1)2)

図8 ヌクレオーム研究の方法論と概念

5.2 ヌクレオーム研究の今後

ヌクレオーム研究の機軸となるのは,(1)顕微鏡解析,(2)ゲノム解析,(3)情報・数理解析,である(8)が,その中でも情報科学・数理科学分野が極めて重要である。これまでも情報科学はハードとソフトの両面から,顕微鏡画像解析やゲノム解析の発展を支えてきた。これからのヌクレオーム研究の鍵となるのもまさしく情報・数理科学であり,生物科学との融合研究が期待されている。実際,米国の4D Nucleome Programでも,最初の5年間は基盤技術の開発が中心になっており,特に情報・数理科学への支援を柱の一つに据えている。

顕微鏡に関しては,さらなる時間分解能や空間分解能の向上,および,多色化が求められている。また,同一細胞で時間軸の解析を行うためには生細胞解析が必須であるため,細胞核内のイベント(遺伝子やタンパク質の動き,エピジェネティクス標識や転写活性等)を生細胞でとらえるためのプローブ開発の開発も進める必要がある14)。さらに,近年注目されているクライオ電子顕微鏡をヌクレオーム研究に導入することで,細胞核内での構造を保ったままの高精細な分子構造解明が可能になるであろう。

ゲノム高次構造およびエピゲノムの解析に関しては,少数細胞化が鍵になっている。細胞内に数十から数百コピーが存在するような転写産物に対して,DNAは細胞中に2コピーしかないため,単一細胞での解析は比較的困難である。しかしながら,クロマチンアクセシビリティー注16)やHi-C注13)による高次構造解析は可能となっており,また,ChIPの報告もある15)。しかし,検出感度や精度を向上させること,および,複数のオミクス情報(たとえば高次構造とエピゲノム)を単一細胞から取得することが求められている。また,同一の細胞で生細胞顕微鏡画像情報とゲノム解析情報を得ることで,細胞の増殖や分化の状態をゲノム構造・エピゲノム構造と関連づけることが可能になると思われる。

ヌクレオームの研究には,情報科学や数理科学が極めて重要である。ハイコンテントな顕微鏡画像やエピゲノム・高次構造情報などのいわゆるビッグデータを処理,可視化,重要な情報の抽出を行う必要がある。また,実験による計測データを説明できる理論モデルの開発なしには,複雑な制御機構を理解することはできないだろう。最近急速に開発が進んでいる機械学習や人工知能をうまく取り入れることができれば,細胞核中のDNAの存在様式から,遺伝子発現制御を理解し,細胞の状態や運命を予見し,ゲノムと表現型が連結できるようになるかもしれない。

6. おわりに

遺伝子発現の調節機構を明らかにすることは,生命現象の理解に必須であるばかりでなく,さまざまな病気や加齢に伴う細胞機能の変化や低下の分子機構の解明にも重要である。本稿では,遺伝子発現がさまざまな階層で制御されていること,および,その解明に向けた技術が発展しつつあることについて述べた。ヌクレオームという視点に立った研究は,国際的にも開始されたばかりであるが,多くの新規概念や新技術が提案されている。わが国の生命科学の発展のためにも,ヌクレオソーム研究を可及的速やかに推進すべきであると考えられる。

執筆者略歴

  • 木村 宏(きむら ひろし) hkimura@bio.titech.ac.jp

北海道大学理学部化学第二学科卒業。1996年北海道大学博士(理学)。オックスフォード大学研究員(1996~2002年),東京医科歯科大学助教授(2002~2003年),京都大学特任教授(2003~2007年),大阪大学准教授(2007~2014年)等を経て,2014年より東京工業大学教授。クロマチンと細胞核の機能と制御について研究。

  • 佐藤 優子(さとう ゆうこ) satoy@bio.titech.ac.jp

東北大学農学部農芸化学科卒業。2008年総合研究大学院大学博士(理学)。国立循環器病センター研究員(2006~2011年),大阪大学研究員(2011~2014年),東京工業大学研究員(2014~2016年)等を経て,2017年より東京工業大学助教。ヒストン修飾の生細胞・生体内ダイナミクスについて研究。

本文の注
注1)  ある生物をその生物たらしめるのに必須な遺伝情報を「ゲノム(genome)」という。遺伝子(gene)と総体・全体を表す(-ome)を合わせたもの。DNAがゲノムの本体である。

注2)  植物では,色素体にもDNAが存在する。ミトコンドリアと色素体のDNAは環状であり原核生物のタイプである。

注3)  体細胞では,母親由来と父親由来の2セットのDNAが存在する。半数体の生殖細胞では,3×109塩基対,23本の染色体であるため,ヒトのゲノムサイズという場合,この半数体の大きさ(3×109)を指す。遺伝子の数は,約2万と推測されている。

注4)  免疫細胞では,抗体などの遺伝子の再編成が起こるため,一部のゲノム配列が他とは異なる。また,がん細胞などではDNAに変異が入っている場合が多い。

注5)  RNAは転写の産物(transcript)であるため,その全情報はトランスクリプトーム(transcript+ome),全タンパク質(protein)の情報はプロテオーム(protein+ome)と呼ばれている。

注6)  単一の転写因子が認識するDNA配列は6-8塩基対程度であり,選択性はあまり高くない。そのため,1つの遺伝子の制御には複数の転写因子が関わることが多い。

注7)  直感的には2倍の差はあまり影響ないように感じるが,数千の遺伝子が2倍の発現となることの影響は大きい。21番染色体が1本多い(トリソミーの)ダウン症候群では,21番染色体上の遺伝子が1.5倍になるだけで重篤な影響がある。実は,21番染色体はヒトの常染色体で最も遺伝子数が少ない(200程度)ためにそのトリソミーでも出生に至るが,他の常染色体のトリソミーではより重篤な発生異常が起こるためほとんど出生に至らない。

注8)  1個のヌクレオソームには,4種類のヒストンタンパク質(H2A,H2B,H3,H4)が2分子ずつ含まれる。ヒストンは塩基性のタンパク質であり,酸性のDNAとよく結合し,ある程度中和することができる。

注9)  RNAの情報がアミノ酸に「翻訳」されてタンパク質が産生された後,タンパク質中のアミノ酸残基がリン酸化,アセチル化,メチル化などの化学修飾を受ける場合がある。これを「翻訳後修飾」という。

注10)  遺伝学(genetics)に,epi-(「付加的な」「外部の」という意味の接頭語)を付けた造語が「エピジェネティクス」であり,日本語では「後成的遺伝学」と呼ばれることもある。

注11)  ChIPは,断片化させたクロマチンから,転写因子や特定のヒストン修飾に対する抗体を用いて標的のタンパク質・修飾をもつクロマチンを回収して,そこに結合するDNAやタンパク質を調べる方法である。大規模塩基配列解析(sequencing)と組み合わせたChIP-seqにより,エピゲノムランドスケープを明らかにできる。

注12)  細胞核内のゲノム間相互作用は,3C(chromosome conformation capture)という近接したクロマチンを架橋して調べる方法や,そこから派生した網羅的解析法(Hi-C等)を用いて調べることができる。

注13)  Hi-Cは,Chromosome conformation capture(3C)法を応用した解析法で,細胞核内で近接したゲノムDNAを網羅的に同定できる。Hi-C法を用いて,細胞のゲノムDNAがどのような3次元構造を形成するのか調べることができる。

注14)  コヒーシンやコンデンシンと呼ばれるタンパク質が2本のDNAをつなぎ留めることができる。細胞核のクロマチン高次構造の形成にはコヒーシンが重要な役割を果たしており,分裂期の染色体構造形成にはコンデンシンが働いている。

注15)  細胞核内には,タンパク質やRNAを主要な構成成分とする多くの構造体(核膜,核膜孔複合体,核小体,スプライシング因子スペックルなど)が存在する。これらの構造体の形成機構や遺伝子発現制御における意義等に関する全貌は未解明である。

注16)  一般的に,発現している遺伝子はクロマチンが弛緩しているのに対して,発現が抑制されたゲノム領域はクロマチンが凝縮している。そのため,凝縮したクロマチンへは,タンパク質や核酸などの巨大分子がアクセスしづらい。また,発現する遺伝子領域の中でも,転写開始点付近はヌクレオソームが安定に形成されづらいため,特にアクセスしやすくなっている。したがって,クロマチンアクセシビリティーの解析により,クロマチンの弛緩状態や転写因子の結合状態を評価できる。

参考文献
 
© 2017 Japan Science and Technology Agency
feedback
Top