レトロトランスポゾン
レトロトランスポゾン (Retrotransposon) は、トランスポゾンつまり「可動遺伝因子」の一種であり、多くの真核生物組織のゲノム内に普遍的に存在する。レトロトランスポゾンは、自分自身を RNA に複写した後、逆転写酵素によって DNA に複写し返されることで移動、つまり「転移」する。DNA 型トランスポゾン(狭義のトランスポゾン)が転移する場合と異なり、レトロトランスポゾンの転移では、DNA 配列の複製が起こる。「レトロトランスポゾン」は「レトロポゾン (retroposon)」とも呼ばれる。
レトロトランスポゾンは、植物では特に多く、しばしば核 DNA の主要成分となる。例えば、トウモロコシでは、ゲノムの 80%、コムギでは、ゲノムの 90% がレトロトランスポゾンである。
生物活性
レトロトランスポゾンの複製的転移では、因子のコピー数が急速に増加するため、ゲノムサイズが大幅に増大する。DNA 型トランスポゾンの場合と同様、この場合も、遺伝子近傍もしくは遺伝子内への DNA 配列挿入がされることで突然変異が起こりうる。その上、レトロトランスポゾンにより引き起こされる突然変異は、挿入部位での配列が複製機構による転移の際に保持されるので、比較的に安定である。
レトロトランスポゾンの転移と、そのホストゲノム内での残留とは、双方とも、何千万年にわたってきたレトロトランスポゾン・ホストゲノム間関係の結果、レトロトランスポゾン及びホストゲノムへの有害な影響を避けるように、レトロトランスポゾン及びホストゲノム内にコード化された因子により制御されているようである。レトロトランスポゾンとそのホストゲノムとが、お互いの生存機会を最大化するよう、転移、挿入の特異性 (insertion specificities)、そして突然変異形質を統御する機構を共進化させてきた仕方は、ようやく解明され始めたばかりである。
レトロトランスポゾンの種類
レトロトランスポゾンは、クラスIの可動因子である。そして、末端に長い反復配列を有する「LTR (long terminal repeat) 型レトロトランスポゾン」と、それ以外の「非 LTR 型レトロトランスポゾン」との2つに類別される。LTR 型レトロトランスポゾンの端末には、100 bp 程度から5kb超の長く続く反復配列がある。LTR 型レトロトランスポゾンは、更に、配列の類似性の程度と、遺伝子産物コードの順番との両方に基づいて、Ty1-copia 群と Ty3-gypsy 群との2つに分けられる。大規模ゲノムを有する植物の場合は、Ty1-copia 群及び Ty3-gypsy 群のレトロトランスポゾンのコピーが多数(一倍体 — haploid.「単相体」、「半数体」とも言う — 細胞核当たり数百万コピーまで)発見されるのが普通である。Ty1-copia 群レトロトランスポゾンは、単細胞藻類からコケ植物、裸子植物、被子植物に至る範囲の植物種で、極普通に見られる。Ty3-gypsy 群レトロトランスポゾンも、裸子植物、被子植物双方を含め、同様に広範に分布している。LTR 型レトロトランスポゾンは、ヒトゲノムの約8% を構成する。
非LTR 型レトロトランスポゾンは、「長鎖散在反復配列」("long interspersed nuclear element" LINE) を有するものと「短鎖散在反復配列」("short interspersed nuclear element" SINE) を有するものとの2種類に分けられる。植物では、これらも、多くのコピー数(250,000 まで)が見いだされる。
- LINE(長鎖散在反復配列)は、逆転写された RNA 分子を表現する長いDNA配列であり、本来なら RNA ポリメラーゼ IIにより mRNA(リボソーム上で蛋白質に翻訳されるメッセンジャー RNA)に転写されるべきものである。LINE は、偽遺伝子と呼ばれることもあり、イントロンやプロモータ (promoter) を含まないが、内部に逆転写酵素やインテグラーゼ(integrase. レトロトランスポゾンにおける、トランスポザーゼ — Transposase.「トランスポゼース」とも言う — の等価物)のコードを有し、これにより、そうしたコード部分自身と、その他の非蛋白質コード部分とを併せて、複写できる。LINE は、(狭義のトランスボゾンがするような移動ではなくて)自分自身の複写により移動するので、ゲノムを増大させる。例えば、ヒトゲノムは、約 500,000 の LINE を含むが、これは、ゲノム全体の 21% にあたる。LINE は、DNA鑑定 (genetic fingerprint) で利用されている。
- SINE (short interspersed nuclear element) は、逆転写された RNA 分子を表現する短い DNA 配列であり、本来なら RNA ポリメラーゼ IIIにより tRNA、rRNA、その他の核内低分子 RNA に転写されるべきものである。SINE は、有効な逆転写酵素蛋白質のコードを持たず、転移は他の可動因子に頼っている。最も良く見られる SINE は、Alu 配列 (Alu sequence) と呼ばれるものである。Alu 配列は、約 300 塩基対の長さがあり、蛋白質コード配列を全く含まず、制限酵素 AluI で認識される("Alu" と云う命名は、これによる)。ヒトゲノム中には 約 100万コピー存在し、その約 11% を占める。LINE 及び SINE は、双方とも、その目的が判明しておらず、「利己的な DNA」とかジャンクDNAとも呼ばれている。SINE は、ヒトゲノムの 13.5% を占める。
ヒト免疫不全ウイルス (HIV)-1 又は ヒトTリンパ好性ウイルス (HTLV)-1 などのような、或る種のウイルスは、レトロトランスポゾンのように振る舞い、逆転写酵素及びインテグラーゼの双方を含む。