本研究の目的は、並列論理型言語による分子進化系統樹の作成と、その分子進 化的研究における応用である。
分子進化学とは、分子レベルで見た生命の「過去における状態の推定」であり、 また「過去の再構築」を行なう学問である。伝統的な進化学においては、生物 の形態的な変化のみから、生命の歴史を推定していた。一方、分子進化学にお いては、分子レベルで生命がいかに進化してきたかを、主に現生の生物の知見 から推定を行なおうとする。具体的にはある特定の分子のアミノ酸配列やその 遺伝子の配列、あるいはRNAの配列などを用いる。したがって、分子進化学は 分子生物学と密接な関係を持っている。例えば、分子生物学で言う「保存され た領域」とは「分子進化的に保存された領域」に他ならない。
生物学にまつわる知識表現をどうするかという問題は、分子生物学的な知識が 蓄積するにつれ、重要なものとなりつつある。現時点において、統一的な生物 学的法則の記述は存在しない。我々が教科書の記述などで目にする生物学の知 見は、あくまである特定の生物種についてのものであって、 ローカルな 法則について述べているに過ぎないと考えた方が正確である。また、そのよ うな法則をどの程度一般化できるのかという疑問に答えるのは、決して簡単な ことではない。生物学が、科学であるというよりは、博物学であるという議論 さえあるのはこのためである。
進化学は、このような断片的な知見にとどまっている生物学的知識を統合する ための重要な鍵である。従来の意味での生物学を、生物学的知識表現を織りな すための縦糸とすれば、進化学はいわば横糸であると言える。我々はこの横糸 を張ることによって初めて、生物学を博物学のくびきから解き放つことができ るのではないだろうか。
分子進化系統樹とは、生命がいかに進化してきたかを分子レベルで表現した系 統樹である。古典的な意味での系統樹は、生物の表現型(つまり形態)の変化 を化石資料などをもとに推定して得られたものであった。したがって、この方 法論には、基準となるべき客観的な尺度が必ずしもあるわけではなかった。一 方、分子生物学の発展にともない、我々は生命の設計図である遺伝情報を手に 入れることができるようになった。この離散的な遺伝情報をもとに生命の進化 を分子レベルで調べようとする学問が分子進化遺伝学であり、そのための強力 な表現手段となるのが分子進化系統樹である。
分子進化系統樹の作成法には、大きくわけてふたつのカテゴリーが存在する。 ひとつが距離行列法であり、もうひとつが形質状態法である。距離行列とは DNAやアミノ酸配列間の遺伝的な距離(推定突然変異数)を行列にしたもので ある。距離行列法はこの遺伝的な距離を用いて進化系統樹を推定する。一般に、 距離行列法では、距離行列そのものの計算を非常に簡単にできるので、高速な 推論が可能である。しかし、遺伝情報の持つすべての情報を使っているわけで はないので、進化的な変異が大きくなると誤った結果を導く可能性がある。
一方、形質状態とは、遺伝情報のつらなり(配列)そのものを指す。形質状態 法では配列の一座位ごとに進化的関係を推定し、これをもとに全体の進化系統 樹を再構成する。特に最尤法は、あからじめ与えた進化モデルと矛盾しない範 囲内で、信頼性の高い系統樹の推定が期待できる。しかし、それとは裏腹に非 常に高い計算コストが要求され、現在のところまだ一般的な方法とは言えない。
最尤法の計算量の問題を緩和する方法のひとつは、強力なヒューリスティクス の導入であるが、計算時間を短縮する方法として有望なのは、最尤系統樹推定 アルゴリズムの並列環境への実装である。この並列環境へのアルゴリズムの実 装は、分子進化系統樹作成法だけではなく、分子進化学における様々な研究に 応用可能である。本研究では、新世代コンピューター開発機構(ICOT)の並列論 理型言語KL1を用いて、実用的かつ発展性のある遺伝情報解析プログラムの開 発を目指している。