ヒトの遺伝情報が収められたヒトゲノムの研究が進んでおり、「標準的な配列」とされるリファレンス配列の最新のデータセット「GRCh38」が2013年12月に公表されていますが、この中でもまだ多くの部分は未解明のまま残されています。ジョン・ホプキンス大学の研究者らによる研究チームは、アフリカにルーツを持つ910人のゲノムを解析し、全体の10%に相当するこれまで未解明だった部分の解明に成功したと発表しました。

Assembly of a pan-genome from deep sequencing of 910 humans of African descent | Nature Genetics
https://www.nature.com/articles/s41588-018-0273-y

DNA data from Africans reveals sequences that we’d missed | Ars Technica
https://arstechnica.com/science/2018/11/our-human-reference-genome-is-missing-a-lot-of-material/

ヒトゲノムのレファレンス配列を得る際、これまでは数名程度のゲノムから得られたデータが用いられていただけであり、GRCh38の大部分はたった1人のDNAをもとに作られていたとのこと。この状態で「レファレンス」と呼ぶかどうかについてはさまざまな見方が存在しており、多くの研究者がさらに広範囲なゲノム情報をもとに作られたレファレンス配列の研究に従事しています。
https://i.gzn.jp/img/2018/11/26/missing-dna-found-from-african-root/10_m.png

その中でも特に重要とされるのが、さまざまな人種のグループを横断したデータにもとづくレファレンス配列の解明であり、今回発表された研究ではその一環としてアフリカ系のゲノム解析が進められてきたそうです。対象とされたのは上記の通りアフリカにルーツを持つ人々ですが、これは必ずしもアフリカに住む人だけというわけではなく、アメリカやアジア、ヨーロッパなどの地域に住む人々も含まれているとのこと。

研究者らは、対象者のDNAをレファレンス配列のデータセットと比較して一致しない部分が1000塩基対以上の部分を探しました。その結果、約3億塩基に相当する不一致部位を発見。これは、レファレンス配列データセット全体の約10%に相当します。
https://i.gzn.jp/img/2018/11/26/missing-dna-found-from-african-root/01_m.png

さらに、この不一致部分はアフリカ系の人々に固有のものではなく、そのうちの40%は韓国および中国の人々のゲノムと一致していたとのこと。ここから、人種ごとの特性を決定づける重要な遺伝情報は異なる人種間でも相互に存在しており、少数の人から得られた現在のレファレンス配列はその姿を確実に捉えられてはいないことを示唆しています。
https://i.gzn.jp/img/2018/11/26/missing-dna-found-from-african-root/02_m.png

研究が進められるヒトのレファレンス配列ですが、今回のように研究対象が広がるほど次々と新たな疑問が明るみになり、今後もさらに詳細かつ広範囲な研究が行われる必要があるといえそう。この分野は、ゲノム情報にもとづいた新しいタイプの医薬品の開発などにも活用される可能性があり、今後さらに発展することが見込まれています。

GIGAZINE
https://gigazine.net/news/20181126-missing-dna-found-from-african-root/