실험실에서 mutagenesis로 만든 mutant의 원인 유전자를 찾는 경우와, 자연적으로 존재하는 wild strain간의 표현형 차이를 조사하는 경우로 나누어서 볼 수 있습니다.
[Mutant의 원인 유전자를 찾는 경우]
1. Linkage Mapping (Genetic Mapping)
유전학에서 사용되는 전통적인 방법으로, 찾고자 하는 돌연변이를 특정 표현형을 갖고 있고, 그 genetic position을 알고 있는 다른 strain과 교배 후 F2 돌연변이들이 표현형을 어느 정도 비율로 가졌는지를 통해 돌연변이의 상대적 위치를 파악하는 방법입니다. N2와 Hawaiian(CB4856)strain의 genome이 잘 알려져 있고 특정 위치에 strain 특이적으로 제한효소로 자르는 SNP marker(RFLP: Restriction Fragment Length Polymorphism)들이 잘 알려져 있기 때문에 이를 통한 genetic mapping이 손쉽게 사용 가능합니다. 전통적 mapping에서 유전자의 최종적인 정체를 파악할 때 때론 좁은 구간에 수많은 유전자들이 존재해 어려움이 있을 수 있습니다. 이 때 whole-genome sequencing을 동시에 사용하여 후보군을 좁히는 방법이 매우 유용할 수 있습니다.
2. Mapping-by-Sequencing
NGS 기술의 발달로 이를 잘 활용하여 효율적인 유전자 발굴이 가능합니다. 대표적으로 background 품종(N2)과 genome 전반에 걸쳐 polymorphism이 있는 다른 품종(예를 들어, CB4856 strain)을 활용하는 방법이 있습니다. Mutant와 CB4856을 교배하여 그 자손 중 F2 돌연변이들을 고르고 이를 pool로 WGS 합니다. N2-CB4856의 allele frequency를 확인하고 CB4856의 allele frequency가 낮은 부위를 찾습니다. 즉, 돌연변이들을 골라서 sequencing 했기에 CB4856 genome으로 치환되지 않은 곳을 확인함으로써 원하는 유전자를 확인할 수 있습니다. 최근 들어 NGS 기술의 발달로 mutant를 backcrossing 한 후에 이들 sibling들을 바로 sequencing 하는 방법도 많이 사용됩니다.
[Wild Strain간의 Natural Variation의 경우]
1. Linkage Mapping
표현형에 차이가 있는 2개의 wild strain들을 교배시켜 유전체가 랜덤하게 섞여 있는 많은 자손들(Recombinant Inbred Lines, RILs)을 만든 후, 그 자손들의 표현형을 통해 표현형과 연관된 부위인 Quantitative Trait Locus(QTL)을 통계적으로 확인합니다. 2개가 아닌 더 많은 부모 strain을 교배로 섞어 확보해둔 Multiparent Panel(MPP)을 활용할 수도 있습니다 (lukemn.github.io/cemee/).
2. Genome-Wide Association (GWA) mapping
많은 자연 품종들의 표현형과 유전정보 데이터를 활용하여 통계적으로 표현형과 연관된 Single Nucleotide Variants(SNV)들을 찾는 방법입니다. 다양한 야생 품종(Wild Strains)과 그 염기서열 정보가 필요합니다. Caenorhabditis Natural Diversity Resources(CaeNDR)에서는 wild strain들과 그 유전정보, GWA mapping 플랫폼을 제공하기도 합니다. (caendr.org)
위의 방법들로 QTL을 찾았다면 QTL 주변의 일정 범위만 다른 품종의 genome으로 치환된 Near-Isogenic Lines(NILs)를 이용하여 QTL의 범위를 좁혀 나갈 수도 있습니다. 마지막으로 CRISPR을 이용하여 품종간 상호 allele을 치환시켜 보거나, hemizygosity test, complementation test 등을 통해 후보 유전자의 영향을 확인해 볼 수 있습니다.