Bioinformatics Course Board
   
  [Bioinformatics and Computational Genomics] 마지막 강의에서 한 가지 빠뜨린 것
  Writer : Seyeon Weon     Date : 10-02     Hit : 11489    
  트랙백 주소 : http://www.bioinformatics.pe.kr/gnuboard/bbs/tb.php/course/123
서울 강의에서 한 가지 빠뜨린 것이 있군요.  빠뜨렸다기 보다는 충분히 강조가
되지 못했다는 것이 정확한 표현이겠군요.  즉, 아래 내용은 강의 시간에 거의 다
설명을 했던 내용이지만, "처음부터 causal mutation을 찾으려고 하는 것은
아니다"라는 면이 강조가 되는 설명이 빠졌었군요.

SNP 중에서 일부는 물론 causal mutation(즉, 어떤 질병의 직접적인 원인이 되는
바로 그 돌연변이)일 수도 있을 것입니다.  그런데, 이것이 확률이 너무나 낮은
접근방법이란 것이죠.  물론 false association이야 항상 잡히지만...

일단, linkage study의 경우에 대해서도 조금...  linkage를 강하게 보이는
physical marker 근처에 있는 gene을 몇 개 찍어낸 다음에, 그들을 환자와
정상인를 비교해 가면서 좍 sequencing을 해보면 mutation이 자명하게 드러나게
되죠.  이때 mutation은 엄청 다양할 수가 있습니다.  cystic fibrosis의
경우에는 지금까지 밝혀진 것이 200 가지가 넘는가 그럴 겁니다.  (음, 정확한
숫자는 찾아보면 되는데...  하여간...  아참, 이런 식의 gene이 존재하는 이유는
뭘까요?  답은 heterozygote advantage 때문입니다.  무슨 소린지 모르는
사람들은 각자 공부를...  http://www.bioinformatics.pe.kr/course/GENOME/
있는 부교재들 중에서 3번과 4번, 특히 4번이 이런 쪽으로 가장 좋은 책입니다.
다들 읽어보게 되기를 바랍니다.)  linkage study의 경우에는, 처음부터 causal
mutation을 찾는 것이 아니라는 점이야 말할 필요도 없이 당연한 것이지만, 그냥
설명의 완전함을 위해서 적었습니다.

그리고 allelic association study, 즉 linkage disequilibrium mapping의
경우에는 어떻게 되는 것일까요?  이때도 역시 마찬가지입니다.  어떤 SNP이 그
질병을 일으키는 원인 mutation일 확률이 물론 없는 것은 아니지만, 이걸 바라고
조사를 해서는 너무 심하게 소발에 쥐잡기의 요행을 바라는 꼴이죠.  반대로,
강의 시간에 이야기 했던 여러 조건들(즉, additive한 영향을 주는 것이고,
common allele에 의한 것이고 등)을 만족시키는 형태의 질병이라면, 특정
haplotype block의 어느 한 type과 association이 반드시 있어야 한다는 것이
이해가 되죠?  즉, 당연히 찾아질 것을 찾는 식이 되는 것이죠.  물론 위에 적은
조건들을 만족하는 경우에 한해서는...  즉, 훨씬 확률이 높은 일이 되는 것이죠.

음, 대략 이해가 되는지요?  단순히 질병의 원인이 되는 mutation을 찾아내는
일로 naive하게 생각을 하게 되기 쉽지만, 위에 적은 것처럼 역시 또 좀 복잡한
수학적/통계학적인 현상인 것이죠.

아참, 한 가지 더 추가...  만약에 앞으로 personal genome project가 일반적이
되는 시절이 오면 이 점은 어떻게 바뀌게 될까요?  그때는 분명히 아예 causal
mutation을 직접 찾는 식의 일도 가능하게 될 것입니다.  상당히 다른
수학/통계학이 필요하겠군요.  그리고 이때 더욱 더 심각해지는 것은 multiple
test problem을 어떻게 극복을 하는가 하는 것입니다.  음, 전국민이 다 genome
sequence를 각자 DVD(아니, blue laser disk 또는 그 이후의 것)에 담아 가지고
다니는 때가 오면, 대략 극복이 되겠군요. ^^;