Bioinformatics Course Series - Introduction

 


개요 및 목적
 

각 코스는 bioinformatics의 중요한 면을 하나씩 다루며, 각기 self-contained한 단위가 되면서 동시에 최대한 서로 중복되는 내용이 없도록 구성되어 있습니다. 생물정보연구소의 생물정보학 강좌들은 2000년부터 시작되었으며, 현재는 3가지 형태의 코스들로 구분이 되어 열리고 있는데, 이에 대한 설명은 왼쪽 메뉴의 FAQ에서 살펴보기 바랍니다. 그 중의 하나인 본 시리즈는, 14개의 5주 단위의 코스들이 일종의 evening class 형태로 연속해서 열립니다. 그리고 생물정보학은 하나의 homogenous한 분야가 아니며, 여러 생물 분야 연구에 수반되는 다양한 전산/통계 관련 기술과 지식들을 통칭하는 것이라는 점으로 인해서, 이처럼 생물정보학이란 이름 하에 다수의 코스 또는 모듈 형태로 나누어져 있는 것은 흔히 볼 수 있는 방식입니다. (외국의 주요 bioinformatics 코스들은, 사이트에 있는 Useful Link 모음에서 "Bioinformatics Courses" 페이지에 나열되어 있습니다.) 이 중에서 자신의 목적에 맞는 것을 선별을 해서 수강을 하면 되는데, 코스의 선택에 대한 의문점이 있을 경우에는 아래에 "등록"에 대한 안내문에 있는 email 주소로 문의를 하면 됩니다. 각 코스에 대한 설명은 이 글의 아래 부분에 있으며 시리즈 전체에 대한 설명은 다음과 같습니다.

Bioinformatics Course Series의 주된 목적은 최대한 접근이 용이하도록 bioinformatics의 여러 지식들을 전달하고자 하는 것이며, 특히 생물정보학적 도구가 생물 분야 연구에 쓰일 때에 어떤 식으로 사용이 되는가 하는 면에 중심을 두고 전달하게 됩니다. 본 시리즈의 코스들에서 다루는 것들의 일반적인 면을 적어보면 다음과 같습니다. 우선, 다루고자 하는 데이터가 생산이 되는 실험 method에 대한 introduction이 있게 됩니다. 물론 본 시리즈의 특성상 긴 시간은 할당되지 못하나, 기본적인 뼈대는 전달을 하게 됩니다. 그 다음은, 이렇게 얻어진 데이터 그 자체의 성질 및 이의 분석에 대한 이론적인 면입니다. 그리고 실제 데이터 분석에 대한 것인데, 우선 web browser를 사용하는 수준의 것들도 그 나름의 역할이 있으므로 전달이 됩니다. 마지막이 대량의 데이터를 처리하는 데에 필요한 수준, 예를 들어 Unix상에서 perl script를 이용하는 본격적인 수준의 것이 전달이 됩니다. (물론 Bioinformatics Programming 코스를 비롯한 몇 가지 코스들은 다루는 내용의 성격상 지금 하고 있는 설명에는 해당되지 않습니다.)

그리고 이와 같은 데이터 분석을 원활하게 해내기 위해서 필요한 기초 지식은 크게 3가지로 나누어 볼 수가 있습니다. 첫째는 Unix, perl, DBMS와 같은 "컴퓨터 도구들의 사용법"입니다. 이들은 본 시리즈의 Bioinformatics ProgrammingPractical Bioinformatics Tools 코스에서 다루어집니다. 그 다음은 많은 수의 데이터를 분석할 때에 예외없이 수반되는 "통계학"입니다. 본 시리즈의 Statistics for Bioinformatics 코스에서는 아예 통계학만을 따로 떼서 다루며, Bioinformatics for Omics and Systems BiologyDNA Microarray Bioinformatics 코스에서도 코스의 주제와 관련된 부분을 압축하여 전달을 합니다. 마지막이 "전산학"인데, 본 시리즈에서는 Computer Science for Bioinformatics 코스와 Bioinformatics Core Algorithms 코스에서 다루어집니다. bioinformatics tool 개발자가 아닌 사용자 입장에서의 중요도를 따지면, 앞의 두 가지가 훨씬 더 중요한 것이니 우선적으로 공부를 하게 되기를 바랍니다. 이 두 가지, 즉 "컴퓨터 도구들의 사용법"과 "통계학"이 어느 정도 갖추어진 경우라면, 남은 것은 하고자 하는 분야 그 자체에 대한 공부입니다. 여기에서 반드시 인식하고 있어야 할 중요한 점 하나는, 이것이 거꾸로는 되지 않는다는 점입니다. 즉, "컴퓨터 도구들의 사용법"과 "통계학"이 갖추어지지 않은 상태에서는 아무리 해당 분야에 대해서 많이 공부를 해봐야 막상 실제로 자신의 손으로 해낼 수 있는 (굳이 적자면, 생물 분야 journal paper에 내용의 일부로써 포함될 수 있는 수준의) 일은 거의 없게 됩니다. 물론 앞의 두 가지를 갖춘 것만으로 "bioinformatics work을 해낼 수 있는 사람"이 저절로 되는 것은 아니지만, 필요조건이 되는 것입니다. 지금 읽은 점을 잘 인식하고 향후 노력을 해 나가는 것은 매우 중요합니다. 이것이 아마도 국내에서 "생물정보학적인 도구를 제대로 활용하는 연구"가 극히 드물게 된 원인을 추적하면 도달하게 되는 곳 중의 하나라 생각이 됩니다. 이 두 가지, 즉 "컴퓨터 도구들의 사용법"과 "통계학" 모두 결코 어렵지 않는 것이니 반드시 시도를 해보게 되기를 바랍니다.

본 시리즈의 코스들은 컴퓨터 실습실에서 실습을 하는 형태가 아니며, 빔 프로젝터와 칠판을 이용하는 일반적인 강의 형태입니다. 컴퓨터로 직접 bioinformatics work을 수행해보는 일은, 각 코스의 홈 페이지에 올려져 있는 exercise를 통해서 각자 소속된 곳의 환경에서 수행하는 것을 유도하게 됩니다. 몇 가지 코스에는 주교재로 지정된 textbook이 있어서 그 내용을 따라서 하게 되나, 대다수의 코스들은 textbook들은 부교재로만 지정이 되고, 강의에 필요한 자료들은 웹으로 전달이 됩니다. email을 통해서도 강의의 또 다른 부분이 진행이 되며, 코스가 끝난 다음에도 email을 통하는 부분은 원하는 사람에 한해서 계속 유지가 됩니다.

이상이 시리즈의 전체적인 면이며, 아래에 다른 행정적인 정보가 더 열거되어 있고, 각 코스에 대한 구체적인 설명은 아래에 있는 요약된 설명 및 각 코스의 홈 페이지에서 살펴보기 바랍니다.


생물 분야 연구자 및 학생인 경우
  우선, 생물 분야 연구자 및 학생을 대상으로 생물정보학 공부를 어떻게 시작하면 되는지에 대해서 조금 informal 하게 풀어서 적어놓은 글이 이곳에 있으니, 읽어보기 바랍니다. 본 시리즈의 코스들을 수강하고 내용을 이해하는 그 자체를 위해서는, 아래에 나와 있는 것처럼 거의 아무런 prerequisite도 요구되지 않습니다. 그러나 이것이 곧 생물정보학적인 도구들을 생물 분야 연구에 실제로 활용을 하는 것에 있어서도 그렇다는 것을 뜻하지는 않음을 이해해야 합니다. 우선, 본 사이트의 Beginning Bioinformatics for Biologists 페이지에 생물 분야 전공자로서 생물정보학적인 도구들을 실제로 사용할 수 있도록 출발하는데 도움이 되고자 하는 목적의 일종의 온라인 책이 현재 작성이 되고 있으니 살펴보기 바랍니다. 생물정보학적인 도구들을 자신의 연구에 제대로 활용을 하기 위해서는, 이론적인 면에 대한 이해만으로는 물론 충분하지가 않으며, 심지어는 해당 분야 도구들의 사용법을 보고 배우는 것만으로도 충분치가 않습니다. 결국 이 모든 것이 다 컴퓨터를 사용해서 해내야 하는 일인데, 이때의 컴퓨터 사용법은, 거의 전부라 할 수 있는 경우에 웹 브라우저 상에서 마우스 클릭 순서를 잘 따라서 하고 워드 프로세서와 엑셀을 조금 쓸 줄 알면 되는 정도의 것들이 아닙니다. 적어도 초급 수준의 프로그래밍이 가미된 지금까지 대다수의 생물 분야 전공자들이 접해왔던 컴퓨터 사용 방식과는 전혀 다른 수준의 것들이 필요하게 됩니다. 현재 국내에서 생물정보학적인 도구들을 사용하는 방식의 연구가 생물 분야 연구자들 사이에서 이토록 자리를 잡지 못하고 있는 가장 큰 이유가 바로 여기에 있을 것이라 생각이 됩니다. Beginning Bioinformatics for Biologists에 있는 내용들은 어떤 분야의 연구를 하든 무관하게 모두에게 거의 공통적으로 필요한 것이며, 게다가 시작하기 전에 미리 가지고 있어야만 하는 기술입니다. 또한, 현재 전혀 다른 대안이 없으며 앞으로도 생겨나지 않을 것입니다. 물론 한 50년쯤 뒤에 지금 우리가 상상을 할 수도 없는 수준의 컴퓨터 하드웨어 및 전산학 그 자체의 발전이 이루어진다면 달라질 수도 있겠지만, 적어도 지금 이 글을 읽고 있는 사람들이 연구 활동을 하고 있는 동안에는 일어나기 힘든 일일 것입니다. 결론은, 생물정보학적인 도구가 쓰이는 방식의 생물 분야 연구를 시작하기에 앞서서 반드시 이 부분부터 해소를 해야 하며, 이는 결국 스스로의 노력을 통해서만 가능한 일일 것입니다.

학부생인 경우
  학부생들의 수강도 적극 권합니다. 특히 생물 분야 학부생들을 위해서 따로 적어놓은 글이 이곳에 있으니 읽어보기 바랍니다.

Prerequisites
 

별도의 정해진 prerequisite은 없습니다. 생물학에 대해서는 기초적인 분자생물학 지식을 갖추고 있으면 강의를 이해하는 데에 도움이 될 것입니다. 수학과 통계학에 대해서는 고등학교 수학을 넘어서는 것은 갖추고 있지 않다고 가정을 하고 최대한 알기 쉽게 설명을 진행합니다. 전산학 및 컴퓨터 프로그래밍에 대해서도 아무런 사전 요구 사항이 없습니다.


Exercises
  본 사이트의 "Bioinformatics Exercises" 페이지에는 생물정보학의 여러 분야에 걸쳐서, 이론적인 면에 대한 이해를 묻는 것들, bioinformatics 도구들의 사용에 대한 것들, 그리고 biological research에서 실제로 사용되는 형태의 bioinformatics work을 수행해볼 수 있도록 유도를 하는 것 등이 문제 은행 형태로 계속 만들어져서 올려지게 됩니다. 이들 중에서 각 코스의 주제에 해당하는 것들이 선별이 되어서 각 코스의 exercise로서 제시가 됩니다. 코스에서 얻을 수 있는 것의 적어도 절반은 이들을 해냄으로써 얻어질 수 있는 것이므로, 반드시 시도를 해보게 되기를 바랍니다.

수료증
  원하는 경우에는 위의 exercise를 제출하여 평가를 받을 수 있으며, Bioinformatics Course Series의 5개 이상의 코스의 exercise들에 대해서 각기 60점 이상인 경우에 수료증명서 발급의 대상이 됩니다. 수료증명서에는 코스명을 비롯한 수료의 근거가 되는 사항들이 나열이 되며, 날인된 공문서 형태로 수료자가 원하는 경우에 지속적으로 발급이 됩니다. 수료에는 상당히 엄격한 기준이 적용됩니다. 즉 코스의 내용을 제대로 이해하고 있으며 해당분야 bioinformatics work을 해낼 수 있다는 것이 확실할 때에만 기준을 통과할 수 있습니다. 시리즈 전체에 대해서만 수료증명서가 발급되며, 개별 코스에 대한 수료증명서는 발급되지 않습니다.

등록
  등록에 대한 자세한 안내는 각 코스의 홈 페이지에 있으며, 수강을 하고자 하는 코스는 "c o u r s e   at   b i o i n f o r m a t i c s . p e . k r"로 요청을 하면 됩니다. Bioinformatics Course Series에 대한 다른 질문 역시 같은 email 주소로 하면 됩니다. (스페이스는 삭제를 하며 at은 @을 뜻합니다.)

Course History
  생물정보연구소의 생물정보학 교육은 2000년 9월에 시작되었으며, 2003년 8월까지 Bioinformatics Training Course(BTC)라는 이름으로 1년에 걸친 코스가 3회 열렸습니다. 2004년부터는 본 시리즈가 5주짜리 주제별로 나누어진 코스들로 구성되어 계속 열리고 있으며, 2007년 1월부터 하루 짜리 모듈들로 구성된 Bioinformatics Crash Course가 새롭게 추가가 되었습니다.

각 코스에 대한 설명
  Bioinformatics and Computational Genomics 코스는 bioinformatics 전반에 대한 overview 코스입니다. 이 코스의 각 주제들은 아래의 해당되는 코스들에서 더 자세히 다루어지게 되나, 주제별로 30분에서 1시간 정도 씩을 할당을 해서 적어도 전체적인 윤곽은 잡을 수 있도록 설명을 하게 됩니다. 또한 이 코스에서는 앞으로의 공부를 위한 방향 설정 및 기초적으로 필요한 것들에 대한 안내가 있게 됩니다. 이 코스를 통해서 좀더 체계적인 출발이 가능하게 되기를 바라며, 자신이 기존에 하고 있는 연구 속에 생물정보학적인 도구들을 적절하게 융화시킬 수 있는 view를 가질 수 있게 되기를 바랍니다."

Bioinformatics for Omics and Systems Biology 코스는 DNA chip, proteomics, metabolomics를 묶어서 강의를 하는 것인데, 이들은 gene expression에 대해 global한, 즉 omics적인 profile을 얻어낸다는 공통점이 있습니다. 먼저 이 세 가지 기술의 독자적인 부분에 대해서 각기 소개를 합니다. 이 방법들로부터 얻어진 데이터로부터 유용한 지식을 얻어내기 위한 부분은 근본적으로 거의 대동소이한 것이 되는데, 이러한 공통적인 framework에 대해서 설명을 합니다. 이와 같은 omics적인 연구는 생물 분야 주요 journal들에 실린 paper들에서 점점 더 흔히 볼 수 있는 것이 되어가고 있으나, 이를 위한 기초 지식에 대한 교육은 기존의 생물 분야 교육에서는 상당히 결핍이 된 것이 현실입니다. 이 코스에서는 이 기초 지식을 기본 개념부터 출발하여 체계적으로 설명을 합니다. 또한, 이른바 systems biology라는 용어하에 현재 새롭게 시도되고 있는 "computational modeling of cell/organism"에 대해서도 전체적인 윤곽이 파악될 수 있도록 설명을 하게 됩니다.

DNA Microarray Bioinformatics 코스는, DNA chip의 데이터 분석에 대한 실질적인 것들을 전달하는 코스입니다. Bioinformatics for Omics and Systems Biology 코스가 "일반론"이라면, 이 코스는 실제로 사용되는 구체적인 소프트웨어들에 대한 지식 전달을 위주로 하는 코스입니다. 현재 가장 평이 좋은 DNA chip 데이터 분석 공부용 textbook인 "Data Analysis Tools for DNA Microarrays, Sorin Draghici, 2003, Chapman & Hall/CRC"를 주교재로 하는데, 400 페이지가 넘는 책이지만 상당히 압축을 해서 전달을 합니다. 이 책의 내용 정도는 알고 있어야만 제대로 앞뒤를 알고서 DNA 칩 데이터 분석을 해낼 수가 있게 되는 것이니, 이 코스를 계기로 삼아서 이 책에 담긴 내용 정도는 반드시 공부를 해낼 수 있게 되기를 바랍니다. 또한, R 및 Bioconductor 등의 소프트웨어들을 이용하여 실제 chip 데이터를 가지고서 분석을 수행하는 실질적인 방법에 대해서 전달을 하게 됩니다.

Bioinformatics for Sequence Analysis 코스의 주교재는 "Bioinformatics for Dummies, Jean-Michel Claverie, Cedric Notredame, 2003, John Wiley & Sons"인데, 제목에 현혹이 되지 않기를 바랍니다. 전혀 dummy를 위한 것이 아닙니다. 아마도 현재 나와 있는 sequence analysis 교재 중에서는 실용적인 내용들이 가장 제대로 담긴 책일 것입니다. 이 책을 최대한 따라서 하게 되는데, 책에는 거의 없는 "내부 원리"에 대한 설명도 강의의 주된 부분이 됩니다. 이 코스는 한 마디로 "어떤 gene에 대한 sequence를 가지고 있을 때, bioinformatics 도구들을 사용하여 이 gene에 대해서 최대한의 지식을 얻어내는 방법"에 대한 코스입니다.

Bioinformatics for Structure Analysis 코스는 단백질 구조에 대해서 "학부 생화학 교과서에 나와 있는 것 이후의 지식들"을 전달합니다. 생물학자들을 위해서 자신이 연구하고 있는 단백질의 구조적인 면을 좀 더 제대로 들여다 볼 수 있는 도구들에 대한 지식과, 단백질의 구조적인 면 그 자체에 대해 학부 생화학 교과서에 나와 있지 않는 고급 수준의 지식을 전달하는 것이 목적입니다. DNA 구조에 대해서도 요약해서 전달하고, 요즘 점점 더 중요도가 커져가고 있는 RNA 구조에 대해서는 좀 더 비중을 두게 됩니다. 2000년도부터 3년에 걸쳐서 열렸던 BTC에서 수강생들로부터 가장 호응이 좋았던 것이 이 단백질 구조에 대한 강의들이었는데, 이는 아마도 이러한 구조적인 면 역시 국내 생물 분야의 교육에서는 상당히 약한 부분이란 점이 한 가지 요인일 것으로 추측이 됩니다.

Bioinformatics for Genome Analysis 코스는 Bioinformatics for Sequence Analysis 코스가 단일 gene level에 대한 것을 다루는 코스인 것과는 달리, genome에 대한 것들을 다룹니다. 또한, 요즘 점점 더 중요한 것이 되어가고 있는 microRNA의 생물정보학적인 면에 대해서도 자세히 살펴보게 됩니다. genome level의 sequence 분석을 위해서는, genome browser와 같은 web 기반 도구들을 브라우저 상에서 사용하는 것이 일단 모든 생물학자에게 열려 있지만, 진정한 의미의 genomic level의 분석을 위해서는 perl과 같은 프로그래밍 도구가 결국은 요구가 됩니다. 이 코스에서 일단 genome level의 분석에 대한 여러 가지 기본적인 지식들을 다루며, perl 프로그래밍에 대해서는 아래에 설명한 Bioinformatics Programming 코스에서 다루어집니다. 일반적인 대학의 강의라면 이들을 하나로 묶어서 코스를 만들어야겠지만, Bioinformatics Course Series에서는 이처럼 5주짜리 코스들로 분리를 해놓았습니다. 이들 코스에서 다루는 것들은, 이제는 제대로 up-to-date한 수준의 연구를 위해서는 필수적이라 할, genome sequence 데이터를 제대로 활용하기 위해서는 반드시 필요한 지식들입니다. 선진국의 생물 분야 학과들에서는 http://www.stanford.edu/class/gene211/ 에서 볼 수 있는 것처럼 이미 기본적인 코스로 자리를 잡아가고 있습니다. 이 코스가 국내에서 아직은 결핍된 이러한 부분을 조금이나마 메울 수 있게 되기를 바랍니다.

Bioinformatics for Genetic Analysis 코스에서는, positional cloning이 무엇인지 아는 경우에는 일단 이 코스에서는 이를 해내는 방법의 통계/전산적인 면을 최대한 쉽게 풀어서 전달을 합니다. 그리고 SNP과 HapMap 등에 대해서 이를 이용하고자 할 때에 필요한 통계/전산적인 면을 전달을 합니다. 이 코스에서 다루는 내용 역시 국내에서 유독 약한 부분인데, 이는 이 분야가 수학적인 면을 강하게 가지고 있다는 것에 기인할 것으로 추측이 됩니다. 특히 인간의 질병에 대한 연구의 한 접근 방법으로써 이 코스에서 다루는 내용이 갈수록 더 중요한 것이 되고 있으므로, 이 코스를 통해서 이를 위한 기본이 되는 지식을 갖출 수 있기 되기를 바랍니다.

Bioinformatics Programming 코스는 이 코스의 주교재의 제목처럼 "Perl Programming for Biologists"입니다. perl 프로그래밍이 왜 필요한지를 간략히 적어보면 다음과 같습니다. 아마도 웹 브라우저에서 마우스 클릭에 의존해서 여러 가지 bioinformatics 도구들을 잘 사용하고 있을 것입니다. 때로 너무 잘 사용하게 되면 마우스 클릭을 수천 번이나 수만 번, 혹은 그  이상을 해야 하는 일이 스스로 만들거나 혹은 누군가에 의해서 자신에게 떨어지는 불상사도 일어날 것입니다. 이때를 위해 존재하는 것이 바로 perl이라는 프로그래밍 언어입니다. 단도직입적으로 말해 genomic 데이터를 제대로 활용하기 위해서는 perl(또는 python)을 사용하는 것이 유일한 방법입니다. 그 외에 다른 방법은 존재하지 않습니다. 이제는 넘쳐 나고 있는 genomic 데이터를 꼭 다루어볼 생각이 있는 사람이라면, perl 프로그래밍도 반드시 공부를 해야 합니다. 그 외의 다른 대안은 아직까지 만들어진 적이 없으며, 앞으로도 오래 동안 그러할 것입니다.

Practical Bioinformatics Tools 코스는 perl programming을 제외한 나머지 "genomic 데이터를 다루기 위해 필수적인 전산 기술"에 대한 것들을 다룹니다. perl programming으로는 충분하지가 않으며 이 코스에서 다루는 내용들도 반드시 알아야 합니다. 그래야 제대로 bioinformatics work을 해볼 수 있는 충분한 컴퓨터 사용 기술을 가지는 것이 됩니다. 이 코스에서 다루는 내용은 http://jura.wi.mit.edu/bio/education/bioinfo-all/에서 코스 1의 일부와 코스 4의 내용을 중심으로, 다른 핵심적은 것들을 추가를 한 것입니다. 한편으로는 이 코스에서 다루는 기술을 가지고 있는가 하는 것이 bioinformatics work을 해낼 수 있는가 하는 데에 critical한 경계선이 되기도 하는데, 단지 조금 복잡한 방식으로 컴퓨터를 사용하는 것에 불과한 것이므로 반드시 극복을 해내게 되기를 바랍니다.

Bioinformatics for Phylogenetics and Molecular Evolution 코스는 phylogenetic tree를 어떻게 만들고, 어떻게 분석할 것인가에 대한 코스입니다. phylogenetic analysis에 대한 현재 나와 있는 가장 실용적인 textbook으로 평을 받고 있는 "The Phylogenetic Handbook: A Practical Approach to DNA and Protein Phylogeny, Marco Salemi, Anne-Mieke Vandamme (Editors), 2003, Cambridge University Press"를 주교재로 하여, "phylogenetic analysis 소프트웨어들을 내부 원리를 이해한 상태에서 사용할 수 있게 되는 데"에 목표를 둡니다. 이 코스는 Bioinformatics Course Series의 다른 코스들보다 알고리즘들에 대해서 깊게 들어갑니다. 따라서, 기존에 이미 phylogenetic tree building 소프트웨어들을 사용하고 있는 경우에도 "내부의 작동 원리에 대한 이해"와 "각 방법들이 왜 그러한 장단점을 가지는지에 대한 이해"를 원하는 경우에는 수강을 하기 바랍니다. 물론 Bioinformatics Course Series의 다른 코스들과 마찬가지로, 전산학과 통계학에 대한 사전 지식은 요구되지 않으며, 최대한 이해하기 쉽게 풀어서 설명을 하게 됩니다.

Bioinformatics in Practice 코스는 생물 분야 journal paper들을 가지고서 연구에 사용된 bioinformatics method들을 살펴보는 코스입니다. Nature, Science, Cell을 비롯한 생물 분야 주요 journal들에서 최근 paper들을 선별하여 살펴보게 되는데, bioinformatics algorithm에 대한 paper가 아니라 보통의 생물 분야 연구에 대한 paper들입니다. 20여편 정도의 paper를 살펴보게 되는데, 이 중에서 최소한 절반은 수강하는 사람들이 요청한 paper들로 충당이 됩니다. 코스를 신청할 때에 코스에서 다루어지기를 원하는 paper를 적어내게 되며, 이 중에서 일부를 선택하여 코스에서 다루어지게 됩니다. 생물학적인 면 그 자체에 대해서는 최대한 시간을 줄여서 다루어지며, paper의 method란에 (물론 Nature와 Science에는 method란이 따로 있는 것은 아니지만) 나와 있는 생물정보학적 도구 또는 방법을 해당 연구와 연관된 context에서 설명을 하는 것이 코스의 주된 내용입니다. 이 코스가 생물학자들에게 현장감이 있는 생물정보학 지식을 습득할 수 있는 기회가 될 수 있기를 바랍니다. 그리고, 이와 같은 형식의 코스에 있어서는 실로 다양한 생물 분야 중에서 어떤 분야를 주로 다룰까 하는 문제가 발생을 하는데, 일종의 다수결에 의해서 결정이 됩니다. 따라서, 다루어지기를 원하는 것이 있는 경우에는 가급적 일찍 신청을 하기를 바랍니다. 그리고 사용되는 용어들조차 생소한 분야인 경우와 같이, 분야에 따라서는 다루는 것이 불가능할 수도 있다는 점을 미리 밝혀둡니다.

Computer Science for Bioinformatics 코스는 생물학자가 생물정보학적 도구를 내부 작동원리를 이해하고 사용하기 위해 가지고 있어야 하는 전산학의 기초 지식을 압축하여 살펴보는 코스입니다. 컴퓨터 프로그래밍에 대한 사전 지식은 요구되지 않습니다. 필수적인 전산학 지식에 대해서 최대한 이해하기 쉬운 방식으로 풀어서 전달을 합니다. 그리고 전산학에 대한 전반적인 안내 등 향후 더 공부를 하고자 하는 경우를 위한 안내도 있게 됩니다.

Statistics for Bioinformatics 코스는 생물학자가 bioinformatics tool과 method들을 사용함에 있어서 기초 지식으로써 반드시 갖추어야 하는 통계학 지식에 대해서 살펴보는 코스입니다. 수식은 최대한 배제를 하고 최대한 이해하기 쉽게 풀어서 설명을 합니다. 통계 소프트웨어로는 R을 사용하며, 기본적인 통계분석을 어느 정도 해낼 수 있게 되는 것과 bioinformatics tool과 method들의 바탕이 되는 통계학적 지식을 이해하는 데에 우선적인 목표를 두며, 그밖에 현재 널리 쓰이는 좀더 고급 수준의 것들에 대해서도 용어의 뜻과 기초적인 개념 정도는 파악을 될 수 있도록 하는 안내가 있게 됩니다.

Bioinformatics Core Algorithms 코스는 조금 특별한 것인데, bioinformatics의 근간을 이루는 알고리즘 몇 가지를 아예 프로그래밍이 가능한 수준으로 정식으로 설명을 하는 코스입니다. "알고리즘을 이해하는 것이 매우 흥미롭게 느껴지는 경우", 그리고 예를 들어 "HMM이 대충 그렇다는 것은 알겠는데, 진짜로 어떻게 돌아가는지 한 번 제대로 알고 싶다"는 생각을 가지고 있는 경우에는 email로 코스의 개설을 요청하기 바랍니다. 그리고, http://www.bioinformatics.pe.kr/gnuboard/bbs/board.php?bo_table=qa&wr_id=61&page=3에 있는 "Educating biologists in the 21st century"라는 제목으로 올린 글을 읽어보기 바랍니다. 이 코스가 Pavel Pevzner의 불만에 대한 대응이라 할 수가 있습니다.

 

Bioinformatics Information      Up

 

 

 

Last update: 10/17/2006