Beginning Bioinformatics for Biologists
  BioPerlÀ̶õ
  Writer : Seyeon Weon   Updated : 10-26   Hit : 5657   Updates 

BioPerlÀ̶õ À̰÷¿¡ ÀÖ´Â library¸¦ ¸»ÇÕ´Ï´Ù. BioPerlÀÌ ¾î¶² ¿ªÇÒÀ» ÇÏ´Â °ÍÀÎÁö ½ÇÁ¦ ¿¹¸¦ µé¾î¼­ ÇÑ ¹ø ¼³¸íÀ» ÇØº¾´Ï´Ù.

 

¿©·¯ºÐÀÌ ÇϰíÀÚ ÇÏ´Â »ý¹°Á¤º¸ÇÐÀûÀÎ ÀÏÀº ´ç¿¬È÷ ¾î¶² ¿¬±¸¿¡ ¼ö¹ÝµÇ´Â ¿©·¯ °¡Áö °úÁ¤ÀÇ ÀϺκÐÀÏ °ÍÀÔ´Ï´Ù. ¶ÇÇÑ, ±× ¿¬±¸¿¡¼­ ÇÊ¿ä·Î Çϴ »ý¹°Á¤º¸ÇÐÀûÀÎ ÀÏµé ±× ÀÚüµµ, ´Ù½Ã ÀÌ·±Àú·± ´Ù¾çÇÑ ÀÛ¾÷µé·Î ±¸¼ºµÇ¾î ÀÖÀ» °ÍÀÔ´Ï´Ù. ±× Áß¿¡¼­ Çϳª·Î, ¿¹¸¦ µé¾î GenBank¿¡¼­ mammalÀÇ hemoglobinÀÇ subunitµé(¶Ç´Â ÀÚ½ÅÀÇ ¿¬±¸¿¡ ÇÊ¿äÇÑ ´Ù¸¥ gene)¿¡ ´ëÇÑ mRNA sequenceµéÀ» ±¸ÇØ¾ß ÇÏ´Â ÀÏÀÌ ÀÖ´Ù°í ÇսôÙ. À̰ÍÀº http://www.ncbi.nlm.nih.gov¿¡ °¡¸é ³ª¿À´Â Search ±â´É¿¡¼­, database´Â Nucleotide·Î ¼±ÅÃÀ» Çϰí, for¶ó°í µÇ¾î ÀÖ´Â ºÎºÐ ´ÙÀ½¿¡ ³ª¿À´Â ÀÔ·Â ¹Ú½º¿¡ ¾Æ·¡¸¦ copy-and-paste ÇØÁÖ¸é µË´Ï´Ù. (ÀÌó·³ web browser¸¦ ¸¶¿ì½º Ŭ¸¯À¸·Î »ç¿ëÇÏ´Â ¹æ½Äµµ °æ¿ì¿¡ µû¶ó¼­´Â ´õ Æí¸®Çϰí ÀÚ¿¬½º·¯¿î ¹æ½ÄÀÌ µÇ´Â °æ¿ìµµ ¸¹½À´Ï´Ù. ÀÌ ¹æ½Ä ±× ÀÚü°¡ ¹®Á¦°¡ ÀÖ´Ù´Â °ÍÀÌ ¾Æ´Ï¶ó, À̰͸¸À¸·Î´Â ÀüÇô ÃæºÐÄ¡°¡ ¾Ê´Ù´Â Á¡ÀÌ ¹®Á¦ÀÔ´Ï´Ù.)

 

Mammalia[Organism] AND hemoglobin[Title] AND ((((1900[MDAT] : 3000[MDAT] NOT gbdiv_sts[PROP]) NOT srcdb_tpa_ddbj/embl/genbank[PROP]) NOT gbdiv_htg[PROP]) NOT gbdiv_pat[PROP]) AND biomol_mrna[PROP] AND gene_in_genomic[PROP] AND srcdb_refseq[PROP]

 

¿©·¯ºÐÀÌ ÇϰíÀÚ ÇÏ´Â »ý¹°Á¤º¸ÇÐÀûÀÎ ÀÏÀº ´ç¿¬È÷ ¾î¶² ¿¬±¸¿¡ ¼ö¹ÝµÇ´Â ¿©·¯ °¡Áö °úÁ¤ÀÇ ÀϺκÐÀÏ °ÍÀÔ´Ï´Ù. ¶ÇÇÑ, ±× ¿¬±¸¿¡¼­ ÇÊ¿ä·Î Çϴ »ý¹°Á¤º¸ÇÐÀûÀÎ ÀÏµé ±× ÀÚüµµ, ´Ù½Ã ÀÌ·±Àú·± ´Ù¾çÇÑ ÀÛ¾÷µé·Î ±¸¼ºµÇ¾î ÀÖÀ» °ÍÀÔ´Ï´Ù. ±× Áß¿¡¼­ Çϳª·Î, ¿¹¸¦ µé¾î GenBank¿¡¼­À§ÀÇ Äõ¸®¹®À» ¾î¶»°Ô ÀÛ¼ºÀ» Çߴ°¡ ÇÏ´Â °ÍÀº ´Ù¸¥ ±Û¿¡¼­ ÀÚ¼¼È÷ Àû°Ú½À´Ï´Ù. (ÀÛ¼ºÀÌ µÈ ´ÙÀ½¿¡´Â À̰÷¿¡ ¸µÅ©°¡ µÉ °ÍÀÔ´Ï´Ù.) ¹°·Ð À§ÀÇ ¿É¼ÇÀ̳ª Ű¿öµå µîÀ» ´Ù ¿Ü¿ö¾ß ÇÏ´Â °ÍÀÌ ¾Æ´Ï°í, ¸¶¿ì½º Ŭ¸¯À¸·Î ¼±ÅÃÀ» ÇØÁÖ¸é ¸¸µé¾îÁöµµ·Ï µÇ¾î ÀÖ½À´Ï´Ù. Áö±Ý ÀÚ¼¼ÇÑ ¼¼ºÎ¿¡ ´ëÇÑ ¼³¸íÀº »ý·«À» Çϰí, ÀÌ·¸°Ô Çϸé mammal¿¡¼­ hemoglobinÀÇ chainµé¿¡ ´ëÇØ ÇöÀç ¹àÇôÁø mRNA sequenceµé (ÀÌ ±ÛÀ» ¾²°í ÀÖ´Â ÇöÀç·Î¼­´Â) 69°³°¡ ÀâÈ÷°Ô µË´Ï´Ù. ÀÌÁ¦ ¹«¾ùÀ» ÇØ¾ß ÇÒ±î¿ä? ¹°·Ð sequence¸¦ Çϳª¾¿ Ŭ¸¯À» ÇØ¼­ ÀÏÀÏÀÌ ÆÄÀÏ·Î ÀúÀåÀ» Çϰí, ±× °¢°¢À» ÀÏÀÏÀÌ ´«À¸·Î µé¿©´Ùº¸°í ÇÏ´Â ¹æ½Äµµ °¡´ÉÇÒ °ÍÀÔ´Ï´Ù. ÀÌ ±Û¿¡¼­´Â ´ç¿¬È÷ À̿ʹ ´Ù¸¥ ¹æ½Ä¿¡ ´ëÇØ¼­ ¼³¸íÀ» ÇÕ´Ï´Ù.

 

¿ì¼±, À§ÀÇ °Ë»ö °á°ú È­¸é¿¡¼­ 'Show'¶ó°í µÇ¾î ÀÖ´Â ºÎºÐÀ» 500À¸·Î ¼±ÅÃÀ» ÇØÁÝ´Ï´Ù. ±×·± ´ÙÀ½ °¢ recordÀÇ ¼³¸íÀ» ÈȾ´Ï´Ù. ºÐ¸íÈ÷ ÀÚ½ÅÀÌ ¿øÇÏÁö ¾Ê´Â °Íµéµµ ¼Ò¼ö Æ÷ÇÔÀÌ µÇ¾î ÀÖÀ» °ÍÀÔ´Ï´Ù. ÈȾ¸é¼­ ¿øÇÏ´Â °ÍÀº record ¹øÈ£ ¾Õ¿¡ ÀÖ´Â ³×¸ð¸¦ Ŭ¸¯Çؼ­ ÁÖ¿í ¼±ÅÃÀ» ÇÕ´Ï´Ù. (»ç½Ç "Àüü ¼±ÅÃ" ±â´ÉÀÌ À־ ÀÏ´Ü Àüü¸¦ ¼±ÅÃÀ» Çϰí, ¿øÇÏÁö ¾Ê´Â °Í¸¸ unselect¸¦ Çϴ ¹æ½Äµµ ÇÊ¿äÇÒ ÅÍÀε¥, ÀÌ Á¡Àº Á¶±Ý ºÒ¸¸À̱º¿ä.) ±×¸®°í´Â, 'Display"¶ó°í µÇ¾î ÀÖ´Â ºÎºÐÀ» 'GenBank"·Î ¼±ÅÃÀ» ÇØÁÝ´Ï´Ù. ÀÌ·¸°Ô ÇÏ¸é ¾öû³ª°Ô Å« ÆÄÀÏÀÌ À¥ ºê¶ó¿ìÀú »óÀ¸·Î Àü¼ÛÀÌ µÇ±â ½ÃÀÛÇϴµ¥, ÄÄÇ»ÅÍÀÇ ¸Þ¸ð¸®°¡ ÀûÀº °æ¿ì¿¡´Â ÄÄÇ»ÅÍÀÇ ¹ÝÀÀ ¼Óµµ°¡ ½ÉÇÏ°Ô ´À·ÁÁö´Â ¹®Á¦ °°Àº °Í±îÁö »ý°Ü³ª°Ô µÉ °ÍÀÔ´Ï´Ù. ´Ù Àü¼ÛµÇ±â¸¦ ±â´Ù¸®Áö ¸»°í, °ðÀå 'Sent to"¶ó°í µÇ¾î ÀÖ´Â ºÎºÐÀ» File·Î ¼±ÅÃÀ» ÇØÁÝ´Ï´Ù. (ÀÌ·¸°Ô ¾î»öÇÏ°Ô ÇÏÁö ¾Ê¾Æµµ µÇµµ·Ï Interface¸¦ ¸¸µé¾î ³õÀ» ¼öµµ ÀÖÀ» ÅÍÀε¥, ÀÌÁ¡ ¿ª½Ã Á¶±Ý ºÒ¸¸À̱º¿ä.) ±×¸®°í´Â ÆÄÀϸíÀ» ÀÔ·ÂÇØ¼­ ÀÚ½ÅÀÇ ÇÏµå µð½ºÅ©¿¡ ÀúÀåÀ» ÇÏ¸é µåµð¾î mammalµéÀÇ hemoglobinÀÇ subunit(¶Ç´Â ¿¬±¸¿¡ ÇÊ¿äÇÑ ´Ù¸¥ gene)µé¿¡ ´ëÇÑ mRNA sequenceµéÀÌ ±¸ÇØÁø °ÍÀÔ´Ï´Ù. (¹°·Ð ´ëºÎºÐÀÇ °æ¿ì¿¡´Â ÀÌ´ë·Î°¡ ÀÚ½ÅÀÌ ¿øÇÏ´Â °ÍÀº ¾Æ´Ò °ÍÀÔ´Ï´Ù. ¿¹¸¦ µé¾î splicing variant´Â Á¦°Å¸¦ ÇÏ´Â µî°ú °°Àº ¿©·¯ °¡Áö °í·ÁµéÀÌ ´õ ÇÊ¿äÇÒ °ÍÀÔ´Ï´Ù.)

 

'Display' ¼±Åà ¹Ú½º¸¦ º¸¸é, GenBankÀÇ sequence µ¥ÀÌÅ͸¦ »ó´çÈ÷ ´Ù¾çÇÑ formatÀ¸·Î °¡Á®¿Ã ¼ö ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖÀ» °ÍÀÔ´Ï´Ù. ÀÌ Áß¿¡¼­ XMLÀ̶ó°í µÇ¾î ÀÖ´Â °ÍÀÌ »ç½ÇÀº °¡Àå Çö´ëÀûÀÎ °ÍÀ̰í Àü»êÀûÀ¸·Îµµ °¡Àå Ÿ´çÇÑ formatÀ©ÀüÈ÷ GenBank formatµµ ¸¹ÀÌ ¾²ÀÔ´Ï´Ù. GenBank formatÀº ¼ÒÀ§ flat file formatÀ̶õ °ÍÀ¸·Î, ¸¶Ä¡ ³ëÆ® Á¤¸®¸¦ Ç׸ñ ±¸ºÐÀ» ±ò²ûÇÏ°Ô ÇØ¼­ Àû¾î³õ´Â °Í°ú À¯»çÇÑ ¹æ½ÄÀ¸·Î ±â·ÏÀ» ÇØ³õÀº °ÍÀÔ´Ï´Ù. ¿©±â¿¡ ´ëÇÑ ÀÚ¼¼ÇÑ ¼³¸íÀº ¿ª½Ã ´Ù¸¥ °÷¿¡ Àû¾î³õµµ·Ï ÇϰڽÀ´Ï´Ù. ÀÌ·¸°Ô ÇÏ¸é ¿©·¯ °³ÀÇ GenBank ÆÄÀϵéÀÌ ¿¬°áÀÌ µÇ¾î¼­ ÇϳªÀÇ »ó´çÈ÷ Å« ÆÄÀÏÀÌ ¾ò¾îÁö°Ô µË´Ï´Ù. °Ë»ö °á°ú¿¡¼­ »óÀ§ 6°³ÀÇ record¸¸ ¼±ÅÃÀ» ÇØ¼­ À̰÷¿¡ ÀúÀåÀ» ÇØ³õ¾Ò½À´Ï´Ù.

 

ÀÚ, ÀÌÁ¦ ¹®Á¦´Â ÀÌ ÆÄÀÏÀ» °¡Áö°í ¹«¾ùÀ» ¾î¶»°Ô ÇÒ °ÍÀΰ¡ ÇÏ´Â Á¡ÀÏ ÅÍÀä. ÀÏ´Ü "¹«¾ùÀ»"¿¡ ÇØ´çÇÏ´Â °ÍÀº, Àß ÀÛµ¿ÇÏ´Â °ÍÀ¸·Î ÀÌ¹Ì Áõ¸íÀÌ µÇ¾î ÀÖ´Â PCR primer¸¦ °í¸¥´Ù°Å³ª (STS¶ó°í µÇ¾î ÀÖ´Â ºÎºÐÀÌ ¹Ù·Î ÀÌ ¸ñÀûÀ¸·Î »ç¿ëÇÒ ¼ö ÀÖ´Â Á¤º¸ÀÔ´Ï´Ù.) 3' UTR sequenceµé¸¸ Áà »Ì¾Æ³»°í ½Í´Ù°Å³ª ÇÏ´Â ÀÏÀÌ °¡´ÉÇÒ °ÍÀÔ´Ï´Ù. ÀÌ ±Û¿¡¼­´Â ÀüÀÚ¸¦ ¾î¶»°Ô ÇÏ´ÂÁö¿¡ ´ëÇØ¼­ ¼³¸íÀ» ÇØº¾´Ï´ÙÀÌ ÀÏÀ» À§Çؼ­´«À¸·Î ÀÏÀÏÀÌ µé¿©´Ùº¸¸é¼­ ¼ÕÀ¸·Î ¿øÇÏ´Â Á¤º¸¸¦ ¼±ÅÃÀ» ÇØ¼­ ¶Ç ´Ù¸¥ ÆÄÀÏ¿¡ copy-and-paste µîÀ¸·Î ¿Å±â°í ÇÏ´Â ¹æ½Äµµ ¹°·Ð °¡´ÉÇÒ °ÍÀÔ´Ï´ÙÁö±Ý ¿ì¸®´Â ´ç¿¬È÷ ÀÌ·¸°Ô ÇÏÀÚ´Â °ÍÀÌ ¾Æ´Ñ °ÍÀ̰í¿ä.

 

¹«¾ð°¡ Á¦´ë·Î ÄÄÇ»ÅÍÀÇ ´É·ÂÀ» Ȱ¿ëÇÏ´Â °ÍÀÌ µÇ¾î¾ß ÇÒ ÅÍÀε¥, À̸¦ À§Çؼ­ °¡Àå ¿ì¼±ÀûÀ¸·Î ÇÊ¿äÇÑ °ÍÀº ¹«¾ùÀϱî¿äÄÄÇ»ÅͰ¡ ÀÌ ÆÄÀÏÀÇ ³»ºÎ¸¦ Á¦´ë·Î Ç׸ñÀ» ±¸ºÐÇØ °¡¸é¼­ (¸¶Ä¡ »ç¶÷ÀÌ Àд °Íó·³ÀÐÀ» ¼ö ÀÖ°Ô ÇØ¾ß°ÚÁÒ? ÀÌ·¸°Ô ÇÏ´Â °ÍÀ» Àü»ê ¿ë¾î·Î´Â "parsingÀ» ÇÑ´Ù"¶ó°í ÇÕ´Ï´Ù. Àúµµ ¾ÆÁÖ ¿À·¡ Àü¿¡ (½ÉÁö¾î) C·Î ÀÌ°É Â¥º» ÀûÀÌ ÀÖ¾ú´Âµ¥, Á¤¸» ¾öû³­ ³ë°¡´Ù¿¡´Ù°¡ ÇÑ ¸¶µð·Î º¸Åë ÀÏÀÌ ¾Æ´Õ´Ï´Ù. ¿Â°® ±î´Ù·Î¿î Á¡µéÀÌ ´Ù »ý±â°Ô µÇÁÒ. ¼³¸¶ ÀÌ·± °ÍÀ» Áö±Ý ÀÌ ±ÛÀ» Àаí ÀÖ´Â »ç¶÷µéÀÌ °¢ÀÚ ´Ù ¸¸µé¾î³»¾ß ÇÑ´Ù´Â ¼Ò¸®´Â °áÄÚ ¾Æ´Ï°ÚÁÒ? ±×·¸´Ù¸é ÇØ°áÃ¥Àº ¹»±î¿ä? ´©°¡ ´ëÇ¥·Î ³ª¼­¼­ ³ë°¡´Ù¸¦ ÇØ³õ°í, ±×°É ´Ùµé ÀÌ¿ëÀ» ÇÏ¸é µÇ°ÚÁÒ? ¹Ù·Î À̰÷¿¡ ³ª¿À´Â »ç¶÷µéÀÌ ±× ´ëÇ¥ÁÖÀÚµéÀÎ »ç¶÷µéÀÔ´Ï´Ù. ¿ì¸° ÀÌ ºÐµéÀÌ ¸¸µé¾î ³õÀº °ÍÀ» ´Ã °¨»çÇϴ ¸¶À½À¸·Î À̿븸 ÇÏ¸é µÇ´Â °ÍÀÌÁÒ.

 

ÀÏ´Ü BioPerlÀ̶ó´Â °­·ÂÇÑ ¹«±â¸¦ ¼Õ¿¡ µç »óÅ¿¡¼­´Â, ±× ´ÙÀ½ºÎÅÍÀÇ ÀÏÀº »ó´çÈ÷ ¼ö¿ùÇÕ´Ï´Ù. ¾Æ·¡ Perl script´Â À§¿¡¼­Ã³·³ ÀúÀåÇÑ GenBank ÆÄÀÏ¿¡¼­±× ¾È¿¡ µé¾î ÀÖ´Â ¸ðµç sequenceµé¿¡ ´ëÇØ¼­, ¾î¶² feature¸¦ °¡Áø subsequenceµéÀ» Áà»Ì¾ÆÁÖ´Â °ÍÀÔ´Ï´Ù. ¿©±â¿¡ ÀÖ´Â output ÆÄÀÏÀ» »ìÆìº¸¸é, ¹» ÇÏ´Â °ÍÀÎÁö °¨ÀÌ ¿Ã °ÍÀÔ´Ï´Ù.

 

gb_feature_extract.pl mammal_hemoglobin_mRNA.gb STS

 

¶ó°í ½ÇÇàÇÑ °á°ú¸¦ ÆÄÀÏ·Î ÀúÀåÇÑ °ÍÀÔ´Ï´Ù.

#!/usr/bin/perl -w
use strict;
use Bio::SeqIO;
use Bio::Location::Simple;

my $gb_file = shift;
my $feature = shift;

my $in = new Bio::SeqIO(-format => 'genbank', -file => $gb_file);

while( my $seq = $in->next_seq ) {
    my $sequence = $seq->seq();
    foreach my $f ( $seq->top_SeqFeatures ) {
	if ($f->primary_tag eq $feature) {
	    my $desc = $f->primary_tag . " " .
	      ($f->strand < 0 ? 'complement' : '')
		. "(" . $f->start . ".." . $f->end . ")";
	    my $location = Bio::Location::Simple->new(-start  => $f->start,
						      -end   => $f->end,
						      -strand => $f->strand);
	    my $out = Bio::Seq->new(-seq => $seq->subseq($location),
				    -id => $seq->id(),
				    -desc => $desc,
				    -alphabet => "dna");
	    my $seqio_obj = Bio::SeqIO->new(-format => 'fasta' );
	    $seqio_obj->write_seq($out);
	}
    }
}  

À§ Perl script´Â À̰÷¿¡µµ ³Ö¾î³õ¾Ò½À´Ï´Ù. ¾öû º¹ÀâÇØ º¸À̳ª¿ä? ½ÇÁ¦·Î ³»ºÎ¿¡¼­ µ¹¾Æ°¡´Â °ÍÀº 50¹è´Â ´õ º¹ÀâÇÕ´Ï´Ù. BioPerl ´öºÐ¿¡ ±×³ª¸¶ ÀÏÀÌ 50ºÐÀÇ 1Á¤µµ·Î ÁÙ¾îµç °ÍÀÌÁÒ. À§¿¡¼­ :: ±âÈ£°¡ ÀÖ´Â ºÎºÐ, ±×¸®°í -> ¿Í => ±âÈ£°¡ »ç¿ëµÈ ºÎºÐµéÀÌ BioPerlÀ» ÀÌ¿ëÇÏ´Â ºÎºÐÀÔ´Ï´Ù. ÀÌ script¸¦ ¸¸¾à BioPerlÀ» »ç¿ëÇÏÁö ¾Ê°í Á¦°¡ ¼Õ¼ö °°Àº ±â´ÉÀ» Çϵµ·Ï ¸¸µé¾ú´Ù°í Çϸé, ÈξÀ ±ä Äڵ尡 µÇ¸ç ¸¸µå´Âµ¥ °É¸° ½Ã°£µµ ¾Æ¿¹ ºñ±³µµ µÇÁö ¾ÊÀ» Á¤µµ·Î ±æ¾úÀ» °ÍÀÔ´Ï´Ù. ¹Ý´ë·Î, BioPerl¿¡ ¾à°£¸¸ Àͼ÷ÇÑ °æ¿ì¶ó¸é À§¿Í °°Àº Á¤µµÀÇ ±â´ÉÀ» Â¥´Â °ÍÀº Àá±ñÀÌ¸é µÇ´Â ÀÏÀÔ´Ï´Ù. ±×¸®°í À§ÀÇ script´Â ½ÇÁ¦·Î ±×¸® º¹ÀâÇÑ °ÍÀÌ ¾Æ´Õ´Ï´Ù. ´ÜÁö ÀÌ·± °Í¿¡ Àͼ÷ÇÏÁö ¸øÇÏ´Ï º¹ÀâÇØ º¸ÀÌ´Â °Í»ÓÀÔ´Ï´Ù. óÀ½À¸·Î ·¦¿¡ µé¾î¿Í¼­ ½ÇÇèÀ» ½ÃÀÛÇßÀ» ¶§¸¦ ±â¾ïÇØ º¸±â ¹Ù¶ø´Ï´Ù. óÀ½¿¡´Â ½Åºñ·Ó°í ¹«Ã´ ´ë´ÜÇÑ ÀÏ·Î º¸ÀÌÁö¸¸Àͼ÷ÇØÁö¸é °ð º° °Íµµ ¾Æ´Ñ °ÍÀÌ µÇ´Â °ÍÀÌÁÒ (À§ÀÇ script´Â »ç¿ëÀÚ°¡ À߸øµÈ ÀÔ·ÂÀ» ÇßÀ» ¶§ µµ¿ò¸»À» ´ë½Å º¸¿©Áְųª ÇÏ´Â °Í°ú °°Àº ±â´Éµµ ³ÖÁö ¾ÊÀº "³ª È¥ÀÚ ¾²±â¿ë"ÀÎ ¸éÀÌ °­ÇÏÁö¸¸´ç¿¬È÷ ½ÇÁ¦·Î »ç¿ëÀ» ÇØµµ µË´Ï´Ù. reverse complement±îÁö Á¦´ë·Î ó¸®Çϵµ·Ï ¸¸µé¾îÁ® ÀÖ½À´Ï´Ù. ÇÑ °¡Áö ºüÁø °ÍÀº, ¾î¶² feature°¡ Á¶°¢ÀÌ ³ª ÀÖÀ» ¶§Àε¥, À̰ͱîÁö´Â Ã³¸®°¡ ¾È µË´Ï´Ù. µû¶ó¼­, ¿¹¸¦ µé¾î genomic sequence¿¡¼­ exonµéÀ» ¿¬°áÇØ¼­ ¿ÏÀüÇÑ ORF·Î ¸¸µå´Â ÀÏÀº ¸ø ÇÕ´Ï´Ù. ¹°·Ð À̰͵µ BioPerl·Î ½±°Ô µÇ´Â ÀÏÀÔ´Ï´Ù.)

 

±×¸®°í, ½Ã°£À» »ý°¢ÇØ º¸±â¸¦ ¹Ù¶ø´Ï´Ù. ¸¸¾à ÀÏÀÏÀÌ ¼öÀÛ¾÷À¸·Î À§ÀÇ ÀÏÀ» ÇÑ´Ù¸é ¾î¶² »óȲÀÌ ¹ú¾îÁú±î¿ä? °ðÀå ÇѰ谡 ÀÖ°Ô µÇ°ÚÁÒ? ÀÏ´Ü subsequence¸¦ ½Ç¼ö ¾øÀÌ »Ì¾Æ³»´Â ÀϺÎÅͰ¡ Àΰ£ÀÌ ÇÒ ÀÏÀÌ ¾Æ´Ï°Ú±º¿ä. ÀÌ·± ¹®Á¦°¡ ¾ø´Ù°í ÇØµµ, ³¡µµ ¾øÀÌ µ¿ÀÏÇÑ ÀÏÀ» ¹Ýº¹ÇØ¾ß ÇÏ´Â °ÍÀÌ´Ï ÇÑ 50°³ Âë±îÁö¸¸ ÇØ¾ß°ÚÁÒ. ±× ÀÌ»óÀº Àΰ£ÀÌ ÇÒ ÁþÀÌ ¸øµÉ ÅÍÀÌ´Ï... ¿äÁò »ç¿ëÇÏ´Â º¸ÅëÀÇ PCµé¿¡¼­´Â À¢¸¸Å­ Å« GenBank ÆÄÀÏÀ̶ó°í ÇØºÁ¾ß ÀÌ scriptÀÇ ½ÇÇà ½Ã°£Àº 1ºÐÀÌ ³Ñ±âµµ Èûµé °ÍÀÔ´Ï´Ù¹°·Ð À§ÀÇ script¿Í °°Àº °ÍÀ» Â© ÁÙ ¾Ë°Ô µÇ´Â °ÍÀÌ ½¬¿î ÀÏÀ̶ó´Â °ÍÀÌ °áÄÚ ¾Æ´Õ´Ï´Ù. ¹®Á¦´Â ÀÌ°É ÇØ³¾ ´É·ÂÀ» °®ÃßÁö ¸øÇßÀ» ¶§°¡ ¿ö³« ºñÂüÇÏ´Ù´Â °ÍÀÌÁÒ. (±¹³»ÀÇ Çö»óȲÀº ¾Æ¿¹ ÀÌ·± ¿ä±¸ ÀÚü°¡ ¾øµµ·Ï µÇ¾î Àִ ƯÀÌÇÑ »óȲÀ̱º¿ä. À½, ÀÌ À̾߱â´Â À̰÷¿¡¼­´Â ÇÏÁö ¸»µµ·Ï ÇսôÙ.) ±×¸®°í´Ù¸¥ ¹æ¹ýÀº ¾ø½À´Ï´Ù. ¸¸¾à¿¡ ÀÖ´Ù°í °¡Á¤À» ÇØº¾½Ã´Ù. ±×·¸´Ù¸é ¼±Áø±¹µé¿¡¼­ »ý¹°ÇÐÀÚµé ´ë»óÀ¸·Î perlÀ» °¡¸£Ä£´Ù´À´Ï ¹è¿î´Ù´À´Ï Çϸ鼭 ¼Ò¶õ½º·¯¿ï ¸®°¡ ¾ø°ÚÁÒ? È®½ÇÇÑ Áõ°Å°¡ µÇ¾ú³ª¿ä? ¹°·Ð Á¦´ë·Î µÈ ´äÀº Àü»êÇÐ ±× ÀÚü(ƯÈ÷ user interface ºÎºÐ)ÀÇ ÇöÀç ½ÇÁ¤ÀÌ ÀÌ Á¤µµ¶ó´Â Á¡°ú ¿ì¸®°¡ ÇÊ¿ä·Î ÇÏ´Â ÀÏ ±× ÀÚüÀÇ Æ¯Â¡ ¶§¹®ÀÎ °ÍÀ̰í¿ä. ÀÌ À̾߱⠿ª½Ã ³Ê¹« º¹ÀâÇØÁö´Ï ÀÌ Á¤µµ¸¸ Àûµµ·Ï ÇϰڽÀ´Ï´Ù.

 

³ëÆÄ½É¿¡ Á¶±Ý Ãß°¡¸¦ Çϸé, ÀÌ·± °ÍµéÀ» ´©±º°¡°¡ ¹Ì¸® ´Ù Â¥³õÀ» ¼ö´Â ¾ø´Â°¡ ÇÏ´Â »ý°¢ÀÌ °¡´ÉÇϰڱº¿ä. À§ÀÇ ÀÏÀº ÀϹÝÀûÀ¸·Î ÇÊ¿äÇÑ ÀÏÀ̶ó ±×·² ¼öµµ ÀÖÁö¸¸, ¸·»ó ½ÇÁ¦·Î »ý¹°Á¤º¸ÇÐÀûÀÎ ÀÏÀ» ÀÚ½ÅÀÇ ¿¬±¸ÀÇ ÀϺκÐÀ¸·Î Áý¾î³Ö°Ô µÇ¸é, À̶§´Â ¾îµð¿¡¼­µµ ãÀ» ¼ö°¡ ¾ø´Â ÀڽŸ¸ÀÇ °ÍÀ» À̰ÍÀú°Í ¸¸µé¾î³»¾ß ÇÏ°Ô µË´Ï´Ù. ¹°·Ð ÇϺο¡ ±ò¸° ¿ä¼ÒµéÀº °ÅÀÇ ´Ù °øÅëÀÌ´Ï À̸¦ ¸ð¾Æ¼­ BioPerlÀ̶ó°í ÇÏ´Â °ÍÀ̰í¿ä. ´ÜÁö ÀÌ ¿ä¼ÒµéÀ» ¾î¶»°Ô ¿«¾î ³õ¾Ò´Â°¡ ÇÏ´Â °Í¸¸ ¼­·Î ´Ù¸¥ °ÍÀÌÁÒ. ÀÌÇØ°¡ µÇ´ÂÁö¿ä? À½, ´õ ÀÚ¼¼È÷ Ç®¾î¼­ ÀûÀ» ¼öµµ ÀÖÁö¸¸, ÀÌ Á¤µµ·Îµµ ´ë°³´Â ³³µæÀÌ µÉ °Í °°±º¿ä. ±×¸®°í´Â "Àü»ê°ú Ãâ½Å »Ì¾Æ¼­ ½ÃŰ¸é µÇ°Ú±º"À̶õ »ý°¢À» ÇÏ´Â »ç¶÷µµ ÀÖÀ» ÅÍÀε¥ÀÌ°Ç ¼±Áø±¹µé¿¡¼­ ½ÇÁ¦·Î ÇØºÃ´Ù°í ÇÕ´Ï´Ù. ´Ù¸¥ ´õ º¹ÀâÇÑ °ÍµéÀº µûÁú Çʿ䵵 ¾øÀÌ, Á¶±Ý¸¸ »ý°¢À» ÇØº¸¸é »çȸÀûÀ¸·Îµµ ¼º¸³ÀÌ µÇÁö ¾Ê´Â´Ù´Â Á¡ºÎÅÍ ´çÀå ÀÖ´Ù´Â °ÍÀ» ±ú´ÞÀ» ¼ö°¡ ÀÖÀ» °ÍÀÔ´Ï´Ù. ÀÌ·± ÀÏÀ» Ã´Ã´ÇØ³¾ ¼ö Àִ ÁÁÀº ¸Ó¸®¸¦ °¡Áø »ç¶÷À» ³²ÀÇ ¿¬±¸¿¡ ½Ã´Ù¹Ù¸® ³ë¸©À» Áö¼ÓÀûÀ¸·Î ÇÏ°Ô ¸¸µå´Â ¹æ¹ýÀº ¹¹°¡ ÀÖÀ»±î¿ä? ¾ø´Ù´Â °ÍÀÌ Á¤´äÀÔ´Ï´Ù. Àü»ê°ú Ãâ½Åµµ ¿ì¸®¿Í ¶È°°Àº »ç¶÷ÀÌ´Ï ¸»ÀÔ´Ï´Ù. ^^; °°Àº À̾߱⸦ ±»ÀÌ ¹Ýº¹À» Çϸé, ÀÌ·± ¼Õ½¬¿î ÇØ°áÃ¥ÀÌ ¸¸¾à¿¡ ÀÖ´Ù¸é ¼±Áø±¹µé¿¡¼­ Áö±Ý°ú °°Àº Çö»óÀÌ »ý°åÀ» ¸®°¡ ¾ø°ÚÁÒ?

 

ÀÌÁ¦ library¶ó´Â ¿ë¾î ±× ÀÚü¿¡ ´ëÇØ¼­ ¼³¸íÀ» ÇÒ Â÷·ÊÀ̱º¿ä. À§¿¡¼­ ¼Ò°³°¡ µÈ °Íµé À̿ܿ¡µµ GenBank ÆÄÀÏÀ» ´Ù·ç±â À§Çؼ­ ÇÊ¿äÇÑ ´Ù¸¥ ¿©·¯ °¡Áö ±â´ÉµéÀ» ¿ª½Ã ´©±º°¡°¡ Â¥°Ô µÇ°ÚÁÒ? ÀÌ°É Àß Á¤¸®¸¦ ÇØ¼­ ¸ð¾Æ³õ°í, ¹®Á¦ÀÇ ¼ÒÁö(¸ðµÎµé ¾Æ´Â ¿ë¾îÀ̰ÚÁö¸¸, ÀÌ°É Àü»ê ¿ë¾î·Î´Â '¹ö±×'¶ó°í ÇÏÁÒ.)µéµµ ÃÖ´ëÇÑ Á¦°Å¸¦ Çϰí, °Ô´Ù°¡ ´Ù¸¥ »ç¶÷µéÀÌ °¡Á®°¡¼­ ¾µ ¶§¿¡ Æí¸®Çϵµ·Ï ¿©·¯ °¡Áö °í·Áµµ ÇÑ °ÍÀ̰í, ½ÉÁö¾î´Â Àß ¸¸µç ¼³¸í¼­±îÁö ´Þ¾Æ³õ¾Ò´Ù°í ÇսôÙ. º¸Åë ÀÌ Á¤µµ·Î ÇØ³õÀº °ÍÀ» library¶ó°í ºÎ¸¨´Ï´Ù. Áï, "¿¬°üµÈ ¿©·¯ °¡Áö ÀϵéÀ» Çϴµ¥ ÇÊ¿äÇÑ Àß Á¤¸®µÈ ¼Ò½º ÄÚµåµéÀÇ ¸ðµë"ÀÎ °ÍÀÌÁÒ. (¼Ò½º Äڵ带 °ø°³ÇÏ´Â ´ë½Å¿¡ compileÀÌ µÈ °Í¸¸À» °ø°³Çؼ­ ¼Ò½º ÄÚ½º´Â ³²µéÀÌ º¸Áö ¸øÇÏ°Ô ÇÒ ¼öµµ ÀÖ½À´Ï´Ù. »ý¹°Á¤º¸ÇÐ ºÐ¾ß´Â ºÐÀ§±â°¡ ÀüÇô ±×·¸Áö ¾Ê½À´Ï´Ù. ¸ðÁ¶¸® ´Ù ¼Ò½º ÄÚµå±îÁö °ø°³¸¦ ÇÏ´Â ¹«Ã´ ¿­¸° ºÐÀ§±âÀΠ°÷ÀÌÁÒ.) perl¿ë libraryµéÀº http://www.cpan.org¿¡ ÃÑÁýÇÕÀ» ½ÃÄѳõ°í Àִµ¥, »ç½Ç ÀÏ»ó ¿ë¾î¿¡¼­ÀÇ "µµ¼­°ü"Àº À̰÷ÀÌ µÇ´Â ¼ÀÀ̷২ä. °³º° library´Â Ã¥ Á¤µµ°¡ µÇ´Â °ÍÀ̰í¿ä. ¹¹, ±¦È÷ µûÁö´Â °ÍÀÌ µÇ´Â±º¿ä. ¾î·µç Àü»ê ¿ë¾î¿¡¼­ library´Â ¿©±â¿¡ ¼³¸íÇÑ °ÍÀ» ¶æÇÕ´Ï´Ù.

 

À§¿¡¼­ ¿¹·Îµç GenBank ÆÄÀÏÀ» parsingÇÏ´Â ±â´ÉÀº BioPerlÀÇ ±ØÈ÷ ÀϺκÐÀÇ ±â´ÉÀÔ´Ï´Ù. »ý¹°Á¤º¸ÇÐÀûÀÎ ÀÏÀ» ÇÏ´Â µ¥¿¡ ÇÊ¿äÇÑ "°øÅëÀûÀÎ Àϵé"Àº ¿Â°® °ÍµéÀÌ ´Ù µé¾î°¡ ÀÖÁÒ¿©±â¿¡¼­ ¸Ó¸®¸¦ ½ºÄ¡°í Áö³ª°¡´Â »ý°¢ÀÌ Çϳª ÀÖÀ» °ÍÀÔ´Ï´Ù. "¾Æ, »ý¹°Á¤º¸ÇÐÀûÀÎ ¾î¶² ÀÏÀ» ÇÏ·Á¸é È¥ÀÚ¼­ ¸Ç¶¥¿¡ ÇìµùÀ» Çϴ °ÍºÎÅÍ ½ÃÀÛÀ» ÇÒ °ÍÀÌ ¾Æ´Ï¶ó, ÀÏ´ÜÀº ³»°¡ ÇϰíÀÚ ÇÏ´Â ÀÏÀÌ ¾î´À ºÎºÐ±îÁö BioPerl·Î ÇØ°áÀ» ÇÒ ¼ö ÀÖ´ÂÁöºÎÅÍ ¾Ë¾Æº¸´Â °ÍÀÌ °¡Àå ¸ÕÀú ÇØ¾ß ÇÒ ÀÏÀ̰ڱº"À̶õ »ý°¢À» Áö±Ý ÇÏ°Ô µÈ »ç¶÷Àº ¸Å¿ì Á¤»óÀûÀÎ »ç°í´É·ÂÀ» °¡Áø »ç¶÷ÀÔ´Ï´Ù. (À½, ±×·¸Áö ¸øÇÑ »ç¶÷À̶ó¸é, µµ´ëü ÀÌ ±ÛÀ» ¿Ö ¿©±â±îÁö Àоú´ÂÁö¿ä? ^^;)

 

±×·³ BioPerlÀ» Á¦´ë·Î ÀÌ¿ëÇϱâ À§Çؼ­´Â ¹«¾ùÀÌ ÇÊ¿äÇÒ±î¿ä? ´ç¿¬È÷ perl ÇÁ·Î±×·¡¹ÖºÎÅÍ ¾Ë°í ÀÖ¾î¾ß°ÚÁÒ? ±×·¡¾ß BioPerl·Î ¹» ¿«¾îº¸µç ¸»µç ÇÒ ÅÍÀÌ´Ï ¸»ÀÔ´Ï´Ù. (¾È Àû¾îµµ µÇ´Â ¼Ò¸®Áö¸¸, ´ç¿¬È÷ »ý¹°ÇÐÀÚÀ̾î¾ß ÇÒ ÅÍÀ̰í¿ä. À½, ¾µµ¥ ¾ø´Â ºñÀ¯Áö¸¸, ÃÖ½Å½Ä Àåºñµé·Î ¾öû È­·ÁÇÏ°Ô °®Ãß¾î³õÀº ºÐÀÚ»ý¹°ÇÐ ½ÇÇè½Ç¿¡ ¿¹¸¦ µé¾î °æÁ¦ÇÐ Àü°øÀÚ¸¦ µ¥·Á´Ù ³õÀ¸¸é ¹» ÇϰڽÀ´Ï±î? BioPerlÀÌ ¾Æ¹«¸® ¿Â°® ±â´ÉÀÌ ÃѸÁ¶óµÈ °ÍÀ̶ó ÇØµµ, ¹«¾ð°¡ ÇÒ ÀϵéÀ» ½º½º·Î ¸¸µé¾î°¡´Â ¿øµ¿·ÂÀÌ µÇ´Â ¿©·¯ »ý°¢µéÀÌ ÀÖ´Â »ç¶÷ÀÇ ¼Õ¿¡¼­¸¸ ±× °¡Ä¡°¡ ÀÖ°Ô µÇ°ÚÁÒ.) ±×¸®°í´Â BioPerl ±× ÀÚü¿¡ ´ëÇØ¼­ °øºÎÇÒ Á¡¿¡´Â ´ÙÀ½ µÎ °¡Áö ¸éÀÌ ÀÖ½À´Ï´Ù. Çϳª´Â, BioPerlÀÌ °´Ã¼ÁöÇâÇü ±¸Á¶·Î µÇ¾î ÀÖ´Ù´Â Á¡Àε¥, ÀÌ Á¡¿¡ ´ëÇØ¼­µµ Á¶±Ý °øºÎ¸¦ ÇØ¼­ ÀÌÇØ¸¦ ÇØ¾ß ÇÕ´Ï´Ù. ¹°·Ð ¾î¶² ¿ø¸®·Î ÀÛµ¿À» ÇÏ´ÂÁö´Â ¸ð¸£´Â »óÅ¿¡¼­, »ç¿ëÀ» ÇÏ´Ùº¸¸é ÀúÀý·Î Àͼ÷ÇØÁö´Â ½ÄÀ» ÅÃÇÒ ¼öµµ ÀÖ°ÚÁö¸¸, ÀÌ°Ç ÇÐÀڷμ­´Â ¿µ Á» ±×·± ¼Ò¸®°¡ µÇÁÒ. ±×¸® ¾î·ÆÁöµµ ¾Ê°í ¾ÕÀ¸·Î µÎ°íµÎ°í »ç¿ëÇØ¾ß ÇÏ´Â Áß¿äÇÑ µµ±¸ÀÇ ³»ºÎ ±¸Á¶ÀÌ´Ï, °øºÎ¸¦ Çعö¸®°Ô µÇ±â¸¦ ¹Ù¶ø´Ï´Ù. ´Ù¸¥ Çϳª´Â, ¾î¶² ±â´ÉµéÀÌ ÀÖ´ÂÁö, À̸¦ ÀÌ¿ëÇϱâ À§ÇÑ ¸ðµâÀÇ À̸§Àº ¹ºÁö, °¢ ±â´ÉµéÀº ¾î¶² °èÃþÀû ±¸Á¶·Î ¼­·Î ¿¬°áÀÌ µÇ¾î ÀÖ´ÂÁö µî°ú °°Àº Á¡µéÀÔ´Ï´Ù. ¾ÕÀÇ °ÍÀº ±âÃÊÀûÀÎ Áö½ÄÀÌ µÇ´Â °ÍÀ̰í, ¹°·Ð µÚÀÇ °ÍÀÌ ½ÇÁúÀûÀ¸·Î´Â ´õ¿í Áß¿äÇÑ Á¡ÀÌÁÒ.

 

ÀÌ Á¤µµ¸é BioPerlÀÌ ¹«¾ùÀΰ¡¿¡ ´ëÇÑ ´ë·«ÀûÀÎ ¼Ò°³´Â µÈ °Í °°±º¿ä. ¼³¸íÀÌ ¾Ö¸ÅÇÑ ºÎºÐÀ̳ª ºÎÁ·ÇÏ´Ù°í ´À²¸Áö´Â ºÎºÐÀÌ ÀÖÀ¸¸é feedbackÀ» Á» ÇØÁֱ⸦ ¹Ù¶ø´Ï´Ù.


¡èUp