PCR, 넌 어디까지 알고 있니?

 

PCR(polymer chain reaction)은 원하는 DNA의 sequence를 통해 다량의 DNA를 증폭하는 기술이다. Denaturation, Annealing, Extension의 세 단계로 구성되어 있고, 이 과정이 반복되면서 DNA가 증폭된다. 기본적으로 DNA template, primer, dNTP, polymerase등으로 구성되어 진행된다. 오늘은 유전자를 증폭시키는 PCR의 여러 가지 종류를 파헤쳐 보고자 한다.

 

1) RT-PCR(Reverse Transcriptase Polymerase Chain Reaction) 

출처 : https://www.thermofisher.com

특정 부위의 RNA를 template로 하여 이에 상응하는 cDNA(complementary DNA)를 합성한 뒤, PCR 증폭을 시행하는 기술이다. 실험 과정은 1) 역전사효소(reverse transcriptase)를 이용하여 RNA로부터 cDNA를 제조하는 과정과 2) cDNA를 이용하여 특정부위를 증폭시키는 과정으로 나뉘어지며, 2) 과정은 genomic DNA로부터 특정 유전자 부위를 증폭시키는 방법과 같다. 이 방법은 노던 블롯 혼성화 분석(Northern blot hybridization)과 같은 방법을 사용하는 RNA 분석보다 실험방법이 간단할 뿐 아니라 유전자의 염기서열 결정이 가능하기 때문에 주로 mRNA의 염기서열 및 전사량을 연구할 때 크게 도움이 된다. 염기서열이 알려진 유전자의 경우 RT-PCR을 통해서 전체 길이의 cDNA를 간단하게 합성하여 복제(cloning) 할 수도 있다.

 

2) Allele-specific PCR
 DNA상에서 하나의 염기만 다른 SNP(single-nucleotide polymorphisms, 단일염기변이)를 분석하는 기술로서 서로 다른 allele의 DNA sequence만 안다면 primer를 제작하여 allele-specific PCR을 진행할 수 있다. Allele-specific PCR은 template과 SNP-specific primer사이에 불일치(mismatch)의 존재를 정확하게 판단하여 기존의 PCR에서의 비특이적인 증폭(amplification)을 막아 성공적으로 원하는 template만을 증폭 시킬 수 있다.

출처 : https://www.slideshare.net/

 

 

3) Asymmetric PCR
 Asymmetric PCR은 비대칭의, 불균형의 의미를 갖는 Asymmetric이란 단어에서 알 수 있듯이, 이중가닥의 DNA 중 한 가닥의 DNA만을 증폭시키는데 사용하는 기술이다. Single strand만을 얻을 목적으로 사용되며, Primer를 두 개 사용한다. 두 primer의 농도를 100:1로 섞어 PCR을 진행하는데, PCR 초기단계에서 한쪽의 primer는 소비되어 버리고 과잉의 primer에서 single strand DNA가 생성이 된다.

출처 : https://www.researchgate.net/

 

4) RACE(Rapid Amplification of cDNA Ends) 

출처 : https://www.slideshare.net/

cDNA를 복제(cloning)하기 위해서는 cDNA library를 검사(screening)하는 방법이 가장 일반적이지만, 이 방법으로 처음 screening을 하여 찾아낸 clone은 대개 전체 cDNA의 일부이며 계속 반복하여 screening을 하여야만 완전체 cDNA를 얻어낼 수 있다. 반복 작업이 필요한 만큼 상당한 시간과 노력이 소모되는 작업이고, 유전자 자체가 cDNA library에 적은 양으로 존재하는 경우엔 더욱 힘든 작업이 되어 버린다. 이 문제를 해결하고자, 1988년 Frohmann 등은 RACE(rapid amplification of cDNA ends) PCR 기술을 만들어 냈다. cDNA의 일부 염기서열만 알고 있으면, 이 부분에서 gene specific primer를 합성하고 PCR 반응(reaction)을 통해 5'-end 혹은 3'-end 까지의 DNA를 증폭하는 것이다. 3'-RACE PCR 방법에서는 모든 mRNA 3'-end에 존재하는 poly(A) tail(AAAAAAAA...AAAA-3')을 이용하여, 그와 상보된 oligo-(dT) primer(5'-TTTTTT...TTT-3')를 반응시켜 cDNA를 합성 시킬 수 있다.

 

5) IS-PCR(In Situ Polymerase Chain Reaction) 

출처 : https://www.slideshare.net/

 PCR은 원하는 DNA를 대량으로 증폭시키는 방법이고, in situ hybidization (ISH)은 세포나 조직에 존재하는 극미량의 DNA 및 RNA를 찾아낼 수 있음은 물론 원하는 유전자들의 위치까지 확인할 수 있는 방법이다. ISPCR은 이 두 가지 방법의 장점을 혼합하여 응용한 방법으로서 PCR의 민감성(sensitivity)과 ISH의 특정성(specificity)을 고루 갖추고 있다. IS-PCR의 실험원리는 일반적인 PCR 방법과 같으나, 슬라이드 글라스(slide glass) 등의 사용에 적합한 IS-PCR용 기구가 필요하며 사용하는 기구에 따라 반응시키는 방법들이 다양하게 제시되어 있다.  IS-PCR은 세포내의 target sequence를 증폭시키는 것으로부터 반응이 시작되며 세포막을 통해 여러 물질들이 쉽게 이동할 수 있도록 세포막을 HCl(염화수소, 강산), proteinase K(단백질분해효소) 등으로 처리해 주는 과정을 거쳐야 한다. 이 과정에 이상이 생기면 세포가 손상되거나 파괴되는 수가 있으므로 적절한 선택과 사용이 중요하다. 아직까지는 IS-PCR 방법의 효율이 기대효과 대비 그다지 높지 못하지만, 민감성과 특정성이 높아야 되는 진단 및 분석 분야에서는 유용하게 사용될 것으로 기대된다. 

 

6) Hot start PCR
 Taq1 polymerase 효소는 37℃에서도 효소 활성이 좋기 때문에 간혹 첫 번째 denaturation 과정이 완전히 진행되기도 전에 primer가 DNA 분자에 붙어 증폭(extension)되는 경우가 있다. 이렇게 낮은 온도에서 결합(annealing)이 일어날 경우 primer의 불일치 접합 확률이 높고, 결과적으로 정확도가 떨어지는 결과를 얻게 된다. 이것을 막는 방법이 Hot-start PCR기술이다. Hot-start PCR에서는 primer가 정확하게 원하는 DNA site에만 붙을 수 있도록 충분한 온도가 된 후에야 PCR이 진행되게 필요한 물질(ex. polymerase, MgCl2, dNTP)을 넣어준다. 그러면 primer가 불일치하는 DNA 분자와 붙는 상황을 피할 수 있어 상대적으로 명확한 결과를 얻을 수 있다.

출처 :https://us.bioneer.com/

 

7) RAPD PCR 

출처 : https://www.researchgate.net/

 RAPD (random amplified polymorphic DNA) PCR은 두 생명체가 계통 유전학적으로 얼마나 유사성이 있는가를 판별할 때 사용한다. PCR을 진행할 때 primer가 짧을 경우 게놈(genome)상의 이곳저곳에 달라붙어 여러 조각(fragment)을 생성하게 되고, 전기영동을 사용하면 생명체마다 각각의 독특한 band를 형성하게 되는데, 이것을 가지고 생명체간의 유사성을 판별할 수 있다. 만약 두 생명체가 비슷한 종일 경우에는 band의 모양이 비슷할 것이며, 그렇지 않을 경우에는 서로 많은 차이가 나타날 것이다. 이 RAPD PCR은 방법이 비교적 간단하고 쉬워 genome sequencing을 하기 전에 대략적인 종간의 관계를 확인하기 위해 사용된다.

 

8) Real time qPCR(quantitative PCR)
 PCR 산물의 양을 실시간으로 측정하기 위해 사용되는 기술이다. DNA, RNA, cDNA의 양을 정량적으로 분석할 수 있고, 한 샘플에서 PCR 산물의 copy 수를 측정할 수 있다. RT-qPCR 방법에서는 형광염색법(dye)을 사용하는데, SYBR-green, Evagreen 혹은 DNA probe를 가진 형광, Taqman을 이용해 실시간으로 증폭되는 산물의 양을 정량적으로 측정한다.

 

9) Nest PCR 
 Nest PCR은 한 번 PCR로 증폭한 DNA 단편을 한 번 더 내부의 primer를 사용하여 증폭하는 방법이다. 두 개의 서로 다른 primer set를 이용하여 연속적으로 두 번의 PCR을 진행하게 되면 비특이적 반응을 감소시킬 수 있어 정확하고, PCR을 2회 실시하므로 감도가 상승하는 효과를 얻을 수 있다.

출처 : https://en.wikipedia.org/wiki/Nested_polymerase_chain_reaction

10) Multiplex PCR

출처 : https://www.labce.com/pcr_fundamentals.aspx

한 번의 PCR로 서로 다른 여러 개의 DNA들을 증폭시키는 분자생물학적 기술이다. 반응시킬 용액에 서로 다른 DNA를 증폭시킬 primer를 첨가해 target sequence에 붙을 수 있도록 PCR 조건을 잡아주면 한 번에 증폭되어 상당한 시간과 노력을 절약할 수 있다. 그러나 한 번에 여러 가지 target을 증폭시키기 때문에 각 primer set들의 annealing 온도를 비슷한 범위에서 최적화 시켜야 되는 전처리 작업이 필요하다. Multiplex PCR은 병원균 확인, SNP genotyping, 돌연변이 분석, template의 양, RNA를 detection 하는데 유용하다.

 

11) Inverse PCR 
 Inverse PCR은 이미 서열을 알고 있는 DNA의 양 옆에 서열을 알지 못하는 부분을 알고자 할 때 많이 이용된다. 예를 들어 5’-xxxxxxx=========xxxxxx-3’ (x서열을 모름, =서열을 알고 있음)
이런 염기 서열에서 x 부분을 알고자 할 때 사용되는데, 제일 먼저 제한 효소로 자르고, 자른 부위를 원으로 만든다. 그리고 그 원으로 된 곳에primer를 붙이는데, 이 때 연장(elongation)과 같은 방향으로 가도록 primer를 붙인다. Inverse라는 말은 primer가 기존의 PCR과는 다른 방향으로 간다고 해서 붙여졌다.

출처 : https://upload.wikimedia.org/wikipedia/en/d/da/Inverse_PCR_2.png

이 외에도 더 많은 PCR 종류들이 산업, 의학, 과학, 농업 등 다양한 분야에서 사용되어지고 있으며, 더 효율적인 PCR 기술들이 현재도 개발되고 있다. PCR은 분자생물학의 표준 실험법으로 특정한 유전자를 증폭하여 유전형을 알아보는 것부터, 신종플루, HIV, 지카바이러스, 콜레라균 등 온갖 병원균을 검출하고 종류를 확인할 때, 변사체의 신원을 분석할 때, 네안데르탈인의 뼈에서 추출한 DNA로부터 현생인류와의 관련성을 찾아 볼 때 등 굉장히 다양한 분야에서 적용되고 있다. 전 세계 PCR 시장의 규모와 PCR 기반 기술로 작동하는 차세대 시퀀싱 시장들이 200억 달러 이상의 규모가 될 것이라는 예상처럼, PCR은 현대문명을 구성하는 하나의 핵심적인 기술인 것이다.

Posted by KIST PR

댓글을 달아 주세요

NGS를 응용한 sequencing 방법

 

 NGS(Next-generation sequencing)의 비약적인 발전으로 레퍼런스 염기서열이 없이 분석이 가능한 de novo sequencing, 유전자 발현 변화를 볼 수 있는 transcriptome profiling, 코딩 영역만 해독하는 엑솜시퀀싱 및 질병의 진행 여부 연구까지 NGS가 있어 가능해졌다. 이번 기사에서는 NGS를 응용한 sequencing 방법들에 대해 이야기해보고자 한다.

(1) Resequencing
 Resequencing은 이미 레퍼런스 유전체가 완성된 생물종의 다양한 유전체를 분석하고 그 서열을 레퍼런스와 비교함으로써 특정 유전체 내 SNP 등의 변이를 발굴하고자 할 때 주로 쓰인다. NGS가 가장 널리 활용되고 있는 분야이며 엑솜 시퀀싱, 유전자를 이용한 진단 검사 의학, Genome-wide association studies(전장유전체연관분석연구, GWAS) 등으로 응용된다.
☞ 여기서 잠깐, SNP란?
단일염기 다형성 [single nucleotide polymorphism, SNP]으로 불리며, 염색체의 단일부위에서 여러 가지 DNA 염기들 중의 하나에 나타나는 일반적인 돌연변이이다. 약 500 ~1,000염기 당 1개꼴로 나타나며 이에 의하여 개인의 유전적 다양성이 발생한다.

(2) Whole exome sequencing (WES)
 RNA 서열 상 단백질을 만들어내는 총 영역, 엑솜(Exome)은 전체 인간 유전체의 2% 정도 밖에 차지하지 않지만, 현재까지 알려진 질병 관련 유전자들의 85% 가량이 엑솜에 위치해 있다. 따라서 질병 관련 유전자 발굴 및 진단 검사에는 빠르고 효율적이면서 저비용의 분석이 가능한 엑솜 시퀀싱을 주로 활용한다. 전체 서열에서 엑솜만을 시퀀싱하기 위해서는 엑솜에만 해당하는 probe를 샘플에 섞어주는 solution-based capture나 probe를 칩에 붙여서 추출해내는 array-based capture법, PCR을 이용한 방법 등이 있다. 그러나 라이브러리 제작 단계에서 엑솜 내 G염기와 C염기의 함량의 차이 등으로 인하여 capture probe와 DNA 조각 간의 결합력의 차이가 발생하는 등 라이브러리의 편중화가 일어날 가능성이 많다는 한계점이 있다.

(3) 분자진단검사, 임상의학
 기존의 ‘생어 시퀀싱법’은 분석 시간 및 비용의 문제로 특정 질환에 특이적인 소수의 유전자 검사만이 수행되었고 정확도가 낮았다. 그러나 NGS의 발전으로 인하여 하나의 샘플에서 다양한 질병 관련 유전자들을 동시에 분석할 수 있게 되었다. 이러한 assay들이 다양하게 개발되고 진단 장비로 승인을 받게 되면서 맞춤 의학 (companion diagnostics)시장까지  큰 영향력을 펼치게 될 것으로 기대된다.
 NGS는 임상 의학에서도 다양하게 활용될 수 있다. 한 예로 장기 이식 환자의 혈액에서 장기 제공자의 유전체와 일치하는 cell-free DNA가 검출되는지의 여부를 NGS로 확인한 사례가 발표되었다. 이 뿐만 아니라 임산부의 혈액에서 태아의 cell-free DNA가 발견된 연구를 이용하여 태아의 비침투 산전 검사를 수행한 연구가 발표되었다. 질병을 일으키는 대장균 등 다양한 세균들과 자궁경부암을 일으키는 HPV 등 바이러스의 체내 존재 여부 및 종 식별을 NGS로 빠르게 분석할 수 있게 되었다.

(4) Mapping-by-sequencing 법을 이용한 Forward genetic screening
 전통적인 forward genetic screening은 표준 개체와 돌연변이를 지속적으로 교배하면서 유전자 마커를 기준으로 mapping해야 했으므로 오랜 시간이 소요되었다. 그러나 NGS 분석 비용이 감소한 현재는 NGS를 이용하여 돌연변이체의 유전체를 분석하고 표준 유전체와 직접 비교함으로써 분석 시간을 단축할 수 있게 되었다.

(5) GWAS (Genome-Wide Association Study)
 GWAS란 각 개체의 유전체를 해독하여 비교, 분석함으로써 특정 질병과 연관된 유전적 요인을 찾고자 하는 연구이다. 인간의 SNP는 1억 개 가량이 발견되었고, 이 정보를 바탕으로 특정 질환을 앓고 있는 환자와 정상인의 유전체를 해독함으로서 SNP의 차이를 분석해 환자 집단에서의 해당하는 유전자를 추려내어 질환과 연관된 유전자를 발굴해내는 것이 GWAS의 연구 방법이다.

(6) 미생물의 종 식별 및 메타지노믹스(metagenomics)
 동, 식물에 비해 미생물의 유전체는 상대적으로 크기가 작기 때문에 유전체 해독이 상당히 진행되었다. 현재 미생물학계에서는 단일 생물종의 유전체 해독 연구를 넘어서서, 특정 환경에서 수집한 샘플에 함유된 유전체를 분석함으로써 각 환경의 미생물 군집을 파악하고자 하는 meta-genomics 연구가 활발히 수행되고 있다.

(7) Single-cell genomics
 NGS 분석 기술이 발달함에 따라 미량의 DNA 시료로도 성공적으로 sequencing 분석이 가능해지면서 단일 세포의 유전체를 알고자하는 single-cell genomics 연구가 활기를 띄게 되었다. 세포 분열과정에서 DNA가 복제를 거듭하면서 돌연변이가 발생할 가능성이 항상 존재한다. 따라서 한 개체에 있는 세포라 하더라도 각각의 유전체에는 미묘한 변이가 발생한다. 또한 이러한 돌연변이는 질환의 원인으로 작용하기도 하는데 한 연구에 따르면 정상 조직과 질환을 앓고 있는 조직의 유전체를 비교했을 때 변이율이 이론상 계산 결과보다 상당히 높았다. Single cell genomics를 통해 각 단일 세포의 유전체 서열을 분석함으로써 발달 생물학이나 암 생물학 연구에 응용시킬 수 있다. Single-cell genomics 연구에서는 아직까지 단일 세포의 정확한 분리와 미량 유전체의 증폭이 정확하지 않다는 한계점을 갖고 있어 현재의 NGS 분석을 위해서는 유전체 증폭 등의 과정이 필수적이다.

(8) de novo assembly(신생조합)
 de novo assembly는 아직 전체 염기서열이 해독되지 않은 생명체의 염기서열을 NGS로 분석하여 genome 또는 transcriptome을 구축하는 작업을 말한다. NGS 기술의 발전과 이를 뒷받침하는 생물 정보학의 발달로 주요 모델 생물에 이어 다양한 생물자원의 유전체 해독이 가능하게 되었다. 이러한 연구는 수많은 동물들의 유전체 해독을 목표로 현재는 1만종 이상의 척추동물 유전체를 해독하자는 Genome 10K 프로젝트가 추진되고 있다. NGS를 이용한 de novo assembly가 본격적으로 시작되기 전 이미 BAC 클론을 이용한 생어 시퀀싱으로 해독되고 있던 유전체들도 이제까지 얻은 결과와 NGS를 이용한 분석 결과를 조합함으로써 유전체 해독에 가속도를 붙일 수 있었다. 하지만 아직까지 NGS만으로 해독된 유전체 정보는 생어 시퀀싱으로 제작된 유전체에 비해 전체적인 완성도가 낮다는 한계를 갖고 있어 NGS만을 이용하여 de novo assembly를 진행하고 있지는 않다.

(9) Transcriptome sequencing
 mRNA sequencing은 NGS 기술의 발달로 현재 대부분 RNA-Seq으로 대체되었다. 기존 Microarray 방법으로는 특정 mRNA의 증가 또는 감소량 정도만 파악할 수 있었지만, NGS는 mRNA의 염기 서열을 직접 해독하게 됨으로써 그 전까지 불가능했던 RNA editing이나 대립유전자의 특정적인 발현(allele-specific expression) 등의 관찰이 가능하게 되었다. 게다가 mRNA 뿐만 아니라 small RNA 등의 non-coding RNA의 분석도 가능하게 되었으며, 엑손/인트론 구별 및 서열 정보가 불충분한 생물의 trasncript들까지도 분석 가능한 수단으로 사용된다.
 ☞ 여기서 잠깐, RNA-Seq은 mRNA나 miRNA 등 원하는 RNA를 분리한 뒤, RNA를 DNA로 변환한 후 어답터를 붙여 라이브러리를 제작하는 것이다. RNA는 유전체와 달리 세포 내에 존재하는 양이 그 특징에 따라 매우 다양하기 때문에, 극소량의 mRNA까지 성공적으로 검출해내기 위해서는 최대한 많은 read를 읽음으로써 sequencing depth를 올리는 것이 무엇보다도 중요하다. 또한 transcriptome의 대다수를 차지하는 rRNA 등을 효과적으로 제거하는 것도 도움이 된다. 하지만 아직까지 miRNA 등 small RNA는 크기가 작기 때문에, 라이브러리 제작에 사용되는 아답터의 false positive 아답터-이합체(adapter-dimer) 와 구별하기 어렵다는 한계점이 있어 NGS를 이용한 transcriptome 분석법의 발전을 위해서는 고품질의 라이브러리 제작법에 대한 연구가 뒷받침되어야 할 것이다.

 산업계에서의 NGS 응용 가능성은 최근 다양한 측면으로 제시되고 있다.  특정 세포주를 세대를 반복하여 ‘계대 배양’(세포 증식을 위해 새로운 배양접시에 옮겨 세포의 대를 계속 이어서 배양하는 방법)하면 그 과정에서 유전체 또는 후성 유전학적 변이가 생기는 경우가 있는데, 각 세포주의 유전체를 NGS를 이용하여 빠르게 분석하며 각 단계에서의 돌연변이를 모니터링 함으로써 세포주의 품질을 유지할 수 있게 되었다. 또한 다양한 환경에서의 세포의 활성 변화 및 유전자 발현 패턴의 변화를 관찰하는 데에도 유용하게 사용되고 있어 각 유전자의 기능을 연구하던 연구자들은 이제 특정 생명 현상과 관련된 모든 유전자들 사이의 상관관계를 통합적으로 파악할 수 있게 되었다. NGS 분석에 소요되는 비용이 저렴해진 만큼, 향후 생어 시퀀싱 방법의 사용과 같이 빈번하게 사용될 것이다. 다만 한 번의 NGS 분석으로 상당히 많은 양의 데이터가 생성되기 때문에, 생성된 데이터를 어떻게 분석하여 그 중에서 유의미한 결과를 추출해낼 것인지에 대한 충분한 계획을 세워야 한다.  빠르게 변하는 기술 동향을 정확하게 파악하면서 NGS 기술을 아는 만큼 응용할 수 있었으면 한다.

Posted by KIST PR

댓글을 달아 주세요

  1. 표절봇 2018.01.15 15:30 신고  댓글주소  수정/삭제  댓글쓰기

    BRIC View 동향리포트인
    '최근 차세대염기서열분석(NGS) 기술 발전과 향후 연구방향'을
    그대로 베껴서 작성하셨는데
    출처표기 하나 없이 이렇게 해도 되는 건가요?

NGS: sequencing이란 무엇인가?

 

최근 차세대 염기서열 분석법(Next Generation Sequencing: NGS) 기술의 발달과 분석 비용의 하락으로 인해 질병 원인 유전자 분석 연구 외의  다양한 연구 분야에서 NGS가 보편적으로 활용되고 있으며, 의료계 및 산업계에서도 활발하게 사용되어지고 있다. 차세대 염기서열 분석법 이전, 사람의 몸을 구성하고 있는 DNA 서열을 모두 알고자 했던 과학자들은 DNA sequencing 기술을 연구했다. DNA sequencing 기술은 생화학적 방법으로 생명체의 모든 세포의 DNA 사슬을 구성하는 염기 A, T, G, C가 결합된 서열 순서를 분석하는 기술이다. 가장 원초적인 방법으로 Maxam-Gilbert법과 효소적인 방법인 Sanger법이 있다.

 

Maxam-Gilbert
 

출처 : https://binf.snipcademy.com/lessons/dna-sequencing-techniques/maxam-gilbert

Sanger sequencing이 나오기 전 Maxam과 Gilbert가 DNA 염기서열을 분석해내는 기술을 만들어냈다. 이중나선으로 꼬여 있는 DNA를 준비 한 뒤, 온도를 높여 denaturation(변성) 과정을 통해 단일 가닥의 DNA 가닥을 생성하고 5번 말단을 감마-32P를 사용하여 방사성 동위원소의 labelling을 시킨다. 그리고 화학적 반응을 이용해서 DNA 가닥을 특정 염기에서 분해시킨다. 예를 들어 dimethyl sulphate(디메틸 황산)는 선택적으로 purine계열의 A,G 염기를 공격하고 hydrazine(하이드라진)은 선택적으로 pyrimidine계열의 C,T를 공격한다. 그럼 이러한 화학적 시행을 통해서 G, A+G, C 그리고 C+T의 말단을 갖는 DNA가닥이 나눠지게 된다.

 

여기서 잠깐, DNA sequence를 구성하고 있는 염기 A,G,C,T 4가지 중 A,G는 퓨린계 염기, C,T는 피리미딘염기이다.  A+G는 DNA 염기서열에서 A가 있는 염기에서 DNA를 자르는데, 가끔은 G point 에서도 잘리는 것을 말한다.

 

서로 다른 4개의 reaction tube(반응관)에 다른 사이즈의 DNA 가닥을 놓고 고해상도 acrylamide gel(아크릴아미드 겔)을 이용하여 전기영동으로 가닥을 크기별로 분리하고 X-ray 필름을 gel 위에 둬서 방사선을 쏘이면 특정 band들이 보이게 되는데 이곳이 감마-32P로 label되어진 DNA 분자의 위치이다. Sequence는 gel의 밑 부분부터 읽기 시작하며, 4개의 화학 반응의 band pattern을 읽을 때, 예를 들어 G-reaction과 G+A-reaction lane에서 모두 band가 나타났다면 이것은 G 로 읽어야 하고, 만약 G+A-reaction lane에서만 band가 나타났다면 A로 읽어야 한다.

 

Sanger sequencing

생어 염기서열 분석(Sanger sequencing)은 시험관 DNA 복제 중에 DNA 사슬을 마무리 하는 디디옥시뉴클레오티드가 DNA 중합효소에 의해 제한적으로 삽입된다는 원리에 기반한다. 최근에는 많은 양의 생어 염기서열 분석을 대규모로 자동 게놈 분석을 위해 NGS 방법이 진행되고 있으나, 더 작은 규모의 프로젝트와 NGS 결과의 검증, 길이가 긴 연속 DNA 염기서열 분석 (> 500 뉴클레오티드)을 위하여 아직까지 널리 쓰이고 있다.  Sanger sequencing은 고전적인 ‘사슬 종료 방법’을 이용하여 하나의 단일 나선 DNA 주형, DNA 시발체(primer), DNA 중합효소, 보통의 디옥시뉴클레오시드3인산염 (dNTP)와 DNA 나선연장을 종료하는 디-디옥시뉴클레오시드3인산염(ddNTP)를 쟤료로 sequencing을 진행한다.

출처 : https://www.youtube.com/watch?v=593zWZNwbJI

사슬 종료 뉴클레오티드(ddNTP)는 인산이에스테르 결합 형성에 필요한 3'-[OH]가 없어, 삽입되었을 때 DNA 중합효소가 DNA의 연장을 중단하도록 한다. 일반적인 d(A,C,G,T)TP만 넣어주면 DNA 중합효소는 이에 상보적인 DNA를 합성하게 되지만 소량의 dd(A,C,G,T)TP를 섞어주게 된다면, DNA polymerase가 중간에 ddNTP가 끼어 들어간 DNA 분자를 합성되게 된다. 그러면 이러한 분자는 더 이상 길어지지 않고 합성이 중단된다.

출처 : https://binf.snipcademy.com/lessons/dna-sequencing-techniques/sanger-dideoxynucleotide

DNA 샘플은 네 가지 경우로 나누어 dATP, dGTP, dCTP, dTTP는 각 시험관에 모두 첨가하고, 디디옥시뉴클레오티드 (ddATP, ddGTP, ddCTP 또는 ddTTP)는 시험관 4개중 각 1개의 종류만 첨가시켜 DNA 중합효소로 중합시킨다. 시발체에서의 주형 DNA 연장이 여러 차례 이루어지면 생기는 DNA 조각은 열 변성되고 겔 전기 영동 과정을 통해 크기별로 분리된다. 이들 ddNTP에는 각각을 구별할 수 있게 형광물질이 결합되어 있어 새로이 합성된 DNA들의 마지막 염기 종류에 따라 서로 다른 형광을 띄게 된다. 합성된 DNA 분자들은 4개 중의 어느 하나의 ddNTP가 끼어 들어갔으므로 정확히 한 염기씩 길이의 차이가 나게 된다. 이들은 전기 영동법에 의해 크기 순으로 나열할 수 있으며, DNA 띠들은 방사능 촬영이나 UV로 형광물질에 따라 특이적인 파장의 빛을 발하게 되어 순서대로 읽으면 원래 염기서열과 상보적인 서열로 보이게 된다.

 

 

출처 : https://binf.snipcademy.com/lessons/dna-sequencing-techniques/sanger-dideoxynucleotide

 

 

 

 

 

 

 

 

 

 

Whole genome shotgun sequencing

출처 : https://www.slideshare.net/suryasaha/icar-ca-bin-delhi-bioinformatics

shotgun sequencing 기술은 원래 바이러스나 세균과 같은 작은 유전체 sequence를 알기 위해 사용되어졌으나 whole genome shotgun sequencing 기술이 등장하면서 크기가 크고 포유류의 전체 유전체를 서열화 하는데 응용되고있다. 이 기술은 긴 DNA 가닥을 sequencing 하는 방법으로 DNA sequence를 랜덤으로 깨서 작은 조각들을 많이 만들고 오버랩 되는 구역을 찾아서 전체 sequence를 읽어내는 방식이다. shotgun sequencing 기술은 원래 바이러스나 세균과 같은 작은 유전체 sequence를 알기 위해 사용되어졌으나 whole genome shotgun sequencing 기술이 등장하면서 크기가 크고 포유류의 전체 유전체를 서열화 하는데 응용되고있다. 이 기술은 긴 DNA 가닥을 sequencing 하는 방법으로 DNA sequence를 랜덤으로 깨서 작은 조각들을 많이 만들고 오버랩 되는 구역을 찾아서 전체 sequence를 읽어내는 방식이다.

 

Next Generation Sequencing(NGS)
 차세대염기서열분석법 (Next-generation sequencing; Massive parallel sequencing)은 유전체를 무수히 많은 조각으로 나눈 뒤 각각의 염기서열을 조합하여 유전체를 해독하는 분석 방법으로, 2004년 최초로 상용화된 후 현재까지 그 성능이 발전해왔다. Next-generation sequencing (NGS) 또는 Second-generation sequencing로 잘 알려진 차세대 염기서열 분석법은 Massive parallel sequencing을 일컫는 말로, ‘대용량 염기서열 분석법’, ‘대규모 병렬형 염기서열 분석법’으로 번역된다. NGS 분석법은 하나의 유전체를 무수히 많은 조각으로 분해하여 각 조각을 동시에 읽어낸 뒤, 얻은 데이터를 생물 정보학적 기법을 이용해 조합함으로써 방대한 유전체 정보를 빠르게 해독하고자 한다.  차세대 염기서열 분석기법은 2007년 Roche가 처음으로 NGS 장비를 출시한 이후, lllumina Solexa(社), Applied Biosystems(社) 등이 연이어 NGS 장비를 소개하였다. 현재의 Sanger 염기서열 분석 장비는 기껏해야 동시에 수십 개의 전기영동이 가능한 반면,  NGS 염기서열 분석 장비에서는 수십만 내지 수십억 개의 서로 다른 염기서열분석 반응이 동시에 진행되고 판독되어 유전체 분석에 소요되는 비용이 감소하고 있다.  장비마다 차이는 있으나 NGS 염기서열분석 과정은 검체 준비, 클론성 증폭, 염기서열분석의 3단계로 구성된다.

 

NGS 염기서열분석 과정
1) 검체 준비(sample preparation step)
 검체는 분석 대상 (유전체 전체, 엑솜, 특정 염색체 부위, 특정 유전자 조합)에 따라 포획법, 분절법 또는 증폭법 등으로 준비된다. DNA 절편은 읽기 적절한 길이로 준비되고, 여기에 동시 증폭 및 염기서열반응을 위한 adaptor가 결합된다.
2) 클론성 증폭(clonal amplification step)
 준비된 절편을 플레이트 위 일부 공간 또는 droplet(작은 물방울) 안에서 클론으로 증폭시킨다.
3) 염기서열분석(sequencing reaction step)
 클론성 증폭이 이루어진 수십만 내지 수십억 개의 반응산물의 염기서열을 동시에 분석한다. 위 과정은 장비에 따라 1일~1주가 소요되며, 한 번의 분석과정에서 최대 600 Gb의 염기서열 정보를 얻을 수 있다. NGS는 대용량의 정보를 제공할 수 있으므로, 전체 유전체 외에도 특정 유전자 조합 또는 특정 염색체 부위의 염기서열정보를 얻는데 사용될 수 있다.  또한  minor allele을 동시에 분석할 수 있고, 상대적 정량도 가능하므로, 미생물이나 종양처럼 기원이 다른 핵산이 혼합된 경우의 정량적 분석에도 사용될 수 있다.

출처 : http://www.koreahealthlog.com/news/articleView.html?idxno=17862

 

NGS 데이터의 특징
 NGS 데이터가 Sanger 염기서열분석 데이터와 다른 몇 가지 특징이 있는데, 첫 번째는 단일 가닥 염기서열분석(single strand sequencing)이다. Sanger 염기서열분석 데이터는 모든 세포의 DNA 염기서열의 총합으로 표현되는 반면, NGS 데이터는 각 세포에서 유래한 단일가닥 DNA 염기서열이 각각 독립적으로 표현된다. 바꿔 말해, NGS 데이터는 Sanger 데이터보다 polymerase error에 훨씬 취약하다는 약점이 있다. 따라서 NGS 데이터에서 특정 위치의 염기를 최소 몇 번 읽었는지(coverage depth), 염기변이의 빈도가 충분히 높은지가 중요하다.

두 번째, NGS는 대용량 데이터이다. 따라서 Sanger 데이터와 비교가 어려울 정도로 대용량의 정보를 얻을 수 있으나 분석 복잡도가 커서  빠른 속도의 분석 알고리즘이 필요하다.
세 번째, NGS의 기본 데이터 유형은 텍스트파일이다. Sanger에서는 전기영동을 통한 형광 종류별 강도 변화가 기록된 electropherogram이 주어지므로 텍스트 파일 외 각 peak 높이, peak간 간격, peak의 상대적 비율과 변화 등 다양한 정보를 통해 sequencing quality 및 분석소프트웨어의 분석 오류에 대한 직관적 파악이 가능하다. NGS도 장비에서 기록된 신호 데이터가 있지만, 매 사이클마다 한 번씩 형광으로 기록되고 sequencing quality에 대한 직관적 파악이 쉽지 않아 분석 소프트웨어의 분석 오류 발생 시 이를 파악하기가 어렵다.

 

이번 기사에서는 Sequencing의 역사와 차세대염기서열분석법, NGS에 대한 전반적인 준비과정과 데이터 특징들에 대해 알아보았다. 다음 기사에서는 NGS를 응용한 sequencing 방법들을 좀 더 자세히 이야기 하도록 하겠다.

Posted by KIST PR

댓글을 달아 주세요

  1. 표절봇 2018.01.10 15:57 신고  댓글주소  수정/삭제  댓글쓰기

    NGS 파트는
    http://www.koreahealthlog.com/news/articleView.html?idxno=17862
    이 기사의 텍스트를 그대로 베껴서 썼는데
    그림출처만 달아놓고 이렇게 내도 되는 건가요?

혈액을 떠다니는 DNA

 

‘피’라고 불리는 혈액은 몸 안의 세포에 산소와 영양소를 공급하고 세포의 신진대사에 의해 발생하는 이산화탄소와 노폐물을 회수하여 운반하는 체액이다. 혈액은 결합 조직의 한 종류로 고체 성분의 혈구와 액체 성분의 혈장으로 구성되어있다. 혈구는 혈소판과 백혈구, 적혈구로 이루어져 있으며 혈장은 섬유소원과 혈청으로 구성되어있다.

출처 : http://www.skchemicals.com/ls/kor/pharm/info11.html

 우리 눈에 빨간 액체로만 보이는 혈액은 상당히 많은 물질들로 구성되어있고, 전문의들에게 다양한 의학적 정보들을 제공해준다. 특히 혈액검사는 의료 행위 중 질병 유무, 의약품의 효과, 무기질 영양상태, 생화학 및 생리적 상태를 검사하는 등 다양한 분야에 활용되고 있다. 


 이러한 혈액검사방법의 발전은 ‘피 한 방울로 난치병 진단이 가능하다면 얼마나 좋을까?’라는 생각을 현실로 만들었다. 기존의 조직생체검사 방식은 몇 가지 단점이 있다. 일반적으로 암 덩어리의 유전자 염기서열을 분석하면 수많은 돌연변이들이 발견되고, 예상보다 더 넓은 폭의 유전적 다양성이 나타난다. 한쪽 언저리의 암세포는 다른 쪽에 위치한 암세포와 유전적으로 달랐으며 암 덩어리 전체에서 공통된 돌연변이를 갖고 있는 암세포는 고작 30% 정도였다. 따라서 암의 모든 면을 대변해줄 수 없는 한계를 갖고 있는 것이다. 반면 새로운 기술인 액체생검(Liquid Biopsy)은 혈액 한 방울이면 암 진단까지도 가능하다. 액체생검은 혈액뿐 만 아니라 소변이나 침 등 체액 속 DNA에 존재하는 암세포 조각을 찾아 이에 대한 유전자 검사나 분석을 진행하는 기술이다. 조직 검사에 비해 빠르고 간편하며, 종양세포 특유의 돌연변이 등을 분석하기 때문에 ‘거짓 양성’의 가능성이 낮다는 장점이 있다.
☞ 여기서 잠깐! 거짓 양성이란, false positive라 불리며 본래 음성이어야 할 검사 결과가 양성으로 잘못 나오는 것을 얘기한다.

출처 : http://liquid-biopsy.gene-quantification.info/

 또한‘표준생검(Standard biopsy)’과 다르게 액체 생검은 천자나 절개 등의 침습적인 시술 없이 혈액이나 복수 등 체액에 존재하는 암세포 유래 핵산을 분석하는 비침습적인 방법이어서 기존의 침습적인 조직검사 방법의 대안으로 주목받고 있다. 여기에 더해 액체 생검은 환자로부터 비교적 간편하게 체액을 채취하여 암 발생 및 전이 여부를 신속하고 상세하게 파악할 수 있고 유전체 분석 기술의 급속한 발전과 비용 절감으로 빠른 시일 내에 상용화가 될 것으로 기대하고 있다.
 액체 생검의 원리는 다음과 같다. 암세포가 파열되어 사멸하는 경우 그 찌꺼기가 혈류 속으로 방출되는데, 그 속에서 종양의 DNA, 즉 혈류 속을 순환하는 종양 DNA가 포함되어 있다. 이를 cell free DNA(cfDNA) 좀 더 자세히 말해, cell free tumor DNA(ctDNA)라고 부른다. Cell free DNA는  cell에서 유래된 DNA와 같은 핵산들이 자유롭게 혈류 속을 돌아다닌다 하여 불러지게 되었다. 정상적인 세포의 찌꺼기는 대식세포라 불리는 면역계 관련 세포들이 잘 수거하여 처리하지만, 종양은 덩치가 너무 크고 신속히 증식하기 때문에 대식세포의 처리 능력을 넘어서게 된다. 따라서 혈류 속에 떠돌아다니는 ctDNA를 포착할 경우 종양의 동태를 파악하는 결정적 단서를 얻을 수 있다.
 Cell free DNA를 연구 목적으로 이용할 때 두 가지의 주요한 문제점이 있다. 첫 번째는 백혈구로부터 나오는 genomic DNA의 오염 문제이고, 두 번째는 떠다니는 DNA의 양이 미량이라는 것이다. 따라서 혈액을 채집하여 cfDNA를 추출하는 과정이 매우 중요하다.
  이 때 사용되는 간단한 방법이 원심분리다. 환자의 혈액을 채취하여 원심분리를 하게 되면 plasma layer, buffy layer, 적혈구 layer 등 총 3개의 층이 분리된다. Plasma 층에 cell free DNA가 존재 하므로 나머지 층을 다 제거하고 plasma 층만을 분리하여 10,000g 이상의 힘으로 10분간 다시 원심분리를 시켜 남은 cell들과 찌꺼기들을 제거시켜준다. 그리고 plasma 층에 있는 cell free DNA 추출을 위해 –20℃ 이하에서 냉동보관한 후 Qiagen’s QIAamp circulating nucleic acid kit를 이용해 cell free DNA를 추출한다. Plasma층만을 분리한 뒤, 보관할 때에는 STREAK tube를 이용하여 저장한다. 이 tube는 핵산을 보호해 주는 인자들이 포함되어 있어 cell free DNA를 분석하는데 안정적이다. 특히 백혈구로부터의 오염을 보호하고 genomic DNA의 방출을 막아 높은 순도의 cell free DNA를 추출하여 최대 14일까지 보관할 수 있다.

☞ 여기서 잠깐! 원심분리란 축을 중심으로 물질을 회전시켜서 원심력을 가해 혼합물을 밀도에 따라 분리해내는 원리를 말한다. 
 

 위에서 언급한 과정은 다양한 종류의 추출 과정 중 하나이다. Cell free DNA를 추출하는 kit들의 종류도 다양하다. 앞서 언급한 QIAamp circulating nucleic acid kit외에도 ZR Serum DNA kit, Norgen’s plasms/serum cell-free circulating DNA kit, EpiGenTek’s FitAmp kit, Chemagen’s circulating NA kit등이 있다.
 여러 kit들 중에서 cfDNA를 추출하는데에 Qiagen kit가 가장 많이 사용된다. Qiagen 회사의 QIAamp circulating nucleic acid kit는 spin column processing 원리를 이용하여, lyse(용해), bind(묶음), wash(세정), elute(추출) 4가지 단계로 진행된다. 오염물질을 제거할 수 있도록 특수하게 고안되어진 완충기와 막을 사용하여 액체상태의 반응물에서 DNA 절편을 정제한다. DNA를 구성하고 있는 인산염의 음전하로 인해 tube의 막과 고염도 환경에서 화학적 결합이 진행되는 것이 spin-column을 이용한 DNA정제의 기본원리가 된다.
☞ 여기서 잠깐! spin-column은 하단 왼쪽에 있는 tube를 이야기 한다. 

출처 : http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0136133

 

  Spin column 형태이므로 별도의 실험기기 없이 원심분리기만을 사용하여 15분 내에 모든 샘플을 처리할 수 있으며 각종 오염물질을 제거하고, DNA 정제, 제한효소 반응과 같은 효소반응물로부터 다양한 종류의 효소를 제거하고자 할 때 이용된다. 이렇게 하여 얻어진 DNA 절편은 복제와 염기서열분석으로 확인할 수 있으며, Spin-column을 사용한다고 순도가 향상되는 것은 아니고 사용하는 시약의 조건이나 cell의 종류/상태, DNA의 종류/상태, bind(묶음)/wash(세정) 조건 등에 따라 달라질 수 있다.

출처 : http://www.canspecsci.com/pdshowtwo/productshow_6809805.html

그러나 아직 혈액을 활용한 액체생검은 의료현장에서 진정한 의미의 진단으로 인정받고 있지 못하다. 다만 최근 몇 년 차세대염기서열분석(NGS·Next generation sequencing) 등 유전자 분석 기술이 발전하고 비용도 낮아지면서 액체생검 기술들이 다시 떠오르고 있는데 아직 전 세계적으로 초기 단계이며 동반진단용과 조기진단용 기술을 속속 선보이고 있다.   염기서열분석 장비의 대표기업인 미국 일루미나, 국내 지노믹트리, 파나진, 분자진단 기업 씨젠과 유전체 정밀의학 기업 마크로젠 등도 액체생검 시장 진입에 힘쓰고 있다. 많은 학자들이 지속적으로 암이 치료에 반응하는지, 항암제에 내성이 생겼는지, DNA 변이가 발생했는지, 치료 후 암이 재발했는지를 계속적으로 연구하고 있는 만큼 하루빨리 간단한 혈액검사로 진단할 수 있는 시대가 왔으면 한다.

Posted by KIST PR

댓글을 달아 주세요

  1. Dr.정 2017.07.11 12:00 신고  댓글주소  수정/삭제  댓글쓰기

    이 분야 연구자도 아닌데 이 글은 너무 흥미가 ^^ 아니 이 분야가 아니라 그런건가
    그래서 타이틀이 취향저격인가요 ㅎ

  2. 김미연 2017.07.21 11:20 신고  댓글주소  수정/삭제  댓글쓰기

    재미있게 보셨다니 정말 감사합니다! 다음 기사는 더 흥미로운 주제로 찾아뵐께요:)

  3. 고독한dna쟝 2017.08.28 17:21 신고  댓글주소  수정/삭제  댓글쓰기

    글 잘 보았습니다. 마이크로바이움과 풀디앤에이시퀀싱을 합친 퓨전 정밀의료도 있는 지 궁금하네요 선천적. 후천적 모두를...쿨럭