NGS: sequencing이란 무엇인가?

 

최근 차세대 염기서열 분석법(Next Generation Sequencing: NGS) 기술의 발달과 분석 비용의 하락으로 인해 질병 원인 유전자 분석 연구 외의  다양한 연구 분야에서 NGS가 보편적으로 활용되고 있으며, 의료계 및 산업계에서도 활발하게 사용되어지고 있다. 차세대 염기서열 분석법 이전, 사람의 몸을 구성하고 있는 DNA 서열을 모두 알고자 했던 과학자들은 DNA sequencing 기술을 연구했다. DNA sequencing 기술은 생화학적 방법으로 생명체의 모든 세포의 DNA 사슬을 구성하는 염기 A, T, G, C가 결합된 서열 순서를 분석하는 기술이다. 가장 원초적인 방법으로 Maxam-Gilbert법과 효소적인 방법인 Sanger법이 있다.

 

Maxam-Gilbert
 

출처 : https://binf.snipcademy.com/lessons/dna-sequencing-techniques/maxam-gilbert

Sanger sequencing이 나오기 전 Maxam과 Gilbert가 DNA 염기서열을 분석해내는 기술을 만들어냈다. 이중나선으로 꼬여 있는 DNA를 준비 한 뒤, 온도를 높여 denaturation(변성) 과정을 통해 단일 가닥의 DNA 가닥을 생성하고 5번 말단을 감마-32P를 사용하여 방사성 동위원소의 labelling을 시킨다. 그리고 화학적 반응을 이용해서 DNA 가닥을 특정 염기에서 분해시킨다. 예를 들어 dimethyl sulphate(디메틸 황산)는 선택적으로 purine계열의 A,G 염기를 공격하고 hydrazine(하이드라진)은 선택적으로 pyrimidine계열의 C,T를 공격한다. 그럼 이러한 화학적 시행을 통해서 G, A+G, C 그리고 C+T의 말단을 갖는 DNA가닥이 나눠지게 된다.

 

여기서 잠깐, DNA sequence를 구성하고 있는 염기 A,G,C,T 4가지 중 A,G는 퓨린계 염기, C,T는 피리미딘염기이다.  A+G는 DNA 염기서열에서 A가 있는 염기에서 DNA를 자르는데, 가끔은 G point 에서도 잘리는 것을 말한다.

 

서로 다른 4개의 reaction tube(반응관)에 다른 사이즈의 DNA 가닥을 놓고 고해상도 acrylamide gel(아크릴아미드 겔)을 이용하여 전기영동으로 가닥을 크기별로 분리하고 X-ray 필름을 gel 위에 둬서 방사선을 쏘이면 특정 band들이 보이게 되는데 이곳이 감마-32P로 label되어진 DNA 분자의 위치이다. Sequence는 gel의 밑 부분부터 읽기 시작하며, 4개의 화학 반응의 band pattern을 읽을 때, 예를 들어 G-reaction과 G+A-reaction lane에서 모두 band가 나타났다면 이것은 G 로 읽어야 하고, 만약 G+A-reaction lane에서만 band가 나타났다면 A로 읽어야 한다.

 

Sanger sequencing

생어 염기서열 분석(Sanger sequencing)은 시험관 DNA 복제 중에 DNA 사슬을 마무리 하는 디디옥시뉴클레오티드가 DNA 중합효소에 의해 제한적으로 삽입된다는 원리에 기반한다. 최근에는 많은 양의 생어 염기서열 분석을 대규모로 자동 게놈 분석을 위해 NGS 방법이 진행되고 있으나, 더 작은 규모의 프로젝트와 NGS 결과의 검증, 길이가 긴 연속 DNA 염기서열 분석 (> 500 뉴클레오티드)을 위하여 아직까지 널리 쓰이고 있다.  Sanger sequencing은 고전적인 ‘사슬 종료 방법’을 이용하여 하나의 단일 나선 DNA 주형, DNA 시발체(primer), DNA 중합효소, 보통의 디옥시뉴클레오시드3인산염 (dNTP)와 DNA 나선연장을 종료하는 디-디옥시뉴클레오시드3인산염(ddNTP)를 쟤료로 sequencing을 진행한다.

출처 : https://www.youtube.com/watch?v=593zWZNwbJI

사슬 종료 뉴클레오티드(ddNTP)는 인산이에스테르 결합 형성에 필요한 3'-[OH]가 없어, 삽입되었을 때 DNA 중합효소가 DNA의 연장을 중단하도록 한다. 일반적인 d(A,C,G,T)TP만 넣어주면 DNA 중합효소는 이에 상보적인 DNA를 합성하게 되지만 소량의 dd(A,C,G,T)TP를 섞어주게 된다면, DNA polymerase가 중간에 ddNTP가 끼어 들어간 DNA 분자를 합성되게 된다. 그러면 이러한 분자는 더 이상 길어지지 않고 합성이 중단된다.

출처 : https://binf.snipcademy.com/lessons/dna-sequencing-techniques/sanger-dideoxynucleotide

DNA 샘플은 네 가지 경우로 나누어 dATP, dGTP, dCTP, dTTP는 각 시험관에 모두 첨가하고, 디디옥시뉴클레오티드 (ddATP, ddGTP, ddCTP 또는 ddTTP)는 시험관 4개중 각 1개의 종류만 첨가시켜 DNA 중합효소로 중합시킨다. 시발체에서의 주형 DNA 연장이 여러 차례 이루어지면 생기는 DNA 조각은 열 변성되고 겔 전기 영동 과정을 통해 크기별로 분리된다. 이들 ddNTP에는 각각을 구별할 수 있게 형광물질이 결합되어 있어 새로이 합성된 DNA들의 마지막 염기 종류에 따라 서로 다른 형광을 띄게 된다. 합성된 DNA 분자들은 4개 중의 어느 하나의 ddNTP가 끼어 들어갔으므로 정확히 한 염기씩 길이의 차이가 나게 된다. 이들은 전기 영동법에 의해 크기 순으로 나열할 수 있으며, DNA 띠들은 방사능 촬영이나 UV로 형광물질에 따라 특이적인 파장의 빛을 발하게 되어 순서대로 읽으면 원래 염기서열과 상보적인 서열로 보이게 된다.

 

 

출처 : https://binf.snipcademy.com/lessons/dna-sequencing-techniques/sanger-dideoxynucleotide

 

 

 

 

 

 

 

 

 

 

Whole genome shotgun sequencing

출처 : https://www.slideshare.net/suryasaha/icar-ca-bin-delhi-bioinformatics

shotgun sequencing 기술은 원래 바이러스나 세균과 같은 작은 유전체 sequence를 알기 위해 사용되어졌으나 whole genome shotgun sequencing 기술이 등장하면서 크기가 크고 포유류의 전체 유전체를 서열화 하는데 응용되고있다. 이 기술은 긴 DNA 가닥을 sequencing 하는 방법으로 DNA sequence를 랜덤으로 깨서 작은 조각들을 많이 만들고 오버랩 되는 구역을 찾아서 전체 sequence를 읽어내는 방식이다. shotgun sequencing 기술은 원래 바이러스나 세균과 같은 작은 유전체 sequence를 알기 위해 사용되어졌으나 whole genome shotgun sequencing 기술이 등장하면서 크기가 크고 포유류의 전체 유전체를 서열화 하는데 응용되고있다. 이 기술은 긴 DNA 가닥을 sequencing 하는 방법으로 DNA sequence를 랜덤으로 깨서 작은 조각들을 많이 만들고 오버랩 되는 구역을 찾아서 전체 sequence를 읽어내는 방식이다.

 

Next Generation Sequencing(NGS)
 차세대염기서열분석법 (Next-generation sequencing; Massive parallel sequencing)은 유전체를 무수히 많은 조각으로 나눈 뒤 각각의 염기서열을 조합하여 유전체를 해독하는 분석 방법으로, 2004년 최초로 상용화된 후 현재까지 그 성능이 발전해왔다. Next-generation sequencing (NGS) 또는 Second-generation sequencing로 잘 알려진 차세대 염기서열 분석법은 Massive parallel sequencing을 일컫는 말로, ‘대용량 염기서열 분석법’, ‘대규모 병렬형 염기서열 분석법’으로 번역된다. NGS 분석법은 하나의 유전체를 무수히 많은 조각으로 분해하여 각 조각을 동시에 읽어낸 뒤, 얻은 데이터를 생물 정보학적 기법을 이용해 조합함으로써 방대한 유전체 정보를 빠르게 해독하고자 한다.  차세대 염기서열 분석기법은 2007년 Roche가 처음으로 NGS 장비를 출시한 이후, lllumina Solexa(社), Applied Biosystems(社) 등이 연이어 NGS 장비를 소개하였다. 현재의 Sanger 염기서열 분석 장비는 기껏해야 동시에 수십 개의 전기영동이 가능한 반면,  NGS 염기서열 분석 장비에서는 수십만 내지 수십억 개의 서로 다른 염기서열분석 반응이 동시에 진행되고 판독되어 유전체 분석에 소요되는 비용이 감소하고 있다.  장비마다 차이는 있으나 NGS 염기서열분석 과정은 검체 준비, 클론성 증폭, 염기서열분석의 3단계로 구성된다.

 

NGS 염기서열분석 과정
1) 검체 준비(sample preparation step)
 검체는 분석 대상 (유전체 전체, 엑솜, 특정 염색체 부위, 특정 유전자 조합)에 따라 포획법, 분절법 또는 증폭법 등으로 준비된다. DNA 절편은 읽기 적절한 길이로 준비되고, 여기에 동시 증폭 및 염기서열반응을 위한 adaptor가 결합된다.
2) 클론성 증폭(clonal amplification step)
 준비된 절편을 플레이트 위 일부 공간 또는 droplet(작은 물방울) 안에서 클론으로 증폭시킨다.
3) 염기서열분석(sequencing reaction step)
 클론성 증폭이 이루어진 수십만 내지 수십억 개의 반응산물의 염기서열을 동시에 분석한다. 위 과정은 장비에 따라 1일~1주가 소요되며, 한 번의 분석과정에서 최대 600 Gb의 염기서열 정보를 얻을 수 있다. NGS는 대용량의 정보를 제공할 수 있으므로, 전체 유전체 외에도 특정 유전자 조합 또는 특정 염색체 부위의 염기서열정보를 얻는데 사용될 수 있다.  또한  minor allele을 동시에 분석할 수 있고, 상대적 정량도 가능하므로, 미생물이나 종양처럼 기원이 다른 핵산이 혼합된 경우의 정량적 분석에도 사용될 수 있다.

출처 : http://www.koreahealthlog.com/news/articleView.html?idxno=17862

 

NGS 데이터의 특징
 NGS 데이터가 Sanger 염기서열분석 데이터와 다른 몇 가지 특징이 있는데, 첫 번째는 단일 가닥 염기서열분석(single strand sequencing)이다. Sanger 염기서열분석 데이터는 모든 세포의 DNA 염기서열의 총합으로 표현되는 반면, NGS 데이터는 각 세포에서 유래한 단일가닥 DNA 염기서열이 각각 독립적으로 표현된다. 바꿔 말해, NGS 데이터는 Sanger 데이터보다 polymerase error에 훨씬 취약하다는 약점이 있다. 따라서 NGS 데이터에서 특정 위치의 염기를 최소 몇 번 읽었는지(coverage depth), 염기변이의 빈도가 충분히 높은지가 중요하다.

두 번째, NGS는 대용량 데이터이다. 따라서 Sanger 데이터와 비교가 어려울 정도로 대용량의 정보를 얻을 수 있으나 분석 복잡도가 커서  빠른 속도의 분석 알고리즘이 필요하다.
세 번째, NGS의 기본 데이터 유형은 텍스트파일이다. Sanger에서는 전기영동을 통한 형광 종류별 강도 변화가 기록된 electropherogram이 주어지므로 텍스트 파일 외 각 peak 높이, peak간 간격, peak의 상대적 비율과 변화 등 다양한 정보를 통해 sequencing quality 및 분석소프트웨어의 분석 오류에 대한 직관적 파악이 가능하다. NGS도 장비에서 기록된 신호 데이터가 있지만, 매 사이클마다 한 번씩 형광으로 기록되고 sequencing quality에 대한 직관적 파악이 쉽지 않아 분석 소프트웨어의 분석 오류 발생 시 이를 파악하기가 어렵다.

 

이번 기사에서는 Sequencing의 역사와 차세대염기서열분석법, NGS에 대한 전반적인 준비과정과 데이터 특징들에 대해 알아보았다. 다음 기사에서는 NGS를 응용한 sequencing 방법들을 좀 더 자세히 이야기 하도록 하겠다.

Posted by KIST PR

댓글을 달아 주세요

  1. 표절봇 2018.01.10 15:57 신고  댓글주소  수정/삭제  댓글쓰기

    NGS 파트는
    http://www.koreahealthlog.com/news/articleView.html?idxno=17862
    이 기사의 텍스트를 그대로 베껴서 썼는데
    그림출처만 달아놓고 이렇게 내도 되는 건가요?

 

[YTN 사이언스] 복잡한 뇌 신경회로, 실험실에서 배양 성공

 

뇌 속 복잡한 신경회로를 실험실에서 구현할 수 있는 기술이 개발됐습니다. 한국과학기술연구원은 콜라겐 섬유를 특정 방향으로 정렬해 신경세포를 3차원으로 배양하는 기술을 세계 최초로 개발했습니다. 연구팀은 뇌의 '해마'에서 추출한 신경세포들을 신경회로의 구조에 맞게 배열한 콜라겐에 심은 결과, 신경세포들이 콜라겐을 따라 성장하면서 실제와 동일한 신경회로가 만들어졌다고 밝혔습니다. 이렇게 배양을 통해 만들어진 신경회로들은 알츠하이머병이나 파킨슨병 등 비정상 상태의 신경회로를 다시 구축하는데 적용할 수 있을 것으로 연구팀은 보고 있습니다.

 

[YTN 사이언스 방송보기]

 

[다른 언론사의 보도내용이 궁금하시면 아래의 언론사 명을 클릭하세요]

한국경제

동아일보 

아시아경제 

조선비즈 

연합뉴스 

서울경제 

대전일보 

 KBS뉴스

디지털타임스 

대덕넷 

IT조선 

전자신문 

 

 

Posted by KIST PR

댓글을 달아 주세요

 

 

 

안녕하세요! 한국과학기술연구원 서포터즈 5기 김용민, 최나영입니다!  앞으로 활동기간동안 여러분과 만날 수 있게 되어 너무 기쁩니다!  저희는 KIST인들이 어떤 연구를 하는지부터 시작해서 KIST인이 된 계기, 배경뿐만 아니라 취미까지! 그야말로 KIST인들의 머리부터 발끝까지 알아볼 예정입니다.  저희가 이번에 처음으로 만나본 KIST인은 바로 뇌과학분야와 로보틱스분야의 융합에 선두에 계신 ’바이오마이크로시스템연구단의 양성욱 박사님’이십니다!!(짝짝)
양성욱 박사님은 초소형 로봇을 이용한 바이오 분야나 의료분야에 관련된 응용연구를 수행하고 계시는 데요. 먼저 영상으로 만나보시죠!

 
Q1. 안녕하세요! 박사님, 먼저 간단하게 자기소개 부탁드립니다!

 

저는 바이오마이크로시스템연구단 양성욱입니다. 현재는 초소형 로봇을 이용한 바이오 분야나 의료분야에 관련된 응용연구를 수행하고 있습니다.  KIST는 2006년부터 2010년까지 있다가 2010년부터 2015년까지는 카네기멜런대학교에서 로보틱스 분야 박사학위를 전공하고 2015년에 복직해서 근무하고 있습니다.

 

Q2. 로보틱스를 전공하신 박사님께서 초소형 로봇 기술을 이용해 뇌과학분야에 도전하신 것이 굉장히 흥미롭습니다.  이렇게 다른 분야를 선택하게 되신 배경에는 어떤 일들이 있었나요?

 

기본적으로 관심이 있었던 분야는 기계와 전기&전자 분야였습니다.  그래서 관련된 실험실에 들어갔고 새롭게 정밀 광학측정 시스템을 구축하는 연구를 하였습니다.  연구를 위해서 과학 분야, 시스템에 관련된 프로그램을 공부하게 되면서 분야가 조금씩 변했습니다.  더욱이 KIST에서는 마이크로 로봇형태인 심장 세포를 올려놓으면 기어가는 초소형로봇을 본격적으로 연구하였습니다.  박사학위 들어가서는 컴퓨터 사이언스와 가까운 조금 더 제어 적인 연구들을 결합하면서 조금씩 분야가 변해간 것 같습니다. 
 

Q3. 박사님께서는 로보틱스를 전공하셨고, 다른 박사님들도 전기전자공학, 재료공학으로 연구 개발 응용 분야를 뇌과학/신경과학과의 새로운 접목을 꾀한 것은 대단히 도전적인 시도라고 생각하는데요. 뇌과학연구소 참여 초기에는 상이한 전공자들 간의 소통에 애로 사항들이 종종 있었다고 들었습니다. 어떤 애로 사항들이 있었나요?

 

가장 문제가 되었던 것은 기본적으로 서로 가지고 있는 백그라운드와 쓰고 있던 용어가 달라서 소통하는 데 어려움이 있었다는 점입니다.  두 번째로는 공학 분야와 기초과학 분야의 연구방법이 달라 접근방식이 다르다는 점이었습니다.  저희 쪽에서는 주로 사회에 흩어져 있는 문제를 해결해 내는 과정인데, 기초과학을 연구하시는 분들은 세상에 알려지지 않은 문제들을 밝히기 위하여 가정을 새우고 실험을 통하여 풀어내 가는 방법론적인 차이가 있어요.  같이 연구를 하게 되면서 서로 이해하고 보조해주는 역할을 하기 위해 서로가 노력 하고 있습니다.

 

Q4. 뇌신경과학 분야에서 초소형 로봇 기술은 기존의 방법과 비교해 어떤 장점이 있을까요? 

 

뇌신경과학 분야에서 초소형 로봇 기술은 기존에는 뇌를 이해하기 위해서 생체정보를 수집하고 해석하는데 초점이 맞춰져 있었어요.  근데 이제는 그것을 뛰어넘어서 컨트롤하고 변환해서 동작을 수행 할 수 있도록 하고 있습니다.  예를 들어서 쥐의 머리위에 초소형 로봇을 올려놓고 뇌 신호를 제어해 움직임을 컨트롤 할 수 있는 연구를 진행중입니다.
또한 예전에는 뇌신호를 분석하기 위해 사람의 컨트롤로 쥐의 머리위에 전극을 삽입하는 힘든 작업을 하였는데, 지금은 로봇이 그런 과정을 대신 하기 때문에 동물입장에서도, 인간입장에서도 편하게 연구를 할 수 있게 되었습니다.  

 

Q5. 뇌 신경신호 측정을 위한 전극 이동용 마이크로 매니퓰레이터를 발명하셨다고 하는데, 마이크로 매니퓰레이터에 대해 설명 부탁드립니다!

먼저 마이크로 매니퓰레이터를 이용해 머리에 전극을 이식해서 생체정보를 뽑아냅니다.  뽑아낸 정보를 통해 어떻게 움직이겠다, 어디로 움직이겠다는 것을 기기학습을 통해 인식시킵니다.  인식된 학습을 바탕으로 생각만으로 로봇을 움직일 수 있게 하는 것이 마이크로 매니퓰레이터의 주요 기능입니다.  이를 통해 전신마비환자도 생각만으로 몸을 움직일 수 있게 하도록 신경을 제어할 수 있습니다. 
그런데 이런 기계 하나에도 수 많은 기술들이 들어가게 됩니다. 신경신호를 분석할 수 있는 기술, 컴퓨터 사이언스에서 알고리즘을 생성하는 기술, 전극이 생체내에 들어갔을 때 안정적이게 하는 생체적합성 기술, 기계를 지고 다닐 수 있게 초소형으로 만들 수 있는 기술등이 복합적으로 작용한다고 보면 됩니다. 

 

Q6. 2015년도 IEEE/ASME Transactions on Mechatronics 저널에 출판한 논문으로 2016년도 IEEE/ASME Best Mechatronics Paper Award를 지난 6월 20일에 수상하였습니다만, 박사님 논문의 간략한 컨셉과 수상을 하게된 계기가 어떠한 부분이라고 혹시 생각하시는지요?

기존에 논문은 큰 시스템에 관련된 것은 많지만, 초소형화 시스템에 걸맞은 알고리즘은 별로 없었습니다.  현재 상용화되어있는 큰 것을 초소형화 시켜 동작하기 위해서는 기능적으로 고려할 것들이 많습니다.  소형모터들은 힘이 약하고 센서를 가져다 쓰기도 어렵습니다.  그래서 이 논문에는 단순히 크기만 소형화하는 것이 아니라 초소형 모터들의 작은 힘을 고려해서 어떻게 구조를 만들면 최대의 힘을 낼 수 있을지 크기, 길이를 최적화하는 내용이 담겨있습니다.  이런 디자인을 최적화하는 기술을 통해서 초소형 모터에 기반을 둔 최적화 설계 알고리즘을 기반으로 매니퓰레이터 디자인하고 성능 검증하는 내용을 담고 있습니다.

 

Q7. KIST에 들어온 계기는 무엇이며, KIST의 융합연구는 어떻게 시작 된 것인가요?

서울대학교에서 학부 석사를 마치고 병역특례를 하기 위해서 KIST에 들어왔습니다.  병역특례 기간보다 조금 더 있으면서 몸속을 기어가는 내시경 로봇을 만들었는데, KIST의 융합연구는 그때부터 시작되었습니다.  기본적으로 몸에 들어갈 수 있는 로봇을 개발하기 위해서는 기계 자체가 작아질 수밖에 없습니다. 그래서 ‘초소형 바이오 마이크로 시스템과 뇌과학 분야를 합쳐 시너지를 내자‘라는 움직임이 있었습니다.  그 일환 중에 하나로 ’동물의 움직임에서 센서를 만들어 내는 것‘, ’몸에 붙이는 센서를 만드는 것‘과 같은 다양한 융합연구가 시작된 것입니다. 해외 어디를 봐도 KIST처럼 융합연구를 하기 적합한 곳은 별로 없는 것 같아요.

 

Q8. 향후 초소형 로봇기술은 어떤 곳에 쓰이고, 어느 정도까지 변화가 있을 것으로 생각하시나요?

로보틱스라는 학문 자체가 융합연구이기 때문에 로봇이 적용되는 분야는 다양할 수 있습니다.  초소형 로봇기술은 Cell Manipulation에 적용될 수 있고, MIcro patterning쪽에도 적용할 수 있습니다.  제가 생각하고 있는 로봇 분야는 사람처럼 동작하는 것뿐만 아니라 사람이 제어하는 것의 한계를 극복할 수 있는 로봇입니다.  아직 바이오, 의학 분야에는 인체의 한계 때문에 탐구하지 못하는 분야가 있으므로 초소형로봇기술을 이용한다면 새로운 문제를 풀어나갈 수 있을 것입니다.

 

Q9. 박사님께서 생각하는 좋은 연구는 뭐라고 생각하세요?

대학원을 진학하는 과정에서 내가 어떤 분야를 잘할 수 있고, 부족한 분야는 어떻게 메이크업을 해야 내가 생각 하는 것을 구연할 수 있을지, 만들 수 있을지 생각하게 됩니다.  그런 과정에서 연구는 경쟁적 일수밖에 없습니다.  좋은 연구는 사회적 연구 의미가 있는 연구일 수도 있고 경쟁적으로는 세계적으로 살아남는 연구들일 수도 있습니다.  경쟁적이라는 것이 싸우고 좋은 성과를 내고 이런 것이 아니라 이제는 연구의 눈높이를 텍스트가 아닌 같이 연구하는 연구원들과 눈높이를 만들 수 있도록 하는 것이 노력하는 것이라고 생각합니다.

 
Q10. 박사님처럼 여러 분야의 학문을 접목시켜 연구하기 위해 꿈을 키워가는 청년들에게 해주고 싶으신 말이 있나요?

기회가 된다면 다른 분야의 공부를 접할 수 있었으면 좋겠습니다.  다른 분야의 공부를 시작할 때 나보다 오래 공부한 사람들보다 잘할 수 있을까? 라는 물음표를 던지기보다는 도전하는 것을 두려워하지 않았으면 좋겠습니다. 제가 주변에서 성공하시는 분들을 봤을 때는 분야를 바꿀 때 어려움이 많지만, 주변에 노력으로 허들을 뛰어넘은 분들이 많습니다. 본인이 새로운 것에 대해 도전하는 두려움이 없는 것이 가장 중요할 것 같습니다.

 

 

Posted by KIST PR

댓글을 달아 주세요