유전체 분석 연구 데이터의 활용 극대화 위해 퀀텀 솔루션 적용...고성능, 확장성, 안전성, 관리 편의성 제공

 

극지연구소는 스토어넥스트를 활용하여 실제로 1개 생물의 유전체 분석을 위해 기본 정보 300GB의 100배인 30TB이 분석 데이터를 스토리지에 안정적으로 저장하고 필요 시에 시스템 부하 없이 빠르게 액세스하여 사용하고 있다. 특히 스토어넥스트는 총 144TB 용량을 제공하여 다중 작업이나 복잡한 생물의 유전체 분석 시에 생성되는 빅데이터들도 안정적으로 저장할 수 있도록 지원한다.

극지 활동을 위한 인프라 구축과 연구 주도로 국제적인 극지 전문기관으로 발돋움
극지연구소는 극지 활동을 위한 인프라를 구축하고 극지 연구를 주도해 국제적 경쟁력을 갖추기 위해 한국해양과학기술원(전 한국해양연구원) 부설로 설립된 우리나라의 극지 연구 전문기관이다. 지난 1986년 우리나라가 세계 33번째로 남극조약에 가입하며 극지 연구기관의 필요성이 떠올라 1987년 3월 당시 한국해양연구소에 신설한 극지연구실이 모태다.

1988년 남극세종기지 준공을 주도했으며 1990년 극지연구센터로 확대 개편됐다. 2002년 4월 북극다산기지를 개설했으며 2004년 4월 16일 한국해양과학기술원 부설 극지연구소로 독립했다. 2009년 한국 최초의 쇄빙연구선인 아라온호를 건조하여, 이를 타고 남극과 북극의 기지에 직접 접근할 수 있는 기반을 확립했다. 이후 2010년 남극 제2기지인 장보고기지를 건설하기 위한 연구 조사에 착수해 2014년 완공예정이다.

극지연구소는 우리나라 유일의 극지 연구기관으로서 남극조약협의당사국(ATCP), 국제남극과학위원회(SCAR), 국제북극과학위원회(IASC) 등 관련 국제기구에 적극 참여하며, 권위 있는 국제학술지에 극지 연구 성과를 발표하는 등 국제적 지명도를 얻고 있다. 내부에 극지기후연구부, 극지지구시스템연구부, 극지생명과학연구부를 두고 극지환경 변화를 관측하고, 해양생물 자원과 생태계를 조사하며, 극지 빙하와 대기환경, 극한지 유용 생물자원을 연구하고 있다. 최근 급격한 기후변화와 관련해 과거 지구환경의 변화를 유추할 수 있는 다양한 정보를 간직한 빙하 연구에도 힘을 쏟고 있다. 내부 인프라로 남극세종과학기지, 북극다산과학기지, 쇄빙연구선 아라온호를 보유하고 있으며, 남극 제2기지인 장보고 기지 설립을 위한 대륙기지건설단도 운영하고 있다.

▲ 대용량 데이터 아카이빙 솔루션 ‘스토어넥스트(StorNext) 5’
유전체 분석 데이터의 가치를 높이기 위해, 빅데이터 아카이빙 시스템 구축 나서
극지연구소는 극지생물의 기능 유전체 연구를 통한 극지 고유 생명 현상을 규명하고, 극지생물의 오믹스(특정 세포 속에 들어 있는 생리현상과 관련된 대사에 대한 대량의 정보(전사체, 단백질체, 형질체 등)를 통합적으로 분석해 생명현상 규명) 연구에 나서고 있다. 이를 통해, 극지생태계의 형성과 진화는 물론 극지생물의 고유 생명현상(극한환경 적응, 진화) 특성을 이해함으로써 지구생명의 탄생과 진화의 기원을 추정함으로써, 국제적으로도 극지유전체연구 분야를 선도하고 있다.

이러한 유전체 분석 작업은 불과 10년 전만해도 유전자의 염기서열을 분석하는 데에는 9~10년이 소요됐다. 그러나 차세대 유전자 염기서열 분석기술인 NGS(Next Generation Sequencing)가 지난 2004년에 상용화되면서 인간이나 작물과 같이 상대적으로 고등생물의 경우에도 몇 달이면 전체 유전체 해독이 가능할 정도로 이제는 훨씬 쉽고 빠르게 저비용으로 대용량의 시퀀싱(sequencing: 서열 분석)이 가능해졌다

하지만 이러한 시퀀싱을 통해 해독한 DNA의 염기서열 자체는 DNA를 구성하는 염기인 A, T, G, C가 어떤 순서로 배열됐는지 그 서열순서를 하나하나 밝혀낸 데이터로서, 그 자체가 유용한 정보는 아니다. 예를 들어 인간의 유전체는 30억 쌍의 염기서열로 구성되어 있으며, 보통 이를 분석하기 위해 얻은 중간 데이터는 그 수십, 수백 배가 필요해, 데이터량 자체가 매우 크다. 이 데이터들 중에 의미 있는 데이터를 추출하여 인간의 유전적 특성이나 질병 등의 정보를 얻기 위는 컴퓨팅 작업이 필수적이다.

이에 극지연구소는 유전체 분석 데이터를 보다 안전하게 관리하고 데이터 활용도를 높이기 위하여 기존 총 50TB 용량의 NAS(네트워크 스토리지) 3개에 분산되어 저장되어 있던 데이터들을 통합 관리하고 용량을 추가 증설하는 빅데이터 아카이빙(원본 데이터의 저장 및 관리) 시스템 구축 사업을 추진했다. 특히 유전체 분석이 전세계적으로 진행이 되면서 다양한 연구 성과인 R&D 데이터들을 보다 안정적으로 관리하고 활용하는 것이 절실했다.

극지연구소는 유전체 분석 자료 보관을 위한 스토리지 시스템을 144TB규모로 구축하고 유전체 분석 빅데이터들을 안정적으로 보관하고 활용하기 위해, 장기간 데이터 보관과 안정적인 운영이 가능한 테이프 방식의 백업 솔루션을 검토했다.

이에 극지연구소는 향후 스토리지 추가 증설이 용이한 높은 확장성을 제공하고, 사용 편리성은 몰론, 안정적이고 빠르게 데이터를 액세스하여 활용할 수 있도록 빠른 처리 속도, 가격 대비 성능 등 다양한 사항들을 종합적으로 고려하여 최종적으로 퀀텀의 빅데이터 공유 및 아카이빙 스토리지인 ‘스토어넥스트(StorNextⓇ)’를 도입하기로 결정했다. 특히 StorNext Gateway Server(G302)를 통한 Network 기반의 고성능 데이터 엑세스를 보장하고, 전용 메타데이터 컨트롤러 서버(MDC)와 QX-1200 Disk를 사용하여 SAN 기반의 공유 스토리지의 성능과 확장성을 고려하여 제품을 선정하였다.

극지연구소 책임연구원인 박현 박사는 “NGS(Next Generation Sequencing) 기술 바탕으로 유전학이나 의료 서비스 등의 관련 시장의 성장을 이끄는 핵심 요소로서 유전체 분석 데이터 관리의 중요성도 높아지고 있다”고 말하고, “이에 유전체 분석 데이터들을 보다 안정적으로 관리하고 활용할 수 있도록, 성능과 가격, 시스템 신뢰성, 기술 지원, 확장 용이성 등을 종합적으로 고려하여 스토어넥스트를 선택했다”라고 말했다.

퀀텀 스토어넥스트, 안정적인 빅데이터 관리 및 파일 공유 기능
극지연구소는 스토어넥스트를 활용하여 일년에 4개 이상의 유전체 분석 업무를 수행하고 있다. 실제로 1개 생물의 유전체 분석을 위해 기본 정보와 중간처리과정의 데이터등의 수십TB의 분석 데이터를 스토리지에 안정적으로 저장하고 필요 시에 시스템 부하 없이 빠르게 액세스하여 사용하고 있다. 특히 스토어넥스트는 총 144TB 용량을 제공하여 다중 작업이나 복잡한 생물의 유전체 분석 시에 생성되는 빅데이터들도 안정적으로 저장할 수 있도록 지원한다.

퀀텀의 스토어넥스트(StorNextⓇ)는 우수한 데이터 관리 및 파일 공유 기능을 제공하며 추가 증설이 용이한 높은 확장성 및 데이터 보호 성능을 제공한다. 또한 스토어넥스트 G300 게이트웨이는 고속의 가상 이더넷 액세스 네트워킹 기술을 사용하여 빠른 데이터 전송 및 액세스를 지원한다.

극지연구소 책임연구원인 박현 박사는 “지금까지 전세계적으로 실제로 유전체 정보가 분석된 고등생물은 50여종에 불과하다. 유전체 분석 기술의 발전으로 극지 생물뿐만 아니라 지구의 수많은 생물들의 유전체 특성을 분석하여 의미 있는 정보로 만들어 가면서 인류 발전에 이바지할 수 있는 토대를 마련할 수 있을 것으로 기대된다. 이러한 작업을 위해 도입된 퀀텀의 스토어낵스트는 고성능과 안정성, 높은 확장성을 제공함은 물론, 대용량 데이터를 필요 시에 바로 확인해 사용 가능하고, 관리 또한 용이한 최적의 솔루션이다”라고 만족을 표했다.

빅데이터 아카이빙 스토리지 추가 도입 및 원격지 백업 추진 계획
극지연구소는 향후 유전체 분석 연구 데이터의 증가에 맞춰 추가적으로 빅데이터 아카이빙 스토리지를 추가로 도입할 계획이다. 또한 장기적으로는 데이터의 중요도를 고려하여 원격지에 주요 데이터를 소산(분사 저장)하는 것도 계획하고 있다.

  도입 솔루션
- SNFS (StorNext file system)
- StorNext G302
- StorNext QX1200

  주요 혜택
- 분석 데이터를 스토리지에 안정적으로 저장하고 필요 시에 시스템 부하 없이 액세스해 사용
- 다중 작업이나 복잡한 생물의 유전체 분석 시에 생성되는 빅데이터도 안정적으로 저장 

임영규 기자
저작권자 © 데일리그리드 무단전재 및 재배포 금지