농촌진흥청 국립축산과학원 동물유전체과 박종은 농업연구사
농촌진흥청 국립축산과학원
동물유전체과 박종은 농업연구사

굳이‘알파고’와 이세돌의 바둑 대결을 언급하지 않더라도, 인공지능(AI)은 이미 대중들에게 친숙한 단어가 되었다.

IBM이 개발한 종양학 의사 ‘왓슨’, 아마존의 계정보호를 위한 ‘가드듀티’, 테슬라의 주행보조시스템‘오토파일럿’, 삼성전자 스마트폰에 탑재된 AI비서 ‘빅스비’ 등 인공지능 사례들은 쉽게 찾아볼 수 있다.

인공지능은 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현하고자 하는 기술이다. 인공지능의 한 분야인 머신러닝(기계학습, Machine Learning)은 사람이 학습하듯이 컴퓨터에 데이터를 학습시켜 새로운 지식을 얻게 하는 분야이다. 의사결정나무, 베이지안망, 인공신경망 등 다양한 머신러닝 알고리즘이 개발되어 왔다. 이처럼 인터넷과 센서 기술을 통해 빠르게 축적되는‘빅데이터’와 그래픽 처리장치(GPU)를 활용한 기계학습 기술은 산업전반에 걸쳐 활발히 적용되고 있다.

‘빅데이터’는 머신러닝을 적용하기 위한 중요한 요소이다. 축산분야에서도 차세대염기서열분석(NGS)과 단일염기다형성(SNP) 칩을 이용한 가축의 유전체, 전사체, 미생물체 등 생체 정보와 사물인터넷 기술을 통한 가축의 축사환경, 사양정보, 축산물 정보 등에 대한 빅데이터의 축적이 가능해졌다. 이는 축산 분야에도 유전능력 예측, 개체관리 및 환경제어 등에 머신러닝을 적용해 볼 수 있음을 의미한다.

그 중 유전능력 평가는 가축의 경제형질을 자손에 전달하는 능력인 육종가를 예측하여, 우수한 개체 선발에 활용한다. 선발된 개체는 교배 프로그램을 통하여, 우수한 자손 개체를 생산하여 집단의 생산성과 효율성 등을 높일 수 있다.

최근에는 개체의 유전체 정보를 이용한, ‘유전체육종가’를 추정하는 ‘유전체 선발(예측)’ 기술이 도입돼 개체의 능력을 조기에 높은 정확도로 예측하여, 개량의 효율(선발반응)을 높일 수 있다. 그리고 나아가 유전체 선발에도 다양한 머신러닝 기법을 적용하는 연구가 시도되고 있다. 머신러닝의 기법은 예측모델에 사용되는 단일염기다형성 변이, 개체 정보, 환경 효과 등의 설명 변수를 고르는 변수 선발과 개체의 유전능력 또는 표현형 등을 예측하는 예측모형 등에 사용된다.

국립축산과학원은 최근 한우 도체형질에 대한 유전능력을 예측하는 데 기존의 선형 기법인 유전체 최적선형불편예측(GBLUP)과 딥러닝 등의 기계학습 기법을 적용하는 연구들을 해왔다. 단일 분석 방법에서는 GBLUP 기법이 딥러닝보다 예측능력이 높게 나타났다. 하지만 분석 방법에 따라 가중치를 주는 통합분석방법인 앙상블(ensemble)을 사용하였을 때 예측능력이 조금 더 높게 나타났다. 즉, 다양한 기법에 가중치를 주어 통합하는 방법의 예측 정확도가 높게 나타났다. 식물에서도 보다 다양한 형질과 기법을 적용한 앙상블 기법이 우수한 예측 성능을 보여 준 해외 연구 사례도 있다.

종합해보면, 하나의 예측 기법이 가장 좋은 결과를 제시한 사례는 보고되지 않았다. 또한, 훈련집단의 크기, 마커의 종류와 수, 형질의 유전력, 유효집단 크기, 유전적 구조 등의 요인들이 알고리즘의 예측능력에 영향을 미치는 것으로 보고되고 있다.

앞으로도 유전체 정보, 미생물체나 대사체와 같은 생체 오믹스, 환경 요인 등을 모형에 추가하여, 예측의 정확도를 높이고자 하는 노력은 계속될 것이다. 또한, 기존의 도체형질 이외에도 보다 세분화된 도체 형질, 번식 형질, 사료효율이나 온실가스 발생과 같은 신규 형질에 대한 발굴과 이에 대한 동물의 능력을 예측하는 연구도 필요하다.

이를 위한 데이터 관리의 중요성은 아무리 강조해도 지나치지 않다. 국립축산과학원은 축적되는 다양한 오믹스 정보를 효율적이고 지속적으로 관리하는 정보관리 시스템과 검증된 모형을 이용하여 분석 결과를 서비스 하는 플랫폼을 개발하는 연구도 진행하고 있다. 이러한 유전체, 영양·사양, 질병·행동 등의 생체 오믹스 데이터가 통합된 축산 데이터 플랫폼은 개체 관리와 능력을 통한 개량이 동시에 가능하게 할 것이다.

동물 육종은 가축이 자손을 낳고 그 성적을 평가하는 과정을 포함하고 있어, 세대 간격이 긴 대가축의 경우에는 오랜 시간이 필요했다. 유전체 선발을 통해 기간이 단축되고 있지만 여전히 자손의 성적을 확인하는 과정은 필요하다. 그럼에도 앞으로는 머신러닝 기법이 육종의 효율을 높이는 데 크게 기여하게 되리라 기대해 본다. 물론 협업과 소통을 동반한 수많은 연구가 이뤄진다는 전제가 필요하다.

 

저작권자 © 전업농신문 무단전재 및 재배포 금지