시너지칼럼 포커스 연구성과 연구원동정 BSRC사업단소식
(재)유전자동의보감사업단 뉴스레터

연구성과

인체분야


이화여자대학교 권오란 교수
연구명

맞춤형 헬스케어를 위한 머신러닝 모델 개발

SUMMARY

정밀 영양 서비스/사업모델의 사업화를 위하여 머신러닝 모델이 적용된 health space modeling을 개발하였다. 이는 인구집단 고유의 기능별 건강상태를 정량화할 수 있는 방법론을 마련하고, 전통천연물의 안전성과 효능을 고려한 정밀영양의 기반을 마련할 수 있는 토대가 될 수 있다.

연구배경

최근 건강의 개념은 질병의 유무보다는 외부환경의 변화에 대하여 내부환경의 항상성이 유지되는 상태를 의미하는 방향으로 변화하고 있으며, 치료보다는 예방의 중요성이 강조되고 있다. 신체적 건강과 관련된 신체적 스트레스는 정신적 스트레스 또는 심리적 스트레스와 구별되며, 개체의 종합적인 신체 건강 수준을 표상할 수 있는 지표로서 개체의 건강 상태를 나타내는 지표로 사용될 수 있으나, 신체적 스트레스를 객관적으로 평가하는 방법은 없는 실정이다. 이에 신체적 스트레스 수준을 객관적으로 예측하여 체계적으로 건강함을 유지할 수 있는 시스템 개발이 필요한 실정이다.

연구내용

[그림 1] 머신러닝 기반 모델의 개발과 검증 과정

고지방 식이델의 개발과 검증을 위해 데이터의 70%는 개발 데이터(Training set)과 30%는 검증 데이터(Test set)로 분류하였다. 두 개의 표준집단의 차이가 잘 알려진 지표들을 바탕으로 모델을 개발하면 이를 통해 예측된 점수를 바탕으로 대상자를 분류할 수 있다. 이 대상자들 간의 차이를 분석하여 관련된 혈액 지표, 식이 요인, 생활습관 및 심리요인을 찾아내고자 하였으며 이후 단계에서는 이들 요인 지표들을 기계학습 방법을 이용하여 선정하였다. Machine learning의 방법들 중 가장 설명력이 쉬운 regression 방법을 선택하여 10회의 교차검증을 통해 지표를 선정하고, 선정된 지표 간의 다중공선성을 확인하기 위해 Pearson correlation 분석방법을 통해 r 값이 0.8이상인 지표는 제외하고 모델의 식을 도출하였다. 도출된 모델의 식을 검증하기 위해 30% Test set 데이터를 활용하였다. 또한 두 표준집단을 얼마나 잘 구분할 수 있는지 정확도를 검증하기 위해 ROC(Receiver operating characteristic) curve를 그려 확인하였다.

[그림 2] 건강진단 다차원 모델의 시각화 (초록→빨강: 산화스트레스가 높아지는 상태)

연구성과

이 실험을 통해 천연물이 나타내는 효능을 “위태로운 건강집단”의 건강예측점수가 “최적의 건강집단” 건강예측점수로 향상되는지 표현할 수 있었다. 이를 차후 인체시험을 통해 재검증할 예정이며 이는 궁극적으로 정밀영양의 기반을 마련한 계기가 되었다.

기대효과

스마트헬스는 언제 어디서나 질병의 예방, 상태파악, 진단, 치료, 예후, 건강 및 생활 관리 등의 맞춤형 보건의료 서비스를 제공하는 기술로 정의되며, 유무선 통신망을 통해 정보기기를 이용하여 필요한 데이터를 측정, 분석, 관리하는 기술과 서비스를 위한 용어, 플랫폼, 디바이스, 시험 및 인증 등을 포함하는 기술이다. 연구진은 현재 네덜란드 TNO와의 협업을 통해 사업화 추진이 가능한 디지털 헬스기반 예측 시스템을 개발 중에 있다. 이는 MC/MT 고유 인체시험 내의 임상지표와 오믹스 지표를 통합 분석 할 수 있으며 개인 맞춤형 중재 전략 수립을 위한 예후 예측 시스템으로도 활용가능하다. 이러한 알고리즘 및 인터페이스 개발 연구를 통해 현재 기업 협의를 진행하고 있으며 실용화를 위해 적극적으로 노력중이다.