시너지칼럼 포커스 연구성과 연구원동정 BSRC사업단소식
(재)유전자동의보감사업단 뉴스레터

연구성과

표적분야


한국과학기술원 김동섭 교수
연구명

화합물의 특성을 반영하는 자연어 처리방식을 채용한 새로운 분자표현식 개발

SUMMARY

자연어와 화합물의 유사성에 기반을 둔 새로운 분자표현식을 개발하여, 화합물의 특성을 더욱 정확하게 예측할 수 있음을 보였다. 이를 통해 신약 개발 초기 단계에서 성공 가능성이 높은 신약 후보 물질을 효과적으로 선별할 수 있는 기반을 마련하였다.

연구배경

구조-활성 정량적 관계는 화합물의 성질을 예측하는 대표적인 방법으로써, 최근 딥러닝 기법의 발전과 함께 그 예측 정확도가 급진적으로 향상되었다. 특히 딥러닝을 사용한 그래프 컨볼루션 기반의 분자 표현식의 경우 기존에 쓰이던 ECFP 분자표현식에 비해 월등한 예측 성능을 보여주었다. 즉, 딥러닝을 통해 효과적인 분자표현식을 개발한다면 화합물의 성질 예측 성능을 더욱 개선할 수 있다. 이번 연구에서는 자연어와 화합물 구조 사이에 존재하는 유사성에 기반을 두어, 자언어 처리 기법의 딥러닝을 바탕으로 화합물의 특성을 학습하는 화합물의 새로운 분자표현식 FP2VEC을 개발하였다.

연구내용

[그림 1] FP2VEC 분자표현식 생성 및 학습 방법 (1)

[그림 2] 구조-활성 예측 결과 비교

이 연구에서, 우리는 자연어와 화합물의 유사성에 기반한, 자연어 처리 기법을 활용한 새로운 분자표현식 FP2VEC을 개발하였다. FP2VEC을 이용하여 화합물의 독성 예측 및 기타 화합물의 특성 예측 실험에서, 기존의 ECFP 분자표현식보다 좋은 예측 성능을 보였으며 딥러닝 기반의 그래프 컨볼루션 분자표현식을 활용한 예측 모델보다 더 낫거나 비슷한 예측 성능을 보여주었다.

연구성과

본 연구를 통해 자연어 처리 기법 기반의 딥러닝을 활용한 새로운 분자표현식 FP2VEC을 개발하였다. FP2VEC은 기존의 분자표현식을 기반으로 한 화합물 특성 예측 모델에 비해 더 좋은 성능을 보였으며, 본 연구의 결과는 그 중요성을 인정받아 Bioinformatics (IF: 5.610)에 게재되었다.

기대효과

전통 천연물의 경우 다양한 화합물들이 함께 작용하기에 그 화합물의 특성을 예측하는 것이 일반적인 약물보다 어렵다. FP2VEC의 경우 화합물의 특성을 효과적으로 추출하여 독성 예측에 있어 다른 분자표현식들보다 더욱 정확한 예측 결과를 얻을 수 있음을 확인하였다.
새로운 분자표현식은 현재 거의 모든 분야에서 적용되고 있는 딥러닝 기술에 효율적으로 활용이 가능하며, 이와 더불어 비약적으로 발전하고 있는 QSAR 모델에 적용되어 천연물의 독성을 예측하여 신약으로서 적합한 후보물질인지를 확인하고 실패할 가능성을 줄일 수 있을 것으로 기대된다.

[관련성과]
Jeon W, Kim D. FP2VEC: a new molecular featurizer for learning molecular properties. Bioinformatics. 2019 Dec 1;35(23):4979-85.