머신러닝 기반 암 사망예측 모델 개발

암 생존자 삶의 질-생활습관 정보 데이터 활용, 사망 예측 정확도 높여

[의학신문·일간보사=진주영 기자] 국내 연구팀이 암 생존자 삶의 질 및 생활습관 정보 데이터를 활용한 머신러닝기술 적용으로 보다 정확한 사망예측 모델을 개발해 주목받고 있다.

서울의대와 국립암센터 연구팀은 폐암 치료 후 암 생존자들의 생활 습관 및 삶의 질 정보를 활용해 머신러닝 기반의 사망예측 모델을 개발했으며, 이를 통해 5년 후 암 생존자의 사망을 보다 정확하게 예측하는데 성공했다고 3일 밝혔다.

암 생존자 사망 예측 모형은 2001년부터 2006년 사이에 국립암센터와 삼성서울병원에서 수술 후 완치를 판정받은 폐암 환자 809명을 대상으로, 2006년부터 2007년도에 걸쳐 생활 습관 및 삶의 질 자료를 수집했으며 이 자료를 바탕으로 5년 후의 사망을 예측했다.

연구팀은 잘 알려진 폐암 예후 인자(연령, 성별, 병기요인, 종양의 특성 등)외에도 삶의 질과 생활습관 정보(불안, 우울, 삶의 질, 긍정적 성장 및 과체중)들이 실제로 암 생존자들의 5년 이후의 생존예측력을 높일 수 있는지를 중점적으로 연구했으며, 이에 대한 예측정확도를 높이고자 머신러닝 알고리즘을 적용했다.

그동안 폐암 환자를 대상으로 삶의 질과 사망 위험 간의 상관성을 장기간에 걸쳐 분석하고 머신러닝 및 AI등의 알고리즘을 적용해 사망 예측모형으로 만든 연구는 거의 없었다.

이에 연구팀은 폐암 생존자들의 사망률을 평가하기 위해 컴퓨터가 예제를 통해 학습하는 데 도움이 되는 지도학습 알고리즘 중, 다섯 가지 유형의 머신러닝 알고리즘을 테스트했다. 그 이후 각각의 모델에 대한 예측 성능을 비교했다.

다섯 가지 유형의 알고리즘은 하나의 모델을 학습시켜 사용하는 의사결정나무(decision tree)과 로지스틱회귀분석(logistic regression), 가능한 임의의 결과를 반영하는 여러 개의 나무 모양 모델을 결합한 랜덤포레스트(random forest), 배깅(Bagging), 아다부스트(Adaptive Boosting) 등 이다.

폐암 치료 후 암 생존자들의 생활 습관 및 삶의 질 정보를 활용해 개발 된 사망 예측 모형은 기존의 잘 알려져 있는 예후 요인인 연령, 성별, 종양의 특성 등만 활용한 모델의 사망 예측보다 훨씬 더 정확했다고 연구팀은 밝혔다. 또한 다양한 머신러닝기법을 적용함으로써 암 사망에 대한 예측력을 보다 높일 수 있다는 것을 확인했다.

암 생존자들이 기존의 예후인자들만 고려한 랜덤포레스트 모델과 아다부스트 모델은 암 생존자들의 5년 생존여부를 약 69.1% 와 71.3%만 정확하게 예측하는 수준인 반면, 삶의 질 및 생활습관을 고려한 랜덤포레스트 알고리즘 및 아다부스트 모델은 폐암 생존자 5년 생존여부의 94.1% 와 94.8%를 정확하게 식별해 보다 정확한 예측을 제공했다.

심진아 박사는 "이러한 삶의 질 요인을 포함한 예측모형은 ICT 기술과 융합돼 실제 생존자들의 자가 관리를 도울 수 있으며, 향후 유전자 분석을 기반으로 한 정밀의학에서도 삶의 질 정보가 신중히 고려돼야 한다"고 말했다.

한편 이 연구 결과는 Nature 계열의 권위 학술지인 ‘Scientific Report' 최근호에 게재했다.

진주영 기자 pearlzero21@bosa.co.kr

다른기사 보기

상단영역

본문영역

머신러닝 기반 암 사망예측 모델 개발

암 생존자 삶의 질-생활습관 정보 데이터 활용, 사망 예측 정확도 높여

개의 댓글

댓글 정렬

내 댓글 모음