머신러닝분야의 권위자인 조프리 힌튼 교수가 한 세미나장에서 청중의 질문을 받습니다.
인공지능의 발달로 인해 당장 일어날 가시적인 변화가 무얼까 하는 질문에 그는 “영상의학과 전공의들은 지금 당장 수련을 그만둬라”고 말해서 영상의학계에선 이게 상당히 센세이션을 일으킵니다. 한마디로 인공지능이 일으킬 가장 손쉬운 목표 중 하나가 영상판독 분야라는 거지요.
알파고가 이세돌 기사를 이긴 것 때문에 우리나라는 말그대로 인공지능 열풍입니다. 덕분에 의료계, 특히 영상의학계에서도 인공지능이 영상의의 판독을 조금이라도 대체할 수 있을 때 생겨날 어마어마한 부가가치에 주목하고 수십개의 기업과 병원에서 이 과제에 달려든 상태입니다.
그런데, 이 영상판독 인공지능 기술의 현황을 살펴보면, 영상의학 뿐 아니라 의료계 전반의 인공지능기술 개척이 만만치 않더군요. 해당 기업에 투자를 할 의향이 있거나, 관심이 있으신 분들은 참고하시라고 썰을 풀어보겠습니다.
인공지능이라고 뭉뚱그려 말하지만, 크게는 알고리즘의 설정을 사람이 지켜보고 간섭하는 머신러닝과, 알파고같이 컴퓨터가 스스로 학습해서 패턴을 찾아내는 과정을 거치는 딥러닝 두가지는 완전히 다른 기술입니다. 이 구분이 꼭 필요한 이유는 딥러닝이 가지는 윤리적 제약 때문인데, 과연 인간이 아무것도 통제할 수 없고, 감시할 수 없는 학습의 과정들이 과연 신뢰할 수 있는거 하는 부분이죠. 어쨋던 일반인은 딥러닝과 머신러닝의 구분도 잘 못하는 상황이니 이 둘을 구분하는 것만으로도 의미가 있을겁니다.
어찌 되었든 이 인공지능으로 최적의 항암제를 고르기도 하고 세계적인 바둑기사를 이기는 것 뿐 아니라 사진을 보고, 그 사진이 어떤 상황인지도 알아서 인식해주는 지금 사진을 보고 병을 판단하는게 무슨 어려울게 있겠는가 하지만, 곳곳에서 한계가 드러나고 있는게 작금의 현실입니다.
가장 어려운 난관이 데이터 구축의 어려움입니다. 특정한 질환을 진단하고 다른 비슷한 질환과 구분을 하려면 해당 질환의 영상 몇십개를 가지고는 기계가 학습을 할수가 없습니다. 신에 필적하는 직관력을 가진 사람도 그런데 기계는 말할 것도 없죠. 특정 의료분야에서 수십만건의 데이터를 돌려보니까 최소 2-3만건의 데이터셋을 톨릴때 까지는 학습결과가 충분히 나오지 않더라고 합니다.
말이 수만개지 판독에 애를 먹는 특정질환의 영상데이터 수만명분을 확보한 기관은 거의 없습니다. 영상장비가 달라도 데이터를 구조화하는데 애를 먹고, 같은 장비라도 찍는 방법이나 새팅도 제각각이면 데이터를 합치는게 불가능에 가까울 뿐더러 최근 국내 대형병원들이 자기들의 임상자료를 재산권으로 인식, 타병원과의 공동작업을 꺼리고 있습니다.
이렇게 빅데이터의 확보가 불가능한것도 문제이지만, 설령 유효한 크기의 데이터셋을 확보해도 문제는 남아있습니다. 데이터는 어디까지나 데이터지 모집단이 아니라는 문제입니다.
최근 피부암진단에 피부과전문의보다 더 나은 결과를 보여주었다고 발표해 화제가 된 왓슨의 경우, 그 결과가 단순한 민감도인지, 위양성율이나 실제 진단율 이야기인지도 문제이지만, 해당 인공지능이 학습에 사용했던 데이터셋과 이질적인 데이터셋에서도 과연 같은 결과가 나오느냐는 겁니다.
실제 흉부 단순촬영영상의 결핵진단율 90프로를 넘었다고 발표한 인공지능툴을 가지고 인도에서 실행시켜보니 진단율이 17프로밖에 안되더라는 연구가 있다고 합니다.
결국 특정 벤쳐기업에서 머신러닝이든 답러닝이든 간에 특정질환의 영상판독에 획기적인 결과가 나왔다고 자랑을 해도, 그 인공지능을 가지고 다른 의료기관의 데이터셋에 적용해보면 엉터리 결과가 나올수 있다는 겁니다.
이것의 의미는 신약을 개발하고 이를 식약청이 인가하는 것처럼 인증절차가 나오기가 어렵다는 거죠. 해당 알고리즘이 정말로 의료현장에 쓰일수 있는지를 인증할 수단이 없다면, 결국 사람이, 즉 영상의학과 의사가 이를 실시간 감독할 수 밖에 없고, 영상의를 대체하는 건 불가능한데, 과연 그렇게 해서 인공지능의 상품성이 성립할수 있는지 의심스러울 수 밖에 없습니다.
지금 수십개의 회사에서 뛰어들더라도 빠른 시간 안에 의미있는 결과를 내는게 원천적으로 불가능하다는건 어쩔수 없는 사실입니다.
이렇게 말하면, 데이터셋의 규모나 질에 크게 의존하지 않아도 될 정도의 범용성 높은 알고리즘을 개발하면 문제가 없지 않느냐 이렇게 반문하실 수 있겠지만, 현재 국내외의 수많은 인공지능 알고리즘들은 예외없이 데이터셋에 거의 전적으로 의존적인 것들 뿐입니다.
앞으로 이 수많은 스타트업들 중 살아남을 수 있는 회사는 이런 한계를 극복할 수 있는 효과적인 목표설정과 함께 얼마나 방대하고 양질의 빅데이터를 확보하는데 성공한 곳일 겁니다.
일단 fda든, 우리 식약청이든, 영상판독 분야에서는 보조적인 역할을 넘어서는 기능의 인공지능에 대해선 인가 기준조차 제대로 마련하기 어려운게 현실이죠.
이 글을 쓴 이유는 영상의학과에 관심이 있음에도 전망이 어둡고 절망적인것 같아서 지원하지 않는 분들이 실제 꽤 많다고 해섭니다.
영상의학과의 전망이 어두운건 사실인데, 인공지능때뮨에 어려울 일은 전혀 걱정할 필요가 없다는 겁니다. 지금까지 하도 많이 뽑은데다 경기침체로 병원들이 문을 닫게 되거나 mri상근규정이 사라지거나 그럴지도 모르니까,,, 즉 수급성황이 어려워서 전망이 어두울 뿐이고, 또 한 10년 지나고 나면 어려운 시절은 지나가게 될겁니다.
영상의학이 재미있고 관심이 있는 분들이라면 인공지능에 주눅들지 말고 도전하셔도 됩니다. 반면, 인공지능이라는 키워드의 위력에 취해서 우후죽순처럼 태동하는 많은 스타트업에 투자를 고민하시는 분들은 구체적인 사안별로 전망이 이렇게 극단적으로 명암이 갈릴수 있다는 것을 주의하시고 꼼꼼히 살펴보셔야 할겁니다.