가천대학교 길병원이 IBM의 인공지능 ‘왓슨 포 온콜로지(Waston for Oncology)’를 다음달부터 암 환자 진료에 본격적으로 활용하기로 했다. 바둑에서 구글의 알파고가 이세돌 9단을 꺾은 충격적인 사건은 인공지능이 사람과의 승부에서 이길 수 있다는 점에서 여러 가지를 생각하게 만든 계기가 됐다. 이제는 의학에서 인공지능의 판단이 직접 진료에 적용된다는 것은 새로운 시도이며 의료계의 관심이 집중되는 사건이다.
2013년 2월 IBM이 발표한 바에 의하면, 60만 건의 의학적 근거, 42개 의학 저널과 임상시험 데이터로부터 약 200만 페이지 분량의 자료를 학습했다고 한다. 진단 정확도도 전문의들과의 진단 일치율이 대장암의 경우 98%, 직장암 96%, 방광암 91%, 췌장암 94%, 신장암 91%, 난소암 95%, 자궁경부암 100%에 달하고, 백혈병의 경우 83% 정도의 일치율을 보였다. 하지만 상당한 수준의 진단능력을 가진 것은 맞는 것 같으나, 이 정확도를 어떻게 검증했는지에 대해서는 아직 명확하다고 할 수는 없는 상태다. 과학이 무언가를 결정적으로 입증하는 경우는 거의 없다. 그 보다는 어떤 가설이 참일 가능성을 높이거나 낮추는 증거를 모으는 역할을 하는 것이 과학이다. 아무리 인공지능이 딥러닝을 한다고 해도 지금의 의학수준을 기반으로 자료를 해석하는 것인데 다른 가능성을 어떻게 해석할지 궁금해지는 것이다.
몇 가지 걱정은 만약 닥터왓슨이 일상화되면서 의사가 진단과정을 인공지능에 의지하게 되면서 프로세스에 대한 훈련이 부족하게 되면 진단능력이 저하될 수 있다는 것이다. 그런 상황이 장기화 되면 기계에서 오류가 생긴 경우 간단한 오류도 파악하는 것이 어려워진다는 사례는 다른 분야에서도 종종 나타나고 있다.
또한 아직은 구시대적인 사고를 가지고 있어서 그런지 몰라도 100%라는 것이 없다면 확률이 높은 진단명이나 치료법을 권고한다고 해도 이를 어떻게 해석하고 그 결정을 믿어야 할지도 궁금할 정도다. 예를 들어 닥터왓슨의 권고대로 시행해서 치료를 한 케이스가 심평원에서는 적정한 진료가 아니라고 삭감하는 경우 그 치료는 잘못된 것인지, 아니면 우리제도의 문제인지도 논란이 될 수 있다. 그 케이스가 올라와 회의를 하는 심평원의 관련 의사들도 부담스러운 부분이 될 수 있다. 닥터왓슨의 권고안 이외에 다른 방법이나 접근법은 틀렸다고 볼 수 있는 것은 분명 아닐 것이다.
사실 인공지능의 도입이 법률분야에서는 기존 판례를 검색해서 찾는 것은 엄청난 속도와 방대한 자료를 분석할 수 있는 유망한 분야라는 이야기가 있었던 것처럼 의료분야에서도 진료의 적정성을 분석하는 의료소송분야에서 먼저 도입될 수 있을 것 같다는 예상이 많았었다. 의사는 본인이 당시에 내린 결정에 대해서 많은 근거와 이유를 설명해야 하는데, 인공지능이 그때 의사가 내린 결정은 우선 순위상 낮은 순위이거나 근거가 부족하다고 분석하는 경우 의료소송에서 유리한 상황이 될 수 있다는 이야기가 오간 것이다.
중요한 사실은 왓슨과 같은 빅데이터 기반 인공지능 시스템은 철저히 사람을 도와주는 임상의사결정지원 시스템이지, 사람을 대체하는 임상의사결정 시스템은 아니라는 것이다. 닥터왓슨은 어떻게 보면 의료체계의 혁명적인 변화가 생길 수 있을지도 모른다. 따라서 왓슨과 같은 빅데이터 시스템을 의사결정에 잘 활용할 수 있도록 준비하는 것은 중요하다고 할 수 있다. 그런 경우 의사의 역할은 어떻게 변화되어야 하는지, 의학교육의 패러다임이 전면적으로 이에 맞추어서 어떻게 바뀌어야 하는지도 우리 모두의 고민이 될 수 있다.