병원과 병원인의 병원신문 최종편집2022-07-06 19:59 (수)
[공동기획] 인공지능을 만드는 인공지능–AutoML과 헬스케어
상태바
[공동기획] 인공지능을 만드는 인공지능–AutoML과 헬스케어
  • 병원신문
  • 승인 2022.03.07 06:00
  • 댓글 0
이 기사를 공유합니다

병원신문-대한디지털헬스학회 공동기획②
조백환 삼성서울병원 AI연구센터 교수
인공지능 개발과정 자동화 AutoML, 매력적인 기술
헬스케어 분야에서는 한계 있지만 그만큼 기회도 커

세계적으로 헬스케어는 산업계에서 가장 중요한 위치를 차지하고 있고 매년 폭발적인 성장세를 보이고 있다. 단순한 서비스의 제공과 일대일의 관계에서 효율성, 경제성, 편의성, 신속성, 미래발전성을 기반으로 한 다자간 연결 시스템으로 발전하고 있는 가운데 그 중심에는 소위 'Digital Health care transformation’이 핵심으로 자리매김하고 있다. 이에 병원신문과 대한디지털헬스학회는 4차 산업혁명을 맞아 역동적인 디지털헬스케어 생태계 조성을 위해 '이제는 디지털헬스 시대다!'를 공동기획했다.

※ 대한디지털헬스학회: 4차 산업혁명과 디지털전환이라는 시대적 요구에 부응하고자 2021년 11월 학계, 의료계, 산업계 전문가들이 상호 협력하고 교류할 수 있는 비영리 학술단체로 창립했으며 권순용 가톨릭대학교 서울성모병원 정형외과 교수가 초대회장을 맡았다.

※ 병원신문-대한디지털헬스학회 공동기획②: 인공지능을 만드는 인공지능–AutoML과 헬스케어(조백환 삼성서울병원 AI연구센터 교수)

■ 인공지능 개발 과정의 어려움

2022년 현재 우리의 일상생활에 이미 깊이 적용되고 있는 인공지능 기술은 금융/투자, 교육/취업, 환경/에너지 분야를 넘어, 심지어 예술/컨텐츠 영역에도 그 적용범위를 넓혀가고 있다.

특히 딥러닝 (Deep Learning) 기술이 일반 학계와 산업계에 소개되고 적용되기 시작한 2012년경 이후, 인공지능 기술은 의료와 헬스케어 분야에서도 연구단계 뿐만 아니라 인공지능 의료기기, 디지털 치료기기(Digital Therapeutics), 전자약(Electroceutical 혹은 Bioelectronic medicine) 등 실용화 및 상용화에도 매우 깊이 관여하고 있다.

인공지능이 여러 산업과 의료에도 많은 효과를 보인다는 것을 여러 사례를 통해 증명되어 왔지만, 잘 작동하는 인공지능을 개발하기 위해서는 많은 요건들을 필요로 한다. 가능한 많은 학습데이터를 잘 정제하는 것이 필요하고, 빠른 학습을 위한 연산장치가 필요하며, 최적의 성능을 낼 수 있는 알고리즘이 필요하다.

정제된 많은 학습데이터를 보유하는 것이 좋은 인공지능 모델을 확보하는 가장 중요한 요소임은 부정할 수 없으나, 가장 최적의 모델을 도출하는 것은 인간 전문가의 손길이 필요하다. 구슬이 서말이라도 잘 꿰어야 진짜 보배가 된다. 모든 문제에 좋은 성능을 내는 알고리즘이란 것은 이 세상에 존재하지 않기 때문이다.

인공지능 분야에서 최근 널리 사용되고 있는 딥러닝 기술도 마찬가지다. 주어진 문제에 대해 최적의 성능을 내는 딥러닝 모델을 찾기 위해 여러 가지 다양한 구조를 적용하여 시도해 봐야 하고, 특히 학습률, 배치 크기, 최적화 방법 등 비전문가들에게는 생소한 초매개변수(Hyperparameter)들을 다양한 방법으로 적용하여 최적의 모델을 찾는 과정을 거치게 된다.

초매개변수란 데이터를 통해 인공지능 모델 학습을 시작하기 전에, 사용자(연구개발자)가 미리 지정해야 하는 매개변수를 일컫는다. 과거 가정용 오디오기기에서 특정 클래식 음악이나 가요에 따라 가장 원하는 소리를 듣기 위해 각 주파수 영역의 크기를 조절하는 이퀄라이저(Equalizer)와 비슷하다고 볼 수 있다.

다만, 그것보다 조절해야 할 다이얼 개수가 더 많고, 각 다이얼마다 선택가능한 수치가 더 많다. 더군다나 음악은 이퀄라이저 조합의 결과를 곧바로 청취하여 확인할 수 있는 반면, 딥러닝 모델은 학습시간이 오래 걸리니 결과를 바로 확인하기도 어렵다. 따라서 실험해 봐야할 알고리즘의 개수가 수백개에서 수천만개 이상에 이를 수 있으며, 개발시간도 오래 걸린다. 인공지능 개발자에게 주어진 연산장치가 한정되어 있고 개발기간 또한 무한하지 않으므로, 전문가의 직감이나 소위 말하는 노하우에 의존해 일부의 조합을 시도해 보는 것이 일반적인 인공지능 모델의 개발 과정이라 할 수 있다.

인공지능이 인간생활에 자동화된 편리함을 제공하지만, 실용화된 인공지능 제품이 개발되기 까지는 위에 설명한 바와 같이 수많은 전문가들의 지난한 노력이 필요했음에 틀림이 없다. 한정된 자원과 시간이 주어졌을 때, 경쟁자보다 더 뛰어난 인공지능 기술을 더 빨리 개발하기 위해서는 숙련된 전문가가 필요하므로, 글로벌 대기업들은 인공지능 전문가 확보에 사활을 걸고 있고, 따라서 이 분야 전문가들의 연봉이 점점 상승하고 있는 이유이기도 하다.

■ 인공지능을 위한 인공지능 AutoML의 등장과 적용 범위

인공지능 전문가 부족현상을 해결하기 위해, 또 한편으로는 인공지능 개발 과정 자체를 자동화하기 위해 자동화된 기계학습(Automated Machine Learning), 즉 AutoML 분야에 최근 관심이 집중되고 있다. 인공지능 모델 개발을 위해 인공지능이 사용된다고 하니 뭔가 좀더 최첨단 기술처럼 들리거나, 혹은 인공지능이 인간과 같이 자아를 갖는 존재가 되어 결국 세상을 지배하는 공상과학 영화에서 봤던 섬뜩한 미래가 떠올려질 수도 있겠지만 아직 걱정은 접어 두어도 좋을 것 같다.

현재 AutoML이 주로 다루는 분야는 Feature Engineering 자동화, 초매개변수 자동 최적화, Pipeline 자동 최적화, 신경망 구조 탐색(Neural Architecture Search, NAS) 등으로 볼 수 있다. Feature Engineering은 입력 변수들을 이용하여 인공지능 모델의 성능을 높일 수 있는 새로운 입력 특징점(Input Feature)을 만들어 내는 방법들을 주로 의미한다.

Feature Engineering도 해당 분야 전문가의 통찰력과 경험에 의해 주로 이루어졌는데, 이를 자동화하기 위한 다양한 방법이 시도되고 있다. 하지만 대부분의 기술들이 매우 다양한 특징점 변환(Feature Transformation) 방법을 시도해보고, 그 중에 가장 좋은 것을 선택하는 방식이어서 연산량을 매우 많이 필요로 한다는 단점이 있다.

초매개변수 최적화는 위에서 설명한대로 인공지능 개발자가 필수적으로 수행해야 하는 일이고, 그 누구도 정답을 알지 못하기 때문에 Trial-and-Error 과정을 지속적으로 반복하면서 찾아야 하는 지루한 과정이며, 기도하는 심정으로 결과를 기다리는 과정 중 하나다. 초매개변수 세팅에 따라 성능 변화가 매우 클 수도 있으니, 전체 인공지능 모델 개발에 있어 아주 중요한 과정이다. 그래서 어떤 이는 이 과정을 ‘모래사장에서 바늘 찾기’에 비유하기도 하고, 또 다른 이는 ‘예술’에 비유하기도 한다.

따라서 초매개변수 자동 최적화는 인공지능 개발자나 연구자들의 삶을 조금 더 여유롭게 하는 데 도움을 줄 수 있을 것으로 기대되었다. 가장 널리 사용되는 방식이 Bayesian Optimization에 기반한 방법들이다. 간단하게 설명하자면, 이전에 사용했던 초매개변수 조합의 성능을 기반으로 이전에 사용하지 않았던 초매개변수 조합들의 성능을 미리 예상해보고, 그 중에 가장 좋을 만한 조합을 몇 개 선택해서 다음 실험에 자동으로 적용하는 방식이다. 이 과정을 만족스러운 결과가 나올 때까지 반복적으로 수행하는 것이다.

모든 조합을 시도해보는 그리드 탐색(Grid Search)나 무작위 탐색(Random Search)에 비해 빠르고 좋은 성능을 보여주고 있으나, 이 역시 데이터의 크기가 커지면 연산량도 기하급수적으로 늘어날 수밖에 없는 한계를 가지고 있다. 특히 다양한 형태의 이종(Heterogeneous) 데이터를 포함한 헬스케어 빅데이터에 이를 적용하고자 한다면, 더욱 세심한 주의가 필요할 수 있다.

위에서 설명한 Feature Engineering, 초매개변수 최적화뿐 아니라 인공지능 개발에 필요한 일련의 전 과정을 자동으로 최적화하는 Pipeline 자동 최적화 또한 소개되고 있다. 이러한 기능을 포함한 소프트웨어, 소프트웨어 Toolkit, 소프트웨어 서비스들이 무료로 배포되거나 유료로 이용할 수 있다. Auto-WEKA, Auto-sklearn, TPOT 등이 가장 널리 알려진 무료 AutoML 소프트웨어 혹은 소프트웨어 Toolkit이므로, 인공지능 연구개발자들은 손쉽게 활용해 볼 수 있다.

최근에는 글로벌 IT 대기업들을 중심으로 클라우드 컴퓨팅 서비스가 소개되고 있고, 특히 Google, Microsoft, IBM, Amazon 등은 AutoML 기능을 포함하여 배포하고 있는데, 대부분 Pipeline 자동 최적화를 표방하고 있다. 이러한 Pipeline 자동 최적화 소프트웨어들이 저마다의 효율적인 방법(관련 논문이나 홍보자료에는 인간 전문가가 직접 최적화하는 경우에 필적하거나 그 이상의 성능을 보여주는 사례들을 다수 소개하고 있다)으로 최적의 모델을 찾아주는 서비스를 제공하지만, 이 역시 모든 문제에 대해 항상 잘 작동하는 것이라고 볼 수 없고 연산량 또한 무시할 수 없다. 특히 클라우드 컴퓨팅을 이용하여 유료 과금이 이루어지는 AutoML 기능을 적용한다면, 얼마 사용하지 않았는데도 가볍게 PC 한 대 가격의 과금이 금방 청구되는 황당한 경험을 하게 될 수도 있으니 매우 주의를 기울여야 한다.

딥러닝 기술이 최근 인공지능 분야에서 가장 많은 혁신을 이루어 냈다. 딥러닝이란 인공신경망(Artificial Neural Network) 알고리즘의 확장된 버전으로, 기존에 많이 사용되던 구조보다 더 깊고(Deep) 복잡한 구조의 인공신경망 구조를 알고리즘으로 구현한 것으로 생각할 수 있다. 연구자들이 신경망 구조를 미리 설정하여 학습을 진행해 왔었고, 많은 사람들에 의해 검증된 구조를 후속 연구자들이 그대로 사용하는 경우가 많았었다.

그런데 최근 이 신경망 구조조차 데이터를 기반으로 자동으로 탐색하는 분야의 연구가 많은 관심을 받고 있는데, 이것이 신경망 구조 탐색(NAS) 분야다. 국내외 연구자들이 NAS를 이용하여 여러 과제에 훌륭한 성과들을 보여주고 있는데, 최종적으로 탐색된 신경망의 구조는 해석이나 직관적인 분석을 하기에 더욱 복잡하고 기괴한 형태를 보일 수 있다. 따라서 결과의 해석이 중요한 헬스케어 분야의 문제들에 적용할 때에는 이러한 단점을 고려하지 않을 수 없다.

■ 헬스케어 분야에서의 AutoML

전 세계적인 인공지능 개발자 구인난 현상으로 인해, 최첨단 인공지능 기술로 새로운 가치를 제공하고자 하는 헬스케어 분야의 기업이나 연구기관에 있어 AutoML은 매우 매력적인 기술임에는 틀림없다. 하지만 아직까지 헬스케어 분야에 많이 도입되고 있지 못하는 것에는 다음과 같은 몇 가지 이유들이 있다.

헬스케어 특히 의료데이터들의 특수성 때문에 Feature Engineering 자동화가 매우 어렵다. 간단한 변환으로 좋은 특징점을 자동으로 찾아내는 기존 AutoML 방식으로는 각기 다른 문제에 공통적으로 성공적인 결과를 찾기 어렵다. 특히 입력 변수들 간의 주요 특징들을 오랜 임상경험이나 연구경험에 의한 직관으로 새로운 특징점을 찾아야 하는 경우가 많기 때문에 아직까지는 인간 전문가의 직관이 필요하다고 생각된다.

많은 경우 수기로 직접 입력하는 데이터 특성상 잡음 등의 오류가 있는 데이터를 다룰 때는 기존 AutoML 방식이 효과적이지 못할 수 있다. 특히 여러 병원이나 기관에 산재되어 있는 서로 다른 형태의 데이터를 통합하기 위한 데이터 표준화는 AutoML이 아직 적용되기 힘든 분야이기도 하다.

매우 많은 연산량을 요구하는 AutoML의 특성상 대규모의 헬스케어 빅데이터를 이용하기가 어렵다는 단점이 있다. 병원에서 측정하는 혈액 검사 수치 등의 임상 데이터로 이루어진 정형데이터뿐만 아니라 의료영상, 생체신호, 그리고 최근 주목받고 있는 디지털 표현형 데이터와 같은 비정형 데이터들이 갈수록 더 많고 복잡하게 쌓이게 되므로, AutoML 이 헬스케어 데이터에 잘 적용되기 위해서는 연산효율에 대한 적절한 고려가 필요하다.

마지막으로, AutoML에 의한 결과 해석의 어려움이 있다. 인공지능, 특히 딥러닝 모델이 좋은 성능을 보이는 반면, 결과에 대한 해석이 어려운 Black Box 알고리즘이기 때문에 이를 조금이나마 해결하기 위한 여러 가지 방법들이 연구되고 있다. 그러나 기존의 통계학기반 방법들에 비해 견고한 해석을 제공하는 인공지능 관련 기법이 아직까지 존재하고 있지 않다.

마찬가지로 AutoML도 일종의 Black Box 알고리즘이므로 그 결과에 대한 해석이 가장 큰 난관이라 할 수 있다. 따라서 인간의 건강에 매우 심각한 결과를 초래할 수 있다는 우려 때문에, 헬스케어 분야 특히 의료에 적용할 때에는 AutoML에도 결과에 대한 해석이 중요하다고 할 수 있다.

데이터를 던져주면 컴퓨터가 자동으로 인공지능 모델을 만들어 내는 AutoML이 많은 장점에도 불구하고 헬스케어 분야에서 잘 적용되는 것은 아직 요원한 것으로 보인다. 그러나 점점 더 늘어나는 헬스케어 데이터와 함께 이를 효과적으로 분석하여 예방, 진단, 치료, 예후 관리에 활용하고자 하는 니즈 또한 함께 증가하고 있다.

이에 따라 헬스케어 데이터에 대한 인공지능 전문가의 필요성이 더욱 강조될 것이 분명한 현 상황에서 AutoML은 케어기버, 기업, 일반 사용자, 환자 모두에게 매력적인 기술이다. 아직까지 헬스케어 분야에 적용된 범용 AutoML 기술이 없다는 것은 그만큼 도전적이기도 하지만 또한 많은 기회가 남아 있는 분야라는 의미이기도 하다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사