[기획]병원협회의 빅데이터 활용
상태바
[기획]병원협회의 빅데이터 활용
  • 병원신문
  • 승인 2015.01.12 06:00
  • 댓글 0
이 기사를 공유합니다

병영경영연구원 정석훈 연구원

최근 건강보험심사평가원의 청구데이터 관련 빅데이터와 이를 분석할 수 있는 도구가 병원협회 마포회관에 원격으로 연결되었다. 이는 정부가 보유하고 있는 대규모 데이터를 민간에 공개하고자 하는 당국의 의지와, 병원협회 전산팀의 지속적인 노력으로 인해 성사된 중요한 사건으로 볼 수 있다.

비록, 아직은 요청한 데이터에 대해서 1차적으로 가공한 후 뷰(view)의 형태로 연결시켜주는 형태이며, 그 분석결과를 로컬(local)에 위치한 병원협회 회관 단말기에 바로 다운받을 수 있는 수준으로까지 개방된 것은 아니지만 심평원의 청구관련 데이터를 원격에 위치한 마포 병협회관에서 분석할 수 있다는 것은 그 자체만으로도 상당한 수준의 협력관계가 이루어질 수 있는 단초가 마련되었다고 볼 수 있다. 이제 데이터에 대한 활용의 문제가 남아있다.

 정보학에서는 자료(data), 정보(information) 그리고 지식(knowledge)의 개념을 명확하게 구분하고 있다. 우리가 흔히 ‘데이터’라고 칭하는 ‘자료’는 ‘주다(to give)’의 의미를 갖는 라틴어 do, dare에서 유래한 용어로 일반적으로 특정한 일에 유용하게 사용될지도 모르는 사실(facts), 이미지 또는 소리 등을 의미한다.

‘정보’는 형식을 주다(give form to)라는 의미를 지닌 라틴어 informo, informare에서 유래한 용어로 그 형식이나 내용이 특정한 목적이나 용도에 적합하게 사용될 수 있는 자료를 이르며, 용도에 맞게 구성되고 추출 및 요약된 형태를 말한다. 마지막으로 ‘지식’은 오랜 기간 ‘정보’를 사용하면서 그 결과가 축적되어 쌓인 것들을 이른다.

예를 들어, 무작정 쌓여있는 환자들의 차트는 ‘자료’이며, 이 자료를 정리하여 특정 지역 및 특정 연령대의 질환을 보기 위한 목적으로 자료를 정리하였다고 한다면 이것은 ‘정보’가 될 수 있고, 이러한 ‘정보’를 오랜 기간 사용하고 분석하면서 알게 된 ‘지식’의 예로 ‘어느 지역에 거주하는 20대 이하의 남자는 특정 질환에 걸릴 빈도가 매우 높다’라는 것이다

<그림1>

 

 위 개념의 틀에서 보았을 때, 현재 병원협회는 ‘자료’, 그것도 청구데이터라고 하는 일부분의 ‘자료’에 접근할 수 있게 된 것이다. 이것을 정보나 지식으로 발전시켜 다양한 형태로 활용해야 하는 숙제가 남겨진 것이다. 병원협회가 현재의 상황에서 이 숙제를 해결하기 위해 유념해야 할 사항들에 대해서 몇 가지 간단히 짚어보는 것이 필요하다.

 먼저 첫째, 정보나 지식의 사용 목적을 명확히 세워야 한다. 보통 정보나 지식은 아래 <그림2>와 같은 절차를 거치면서 생성된다.

 <그림2>

 

자료가 정보로 바뀌기 위해서 가장 중요한 것은 ‘목적’이다. 생성하려고 하는 정보의 사용 목적에 의해 ‘추출, 분석 및 요약’이 되는 것이다. 따라서 가장 우선시 되어야 하는 과제는 목적을 설정하는 것이라고 볼 수 있다. 이 목적을 설정하기 위해서는 정보의 최종사용자(end users)가 누구이며 이들이 생성될 정보를 가지고 무엇을 하려고 하는가를 파악하는 작업이 필요하다. 이 과정을 흔히 요구사항 분석(user requirements analysis)이라고 한다.

 병원협회 입장에서 가정할 수 있는 정보의 최종사용자는 회원병원에 근무하고 있는 각 업무 담당자들, 병원협회 사무국 직원 그리고 기타 병원 단위의 연구를 주로 수행하는 연구자들로 범주를 나누어 볼 수 있다.

첫 번째 병원근무자들의 경우에만 해도 매우 다양한 업무를 수행하고 있다. 원무, 심사, 진료 등 다양한 업무에 다양한 목적들이 있을 수 있다.

두 번째 병원협회 사무국 직원들의 경우에도 주로 병원관련 정책수립 및 대응, 수가협상 등에 필요한 업무 목적들로 정보를 필요로 할 수 있다.

세 번째 그룹은 그야말로 각 연구자들의 관심주제에 따라 수많은 주제들로 그 사용 목적들이 표출될 수 있을 것이다.

즉, 매우 광범위한 최종사용자들에 의해 매우 다양한 목적들이 발생하게 될 것인데, 이를 단번에 수용할 수 있는 체계를 만들고 운영해 나가는 것은 불가능 하다. 따라서 먼저 가시적 효과를 낼 수 있는 일부 사용 목적들을 선정하고 이들에 우선순위를 정하는 작업이 필요하다.

또한 단지 청구데이터만 가지고는 이렇게 다양한 목적들을 만족시킬 수 없기 때문에 청구데이터 이외의 다양한 형태와 내용의 데이터를 수집할 수 있는 기능도 함께 수행해야 할 것이다. 예를 들어, 재무현황 등에 대한 지표를 활용하기 위해서는 재무제표 등의 추가적인 자료들이 필요한데 이러한 내용은 현재의 청구데이터에는 포함되어 있지 않다. 이렇게 추가적으로 필요한 자료들은 무엇이며 어떻게 수집하고 어떻게 연결할지에 대한 고민도 반드시 함께 논의되어야 한다.

 둘째, 수집된 자료에 대한 지속적인 공부와 연구가 필요하다. 간혹 자료분석을 머리로만 하는 사람들이 있다. 수집된 자료에 대해 대충 알고 있는 상황에서 대충 머리로만 ‘이렇게 이렇게 분석하면 된다’라고 말로만 하는 사람들이 대부분 그렇다. 자료분석은 대상 자료에 대해 거의 암기수준이 될 정도까지 친숙해져 있는 상태에서 수행되어야 한다.

그렇지 않은 경우에는 잘못된 분석과 엉뚱한 해석 결과를 가져올 수 있다. 예를 들어, 각 칼럼들이 생성된 정확한 의미와 배경지식, 각 값들의 관계, 생성 주기, 코딩 값의 의미 등 수집된 자료에 대한 메타데이터까지 속속들이 명확하게 알고 있어야 한다. 이렇게 알기 위해서는 수집된 자료와 지속적으로 스킨십을 가져야 한다.

즉, 단말 앞에 앉아서 이렇게 뜯어보고 저렇게 뜯어보고, 변환해 보고, 기술 통계치를 내보고 하는 과정이 필요하다. 필자의 경험으로 보았을 때, 절대 처음부터 대단한 자료의 분석결과가 나오지 않는다.

수집된 데이터에 대해 어느 정도의 내공이 쌓이고 잘 알게 되었을 때 제대로 된 쓸만한 분석결과와 정보가 생성됨을 여러 번 경험하였다. 단기간에 많은 것을 성취하려 하기 보다는 장기간의 관점을 갖고 체계적인 분석계획을 수립하는 것이 중요하다.

 마지막으로 세 번째는 단순히 정보와 지식을 생성하고 사용자에게 제공하는 선에서 머물지 말고 향후 인텔리전트(intelligent) 운영(operation) 또는 관리(management)에 사용되는 단계로까지 발전해야 한다는 것이다. 이미 일반 경영이나 운영 분야에서는 이 ‘인텔리전스(intelligence)’ 개념을 운영이나 관리에 접목시킨 지 오래되었다.

1990년대 초반 가트너 그룹의 분석가였던 하워드 드레스너(Howard Dresner)에 의해 BI(Business Intelligence)라는 용어가 처음 사용되면서부터 그 의미와 범위에 대해 많은 토론이 이루어져 왔는데, 드레스너는 BI를 '사실(facts) 기반의 지원 시스템(support systems)을 사용하여 경영적 의사결정을 향상시키기 위한 개념 및 방법'이라고 정의하였다.

사실 BI의 의미를 좀 더 확대하여 본다면 그 기원을 1958년까지 끌어올릴 수도 있는데, IBM의 연구원이었던 한스 피터 룬(Hans Peter Luhn)은 인텔리전스(Intelligence)라는 용어를 '성취하고자 하는 목적을 달성하는데 필요한 행동들을 알려주는 방법으로, 그들 앞에 존재하고 있는 사실들 간의 상호관계를 파악할 수 있는 능력'이라고 정의 내리면서 매우 확장된 의미로 사용하고 있다.

즉, 결국엔 똑똑한 운영 또는 관리를 하겠다는 이야기와 다름이 없다. 우둔한 사람보다는 똑똑한 사람이 사회에서 여러모로 뛰어난 능력을 보여주듯이 병원과 같은 조직도 좀 더 똑똑한 조직이 좋은 성과를 낸다는 것은 당연한 일이기 때문이다. 자료의 수집 및 정보와 지식의 생성과정은 이러한 똑똑한 조직의 운영에 필수요소가 된다.

 그동안 병원협회의 데이터 활용수준은 각 업무담당직원들의 개인역량에 의존하는 형태에 머물고 있었다. 각 업무의 담당자들이 자신이 필요한 데이터를 나름대로 수집하고 분석하여 자신의 업무에 사용한 후, 자신의 PC에 보관 및 관리하는 수준에 머무르고 있었다고 볼 수 있다.

이러한 데이터 관리 형태의 가장 큰 문제점은 데이터 활용의 성패가 업무담당직원 개인의 역량에 지나치게 의존되어 있다는 것이며, 두 번째는 어렵게 수집되고 분석된 정보가 활발하게 공유되지 못하기 때문에 유사한 형태와 내용의 데이터를 중복적으로 수집하고 분석하게 되는 비효율이 발생할 수 있다는 것이다.

따라서 개인의 역량에 의존하는 위험에서 조직의 데이터 활용 능력으로 변화 시키고, 효율적인 자료의 수집 및 정보와 지식의 생성 체계를 갖추어 좀 더 신속하고 정확한 (즉, 똑똑한) 조직의 운영에 도움이 되어야 한다는 것이다.

 서두에서도 언급했듯이 이제 겨우 시작 중에서도 첫 단계를 이루었을 뿐이다. 자료를 수집한 것만으로는 아무것도 이룰 수 없다. 최종사용자들의 요구사항을 분석하고 분석된 요구사항을 만족시켜줄 수 있는 정보의 형태로 가공할 수 있는 추가적인 자료와 분석 기법 등에 대해 지속적으로 논의해야 할 시점이다. 가장 먼저 필요한 것은 향후 수행해야 할 각 단계들을 정의하고, 각 단계마다의 수행 전략 및 평가 등의 체계를 갖추는 것이 무엇보다도 중요한 시점이라고 할 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사