“빅데이터 활용, 데이터 비식별화에 달렸다”
지란지교데이터, 개인정보 비식별화 솔루션 ‘아이디필터’ 출시
전과정 투명하고 안전하게, 비식별화 업무 프로세스의 전주기적 관리 특징
2021년은 데이터 결합 위한 기업간 합종연횡 대세
데이터 활용 전 민감ㆍ개인정보 비식별화 필수
올해부터 주요 통신사, 금융기업, 일반 기업 등에서도 비식별 솔루션의 도입이 본격적으로 이루어질 것으로 전망되는 가운데 민감ㆍ개인정보 보호 솔루션 개발 전문 기업 (주)지란지교데이터(대표 조원희)가 데이터 비식별화 솔루션 ‘아이디필터(IDFILTER)’를 출시했다고 1일 밝혔다.
개인정보 비식별화 솔루션은 빅데이터를 활용하기에 앞서 주민등록번호와 같은 개인식별정보나 전화번호, 주소, 의료·건강 정보 등 민감한 개인정보를 익명·가명 처리해 보호하는 기능을 한다.
‘아이디필터’를 이용하면 원본 데이터를 가명 처리하거나, 범주화 처리하는 한편 삭제 또는 마스킹 처리해 개인정보를 비식별 변환한다. 이렇게 비식별화된 데이터만 쓸 수 있게 법으로 정해놨지만 개인정보 비식별화 절차를 제대로 지키지 않아 곤혹을 치르는 경우도 발생하고 있다.
실제로 인공지능(AI) 챗봇 서비스 업체는 학습에 활용된 데이터가 제대로 된 개인정보 수집 동의를 거치지 않았다는 비판을 받고 있다. 비식별화 이후 ‘적정성 평가 단계’를 거치지 않은 것이 아니냐는 목소리도 나오고 있어 비식별화 조치에 대한 관심이 쏠리고 있다.
지란지교데이터 조원희 대표는 “빅데이터를 제대로 써먹고 못 써먹느냐는 적절한 데이터 비식별화에 달렸다. 비식별화 과정은 책임소재가 명확해야 하고 비식별 민원 요청 단계부터 비식별화 후 검증을 거쳐 요구자에 전달되기까지 전체 과정 또한 투명하고 편리하게 관리되어야 한다.” 며 “이번에 출시한 아이디필터는 비식별업무 프로세스의 전주기적 관리로 기관과 실무자의 고민과 상황을 반영한 제품.”이라고 설명했다.
데이터 활용을 원하는 각계각층의 요구가 늘면서 2016년 6월, 관계 부처가 합동으로 ‘개인정보 비식별 조치 가이드라인’을 제작 배포하고 기업들의 데이터 활용 시도가 있었지만 참여연대 및 시민단체의 저항으로 활성화되지 못했다. 그러다 2020년 1월 9일 데이터 3법 개정안 본회의 통과를 거치고 같은 해 8월 개인정보보호법, 신용정보법, 정보통신망법 등 데이터 3법 개정안이 시행되면서 통계 작성, 과학적 연구, 공익적 기록보존 목적의 경우에는 가명 처리된 개인정보를 이용하거나 제공하는 일이 가능해졌다.
법 시행 후 기업 간 데이터 결합 활용 사례가 증가하고 있다. 카드사는 통신사화 손잡고 카드 소비 데이터와 통신사 이용자 이동 및 모바일 사용 데이터를 결합해 지역 관광객 특성을 분석하고 있다. 은행은 금융데이터와 유통서비스 업체의 유통 데이터를 결합해 빅데이터 기반 금융상품 개발 및 맞춤형 추천 서비스를 제공하기도 한다. 의료계에선 감염병 사태 반복을 막고 AI 예후 예측 솔루션 개발을 위해 국내 20여 개 대형병원이 협력해 코로나19를 포함한 각종 감염병 임상데이터 6만 건을 모으기로 했다. 이처럼 빅데이터 활용과 결합이 빈번해지면서 비식별화 솔루션의 역할도 커질 수밖에 없다.
개인정보 비식별화 솔루션 ‘아이디필터’는 휴리스틱 익명화ㆍ암호화ㆍ교환방법ㆍ라운딩ㆍ범주화 등 국내 가이드라인에서 제시한 17가지 비식별 기술 및 프라이버시 보호 모델 (K-익명성 / L-다양성)을 활용한 다양한 비식별 조치가 가능하다.
기업에서 보유하고 있는 민감한 개인정보의 데이터를 처리하는 동시에 품질 및 정보 보안 유지를 위해서 반드시 필요한 기술적 구성 요소를 두루 갖추고 있다. 주요 기능 및 특장점으로는 ▲프로젝트 관리 및 데이터 전주기적관리▲비식별 조치▲적정성 평가▲사후 검토▲개인/민감 정보 탐지 기술 ▲데이터 분포도 및 위험도 시뮬레이션이 있다.
특히 아이디필터는 지란지교데이터 개인정보 필터 시리즈 판매로 2006년 이후 15년 이상 축적된 개인ㆍ민감정보 탐지 기술이 반영돼 관리자가 사전에 등록해 놓은 개인/민감 정보 패턴을 정확하고 빠르게 탐지하고 처리 가능하다. 데이터 분포도 및 위험도 시뮬레이션을 통해 활용 데이터의 재식별 방지를 위한 후속 조치도 가능하다.
한국전자통신연구원(ETRI)으로부터 비식별 알고리즘 기술을 이전 받아 17가지 비식별 조치 기능의 완성도 및 안전성을 보장하고 있다. 아이디필터는 출시 전부터 2020 빅데이터 구축 사업에 아이디필터의 비식별화 엔진이 활용된 바 있으며 모비젠 등 다수의 빅데이터 분석 전문 기업들과도 협업 중에 있다.
아이디필터는 현재 GS인증 절차를 밟고 있다. GS(Good Software) 인증은 ISO/IEC 국제표준 기준을 토대로 엄격한 소프트웨어 품질 테스트를 통하여 소프트웨어의 기능, 적합성, 성능 효율성, 사용성, 신뢰성, 보안성 등 항목에 대해 기능을 평가하고 인증을 부여하는 제도이다.
조원희 대표는 “기업 규모에 관계없이 데이터를 가진 모든 기업들이 ‘아이디필터’로 편리하고 안전하게 부가가치를 만들어내는데 기여하고 싶다. 데이터3법 시행 이후 빅데이터 활용 가치가 커지면서 올해 많은 기업들이 데이터 결합을 위한 합종연횡이 대세가 될 것.”이라고 밝혔다.