문송천 카이스트 교수
금년은 특히 정보화 부작용이 다사다난했다. 연초에는 3000만명에 달하는 개인정보유출사건이 있었고 연말에는 1000만명에 달하는 유사한 사건이 터졌다. 농협의 경우에는 연초 전대미문의 대형 전산장애 사태가 있었고 연말에도 이와는 판이하게 다른 유형의 장애 사고가 있었다. 이 두번째 사고는 고객계좌번호 식별 작업 중에 터져 한밤중에 고객들이 인터넷 뱅킹을 하지 못하는 소동이 벌어졌다.
이런 정보화 부작용의 유형을 대별하면 하나는 해킹 같은 외부요인형이고 다른 하나는 내부요인형이다. 금년에 큰 소동을 겪은 농협의 첫번째 사고는 외부요인형이지만 두번째 사고는 내부요인형이다.
외부요인형의 특징은 홈페이지 자체를 공격하는 데 있다. 홈페이지는 호텔의 정문처럼 고객을 맞이하는 접점이다. 홈페이지가 외부 손님을 받지 않을 방법이 없다. 그래서 외부요인형 사고는 성격상 근절할 길이 막연하다. 그런데 내부요인형 사고는 대비만 잘하면 사전에 막을 수 있다. 그러니 농협의 두번째 사건을 자세히 들여다 볼 필요가 있다. 계좌번호 식별 작업이란 무엇인가. 그것은 컴퓨터 프로그램으로 하루 일과를 시작하기 전에 계좌번호에 혹시 오류가 있는지를 검사하는 과정이다. 그래서 그 작업 중 오작동했다고 발표한 것이다.
프로그램은 컴퓨터 명령의 집합이다. 그렇다면 이 프로그램이 누군가의 고의적 조작에 의해 이런 명령 중의 일부를 고쳤다는 뜻일까. 그렇게 보기는 힘들다. 왜냐하면 컴퓨터 명령은 기계 내에서는 이진수로 변환되어 저장되기 때문에 고친다는 것 자체가 원래 금지되어 있다. 그래서 프로그램 오류라고 보기는 곤란하다. 그러면 그 다음에 생각할 수 있는 것은 무엇인가. 계좌번호 자체는 프로그램 명령이 아니라 데이터 그 자체이다.
데이터 지도에 찌꺼기 많이 끼어
간과해서는 안되는 점은 프로그램에서 계좌번호라는 데이터를 찾아 들어갈 때 그냥 바로 직접 찾아가는 것이 아니고 프로그램이 데이터 맵을 거쳐 특정 데이터를 찾아간다는 것이다. 그러니 프로그램에도 하자가 없고 데이터에도 하자가 없었다면 중간 매개체인 데이터 맵에 문제가 있을 소지가 크다.
데이터 맵이란 무엇일까. 목적지 데이터를 찾아갈 때 프로그램이 들여다 보는 가시화된 데이터 교통지도다. 문제는 오늘날 기업의 정보시스템 속에 내장되어 있는 이 데이터 지도의 대부분이 찌꺼기가 많이 끼어 있어 소위 데이터 콜레스테롤 레벨이 매우 심각하다는 점이다. 데이터 중복율이라고도 표현하는 데이터 콜레스테롤 레벨이 인체에 비유하면 250을 훨씬 넘어 무려 400 가까이 된다는 점이다.
중복율로 설명하면 평균 65%가 데이터 중복이다. 이 말은 기업이 보유하고 있는 데이터 100개 중에 무려 65개가 중복이라는 뜻이다. 그러니 65개를 완전히 제거하고 나머지 35개만을 보유하여 유지관리하는 것이 훨씬 속도도 빠르고 데이터 찌꺼기가 없어 품질도 높아지는 것이다.
그러면 왜 이렇게들 기업마다 데이터 중복을 묵인하고 넘어가는 것일까. 그것은 전혀 쓸모가 없는 데이터 중복인데도 불구하고 그런 사실을 직시 내지 인식하지 못하고 오히려 그것을 불가피한 중복으로 둔갑시켜 합리화하는 기업 현장의 업무 관행 때문이다. 이런 잘못된 관행은 시정해야 한다.
내부요인형 사고의 대부분이 데이터 맵의 비효율성에서 비롯된다는 사실을 깨닫지 않고는 정보화 부작용을 피할 길 없다. 최근의 농협 전산장애는 이런 경종의 신호탄이다. 불행한 일은 아직도 대부분의 기업에서 이런 데이터 맵에 대해 잘 모르고 있다는 점이다.
데이터 중복률 대폭 낮춰야
국가기관도 예외는 아니다. 정보화 시대 디지털 부작용의 정도는 앞으로 가면 갈수록 커지지 작아지기는 힘들다. 그러나 부작용의 정도를 대거 줄이는 방법을 지혜롭게 찾는다면 그리 어렵지만은 않을 것이다.
그 첫 단추는 데이터 중복율을 대폭 낮추는 작업이라야 한다. 그리고 나서 외부공격 유형에 대비해나가더라도 늦지 않다. 중요한 것은 첫 단추다. 그것이 인프라이기 때문이다.
과다 데이터 중복은 데이터 불일치를 낳아 데이터 오류를 유발하기 마련이다. 결국 데이터 질 저하로 정보시스템 전반에 대한 신뢰도까지 저하되는 상황으로 치달을 수밖에 없다는 점도 유념해야 한다.
외부 필자의 원고는 본지 편집방침과 일치하지 않을 수도 있습니다.
Copyright ⓒThe Naeil News. All rights reserved.
금년은 특히 정보화 부작용이 다사다난했다. 연초에는 3000만명에 달하는 개인정보유출사건이 있었고 연말에는 1000만명에 달하는 유사한 사건이 터졌다. 농협의 경우에는 연초 전대미문의 대형 전산장애 사태가 있었고 연말에도 이와는 판이하게 다른 유형의 장애 사고가 있었다. 이 두번째 사고는 고객계좌번호 식별 작업 중에 터져 한밤중에 고객들이 인터넷 뱅킹을 하지 못하는 소동이 벌어졌다.
이런 정보화 부작용의 유형을 대별하면 하나는 해킹 같은 외부요인형이고 다른 하나는 내부요인형이다. 금년에 큰 소동을 겪은 농협의 첫번째 사고는 외부요인형이지만 두번째 사고는 내부요인형이다.
외부요인형의 특징은 홈페이지 자체를 공격하는 데 있다. 홈페이지는 호텔의 정문처럼 고객을 맞이하는 접점이다. 홈페이지가 외부 손님을 받지 않을 방법이 없다. 그래서 외부요인형 사고는 성격상 근절할 길이 막연하다. 그런데 내부요인형 사고는 대비만 잘하면 사전에 막을 수 있다. 그러니 농협의 두번째 사건을 자세히 들여다 볼 필요가 있다. 계좌번호 식별 작업이란 무엇인가. 그것은 컴퓨터 프로그램으로 하루 일과를 시작하기 전에 계좌번호에 혹시 오류가 있는지를 검사하는 과정이다. 그래서 그 작업 중 오작동했다고 발표한 것이다.
프로그램은 컴퓨터 명령의 집합이다. 그렇다면 이 프로그램이 누군가의 고의적 조작에 의해 이런 명령 중의 일부를 고쳤다는 뜻일까. 그렇게 보기는 힘들다. 왜냐하면 컴퓨터 명령은 기계 내에서는 이진수로 변환되어 저장되기 때문에 고친다는 것 자체가 원래 금지되어 있다. 그래서 프로그램 오류라고 보기는 곤란하다. 그러면 그 다음에 생각할 수 있는 것은 무엇인가. 계좌번호 자체는 프로그램 명령이 아니라 데이터 그 자체이다.
데이터 지도에 찌꺼기 많이 끼어
간과해서는 안되는 점은 프로그램에서 계좌번호라는 데이터를 찾아 들어갈 때 그냥 바로 직접 찾아가는 것이 아니고 프로그램이 데이터 맵을 거쳐 특정 데이터를 찾아간다는 것이다. 그러니 프로그램에도 하자가 없고 데이터에도 하자가 없었다면 중간 매개체인 데이터 맵에 문제가 있을 소지가 크다.
데이터 맵이란 무엇일까. 목적지 데이터를 찾아갈 때 프로그램이 들여다 보는 가시화된 데이터 교통지도다. 문제는 오늘날 기업의 정보시스템 속에 내장되어 있는 이 데이터 지도의 대부분이 찌꺼기가 많이 끼어 있어 소위 데이터 콜레스테롤 레벨이 매우 심각하다는 점이다. 데이터 중복율이라고도 표현하는 데이터 콜레스테롤 레벨이 인체에 비유하면 250을 훨씬 넘어 무려 400 가까이 된다는 점이다.
중복율로 설명하면 평균 65%가 데이터 중복이다. 이 말은 기업이 보유하고 있는 데이터 100개 중에 무려 65개가 중복이라는 뜻이다. 그러니 65개를 완전히 제거하고 나머지 35개만을 보유하여 유지관리하는 것이 훨씬 속도도 빠르고 데이터 찌꺼기가 없어 품질도 높아지는 것이다.
그러면 왜 이렇게들 기업마다 데이터 중복을 묵인하고 넘어가는 것일까. 그것은 전혀 쓸모가 없는 데이터 중복인데도 불구하고 그런 사실을 직시 내지 인식하지 못하고 오히려 그것을 불가피한 중복으로 둔갑시켜 합리화하는 기업 현장의 업무 관행 때문이다. 이런 잘못된 관행은 시정해야 한다.
내부요인형 사고의 대부분이 데이터 맵의 비효율성에서 비롯된다는 사실을 깨닫지 않고는 정보화 부작용을 피할 길 없다. 최근의 농협 전산장애는 이런 경종의 신호탄이다. 불행한 일은 아직도 대부분의 기업에서 이런 데이터 맵에 대해 잘 모르고 있다는 점이다.
데이터 중복률 대폭 낮춰야
국가기관도 예외는 아니다. 정보화 시대 디지털 부작용의 정도는 앞으로 가면 갈수록 커지지 작아지기는 힘들다. 그러나 부작용의 정도를 대거 줄이는 방법을 지혜롭게 찾는다면 그리 어렵지만은 않을 것이다.
그 첫 단추는 데이터 중복율을 대폭 낮추는 작업이라야 한다. 그리고 나서 외부공격 유형에 대비해나가더라도 늦지 않다. 중요한 것은 첫 단추다. 그것이 인프라이기 때문이다.
과다 데이터 중복은 데이터 불일치를 낳아 데이터 오류를 유발하기 마련이다. 결국 데이터 질 저하로 정보시스템 전반에 대한 신뢰도까지 저하되는 상황으로 치달을 수밖에 없다는 점도 유념해야 한다.
외부 필자의 원고는 본지 편집방침과 일치하지 않을 수도 있습니다.
Copyright ⓒThe Naeil News. All rights reserved.
위 기사의 법적인 책임과 권한은 내일엘엠씨에 있습니다.
<저작권자 ©내일엘엠씨, 무단 전재 및 재배포 금지>