빅데이터 시각화에서 스토리텔링까지
빅데이터 시각화 작업만으로도 다양하게 활용할 수 있어
스마트, 모바일 확산으로 데이터 혁명이 시작됐다. 문제는 데이터 특징이 공간, 시간, 관계 등 과거와는 다르게 비정형적이라는 점이다. 그래서 분석의 틀도, 데이터 접근도 단순 데이터 분석 방식과는 다르다. 특히 빅데이터에서 시각화 작업은 일반 데이터보다 더 강조되고 있다. 분석한 결과 데이터마저도 크기 때문이다.
서울대학교 차세대융합기술연구원 이만재 공공데이터연구센터장은 “빅데이터를 분석하면 ‘이 사람을 쓰면 도움이 된다. A와 B는 친하다’와 같은 단문장으로만 결과가 나와 제대로 이해하기 어렵지만 시각화(visualization) 작업을 하게 되면 굉장히 많은 데이터들이 한눈에 들어오게 된다”며 ‘빅데이터 시각화’ 작업이 얼마나 중요하지를 힘주어 설명했다.
보통 단순 일반 데이터도 ‘인포그래피'를 만들면 이해가 쉬어진다. 빅데이터인 경우에 시각화 작업은 오히려 필수적이라고 볼 수 있다. 분석한 결과를 사람이 인지능력으로 이해할 할 수 있게 하는 것이 시각화이기 때문이다. 이만재 공공데이터연구센터장이 만든 ’폴리티즈 (www.politiz.org)‘라는 인터랙티브 웹 사이트를 보면 왜 그런지 바로 알 수 있다. 18대 국회의원들이 투표기록을 바탕으로 만든 빅데이터 분석 사이트로 ’당적, 지역구, 모임, 다선의원의 경우에는 당선 수‘ 등을 한눈에 알려준다. 뿐만 아니라 빅데이터 시각화 작업은 데이터 안에 숨어 있던 '인사이트(insight)'를 발견하는 데도 도움이 된다. ‘폴리티즈’에서 보면 박근혜 대통령은 강성 새누리당 사람보다 오히려 민주당 쪽에 가깝게 위치해 있다. 박근혜 대통령의 정치적 성향이 민주당과 비슷해서라기보다는 정책 중심이 성장보다 복지에 있어서이다. 그러나 모든 것을 다 알 수는 없다. ‘폴리티즈’를 보면 민주당 의원끼리는 링크가 조밀하고 단단한 반면 새누리당은 느슨하다. 새누리당 영역에 색깔이 다른 민주당 사람이 와 있는 모습도 확인하게 된다. 또한 새누리당이나 민주당 중진 의원들은 특이하게 시각화된 화면에서 위쪽에 포진된 모습이 보이기도 한다. 이 결과물만 가지고 왜 이런 형태로 나타나는지를 바로 이해하는 사람도 있을 수 있고, 알아내지 못하는 사람도 있을 수 있다. 이는 정치에 대한 바탕 지식 양 차이에 생긴 현상일 뿐 인지 능력이 차이는 아니라고 할 수 있다. 하지만 직접 정보를 찾아보지 않는 한 시각화된 작업물의 의미 이상을 알아낼 방법은 없다. 이만재 센터장은 “ 빅데이터를 시각화하다보면 ‘왜 이럴까?’라는 궁금증이 자주 생기지만 친절히 답을 말해주지는 않는다”며, “아는 만큼 보이기 때문에 모르면 궁금한 사람이 답을 찾아야 하고 한다”고 지적했다. 빅데이터 시각화 통해 스토리텔링 가능 그런데 바로 이 점이 빅데이터 시각화를 해야만 하는 이유이기도 하다. 정보를 찾다보면 짧게는 몇 줄, 길게는 한 국가의 역사를 구성할 수 있는 하나의 스토리가 완성되기 때문이다. 그런 과정에서 조각조각 나열된 정보를 하나로 묶어내면 많은 정보를 취할 수 있다. 거기에다 새로운 시각과 발견이 이루어기도 한다. 빅데이터 시각화를 통해 얻어진 스토리를 가지고 또 다른 이야기를 창작해낼 수도 있다. 실례를 들어보자. 뉴욕대학의 드루 콘웨이는 위키리스크에 저장돼 있는 데이터를 분석해 미국과 아프가니스탄 연합군의 병력 동향을 파악했다. 그리고는 아프가니스탄 주요 5곳을 적, 중립, 동맹지역으로 나눠 정보를 분류하고 각 지역별 활동 패턴을 분석 했다. 그 결과 탈레반의 활동 지역과 미국 동맹 지역을 쉽게 파악할 수 있고, 시간 흐름에 따른 전쟁 양상 변화 확인이 가능해졌다. 하지만 이 데이터 분석에서 정보는 이것만이 아니다. ‘왜 아프가니스탄 지역은 동맹군에 우호지역과 비우호지역으로 나뉘는 걸까? 종교적 특성이 있나? 아니면 인구구성이 다른 점이 있나? 왜 하필 특정지역에서 탈레반 활동이 활발한 것일까? 지형적으로 유리한 점이 있나?, 왜 이 지역에서 전사자가 많은 걸까?’ 등 다양한 질문이 생기게 되고 이를 바탕으로 아프가니스탄에 대한 다양한 정보를 찾게 한다. 여기서 창의성이 발휘된다면 전투를 벌이는 지형적 특성을 가지고 게임 시나리오를 구성할 수 있고, 로맨스를 덧붙여 전쟁 속 사랑 이야기를 소설이나 영화할 수도 있다. 교육적으로 다양하게 활용할 수 있어
이 센터장은 “레미제라블을 가지고 각 챕터별 등장인물을 구별하여 서로 링크데이터를 만들었는데, 장발장을 중심으로 어떻게 인물들이 엮었는지 한 눈에 들어왔을 뿐만 아니라 그들의 생각과 시대적 상황을 정리해 볼 수 있었다”고 설명했다. 우리 주변에 이런 소설은 많다. 필독서로 여겨지는 삼국지만해도 어마어마한 인물들이 나온다. 시대적 상황, 당시 전쟁 전략과 전술, 인간관계, 철학 등을 오로지 하나의 시각화된 작업물 하나로 가능하다고 할 수 있다. 물론 그들의 관계를 분석하는 것만으로도 쉽지 않은 과정이겠지만 시각화만 할 수 있다면 그 자료를 가지고 다양하게 활용해볼 수 있는 셈이다. ‘빅데이터 시각화와 스토리텔링’은 대중이 데이터를 쉽게 이해하는 데만 아니라 또 다른 분야에서 다양하게 활용될 수 있지만 아쉽게도 아직 우리의 역량이 부족하다. 기존 인프라 구축과 교육도 미흡하고 이를 활용하려는 움직임 역시 이제야 시작되고 있다. 生(생) 데이터라고 할 수 있는 로우 데이터(raw data)도 많지 않다. 공공분야에서 통계청이 많은 데이터를 수집하고 있지만, 이는 1차 필터링을 통해 가공된 데이터이기 때문이다. 쉽게 말해 '면'이나 '리' 단위 데이터일 뿐 개인 데이터가 아니라고 할 수 있다. 이만재 공공데이터센터장은 “빅데이터 분석을 어떤 분야에 호기심을 가진 사람이, 혹은 그 데이터를 통해 이득을 볼 수 있는 관계자가 하도록 해야 다양하고 풍부한 주제로 이루어지게 된다”며, “직접 정부가 빅데이터를 생산하는 것보다는 인재양성과 시스템 구축에 힘써야 한다”고 강조했다. |
저작권자 2013.03.07 ⓒ ScienceTimes |



댓글 없음:
댓글 쓰기