바보야, 문제는 SNS야!
SNS로 전염병 및 주가 예측
“바보야, 문제는 SNS야.” 빌 클린턴 전 미국 대통령이 당선될 때의 ‘바보야, 문제는 경제야’라는 선거구호를 패러디한 이 말은 요즘 SNS(소셜 네트워크 서비스)의 위력이 어느 정도인지를 알려줄 때 흔히 인용되곤 한다.
실제로 오바마 미국 대통령은 지난 대선시 SNS를 활용해 선거자금과 지지자 동원을 성공적으로 이끌어 당선되기도 했다. 이제 SNS는 선거전에서 여론을 이끄는 지렛대 역할뿐만 아니라 아무도 모르게 자칫 파묻힐 뻔한 이슈를 찾아내 전 세계적인 관심사로 끌어올리는 시민운동의 새로운 도구로도 진화하고 있다.
그런데 온라인과 오프라인의 관계망을 형성하는 SNS의 이런 특성을 활용해 전염병 발생 및 주식시장을 예측하거나 범죄 추적 및 제품 품질 모니터링 같은 새로운 활용 모델이 개발되고 있어 눈길을 끈다.
실제로 오바마 미국 대통령은 지난 대선시 SNS를 활용해 선거자금과 지지자 동원을 성공적으로 이끌어 당선되기도 했다. 이제 SNS는 선거전에서 여론을 이끄는 지렛대 역할뿐만 아니라 아무도 모르게 자칫 파묻힐 뻔한 이슈를 찾아내 전 세계적인 관심사로 끌어올리는 시민운동의 새로운 도구로도 진화하고 있다.
그런데 온라인과 오프라인의 관계망을 형성하는 SNS의 이런 특성을 활용해 전염병 발생 및 주식시장을 예측하거나 범죄 추적 및 제품 품질 모니터링 같은 새로운 활용 모델이 개발되고 있어 눈길을 끈다.
![]() |
| ▲ SNS로 전염병 발생 및 주식시장을 예측하거나 범죄 추적 및 제품 품질 모니터링 같은 새로운 활용 모델이 개발되고 있어 눈길을 끈다. ⓒmorgueFile free photo |
만약 갑작스러운 질병이 확산될 경우 역학자들이 질병의 정체를 알아내고 확인하는 데는 상당한 시간이 소요될 수밖에 없다. 이에 따라 트위터나 페이스북 같은 SNS를 활용해 질병 발생을 예측하려는 연구가 최근 과학자들 사이에서 진행되고 있다.
예를 들면 독감과 연관된 단어가 SNS에서 활발하게 오갈 경우 그 지역에서 독감이 확산될 가능성이 높아진다는 식이다. 실제로 존스홉킨스 의대 연구팀이 ‘구글독감트렌드(Google Flu Trends)’라고 불리는 웹 플랫폼을 통해 인터넷에서 독감과 관련된 단어를 감시하는 연구를 수행한 결과, 그 같은 단어의 사용 빈도가 높아진 후 병원의 응급실 방문이 늘어난다는 사실이 밝혀졌다.
지난해 영국 브리스톨대 연구팀은 인플루엔자의 진행 단계별로 트위터 상의 데이터베이스에서 발견되는 키워드가 무엇인지 자동으로 분류할 수 있는 ‘머신 러닝 알고리즘’을 이용해 트위터 상에서 발생하는 특정 단어들을 통해 인플루엔자가 어떤 방향으로 창궐할지에 대해 알 수 있는 일종의 예측 모델을 개발하기도 했다.
또한 미국 공동연구진은 블로그와 트위터, 공식적인 감시 데이터, 뉴스 사이트 등을 추적해 계절성 독감과 신종플루에 대한 인터랙티브 지도를 구성하는 연구를 하고 있다. 하지만 문제는 이런 데이터 사용도구가 지속성과 신뢰성을 갖는다는 증거가 없다는 점이다.
따라서 일본의 국립인포머틱스연구소의 컴퓨터 언어학자인 나이젤 콜리어(Nigel Collier)는 정보의 홍수 속에서 필요한 정보를 필터링할 수 있는 방법을 개발하고 있다. 그가 개발하고 있는 도구는 지난 2010년 하이티에서 발생한 콜레라 확산을 추적하기 위해 트위터에서 생성된 데이터를 활용해 보스턴의 어린이병원 연구팀이 만든 ‘헬스맵(HealthMap)’처럼 군집 형태의 데이터를 다양한 언어에서 찾는 형태의 정보포털을 구축하는 방식이다.
SNS 이용해 범죄 단서 추적하는 모델 연구
트위터에서 발생된 데이터를 사용해 다음날 상장된 주식의 양과 가치를 예측하는 모델도 개발되고 있다. 미국의 번즈공업대학 연구팀은 트위터에서의 활동이 주식 가격 및 거래량과 얼마나 관련이 있는지 알아보기 위해 우량 상장회사 150개사를 무작위로 선택한 다음 매일의 폐장 가격과 거래량을 분석한 후 이 회사들과 관련 있는 트윗들만을 선택할 수 있는 필터를 개발했다.
이를 통해 약 3개월간 시뮬레이션 투자를 진행한 결과 평균 2.4%의 손실을 기록했다. 이에 비해 무작위로 매일 주식을 사들이고 되파는 랜덤 모델의 시뮬레이션 투자에서는 평균 손실이 5.5%로 기록됐으며, 시가 총액 및 회사 규모, 총부채율 등을 적절히 결합한 데이터를 바탕으로 한 고정 모델의 시뮬레이션 투자에서는 평균 손실이 3.8%로 나타났다.
또 주식 가격이 지난 며칠 동안의 주식 가격과 관련이 있다는 가정 하에 매일 주식을 사들이는 회귀 모델의 시뮬레이션 투자에서는 무려 8.9~13.1%의 손실을 기록했다. 그 기간 동안 다우존스 평균 주가가 4.2% 하락한 것에 비하면 트위터 데이터를 사용해 연구자들이 개발한 모델의 주식 투자 손실은 매우 양호했던 편이다.
절도와 같은 범죄의 단서를 찾는 데도 SNS가 큰 활약을 할 것으로 기대되고 있다. SNS라고 하면 흔히 해커나 이메일 사기 등의 온라인 범죄를 연상하기 쉽지만, 오프라인의 흉악 범죄를 계획할 때도 온라인의 SNS를 사용하는 이들이 많기 때문이다. 예를 들면 친구들끼리 주고받는 장난스러운 낙서나 사진들이 범죄 추적의 단서가 될 수 있다.
오스트리아에 있는 ‘Secure Business Austria’사의 연구팀은 자동화된 웹브라우저를 사용해 용의자의 페이스북 프로파일을 방문하는 것만으로도 범죄 관련 정보를 수집할 수 있는 시스템을 개발했다.
이 시스템은 수많은 메시지에 따라서 친구들의 목록이나 용의자의 사회적 행동을 보여주는 시간표와 같은 다양한 방법을 통해 정보를 보여주는데, 이를 통해 경찰이 증거를 수집할 수 있는 것.
또 영국 존무어 대학의 연구팀은 트위터나 마이스페이스 등과 같이 공개적으로 정보가 보여지는 소셜네트워크를 샅샅이 뒤져 용의자를 찾을 수 있는 소프트웨어를 개발하고 있는 것으로 알려졌다.
자동차 품질 관리 및 생산성 향상에도 도움
이뿐만이 아니다. 소비자들이 SNS에 올린 글들을 이용해 자동차의 안전과 성능에 관한 정보를 효율적으로 파악할 수 있는 정보시스템도 개발되었다. 미국 버지니아공대 연구팀은 소비자들이 자동차의 안전과 신뢰성에 대한 정보를 얻기 위해 자동차 소비자 조사결과 및 보험회사 통계자료, 각종 불만신고 접수 등의 자료를 인터넷을 통해 수집하는 것에 주목했다.
소비자들은 그런 정보를 찾을 뿐만 아니라 동시에 새로운 정보를 생성해 SNS에서 공유하기도 하므로, 그것을 잘 이용하면 자동차 품질에 대한 유용한 정보를 얻을 수 있기 때문이었다.
이에 따라 연구팀은 소비자가 자동차와 관련해 생성한 다양하고 방대한 정보더미에서 자동차의 안전과 성능에 대한 내용을 우선적으로 처리해 분석할 수 있는 의사결정지원시스템을 개발했다.
이 시스템은 컴퓨터 기반의 정보 시스템으로서 업무 담당자의 의사결정을 도울 수 있도록 설계되었는데, 이를 활용함으로써 자동차 품질관리 담당자들이 생산성 향상에 많은 도움을 받을 수 있을 것으로 보인다고 연구팀은 밝혔다.
예를 들면 독감과 연관된 단어가 SNS에서 활발하게 오갈 경우 그 지역에서 독감이 확산될 가능성이 높아진다는 식이다. 실제로 존스홉킨스 의대 연구팀이 ‘구글독감트렌드(Google Flu Trends)’라고 불리는 웹 플랫폼을 통해 인터넷에서 독감과 관련된 단어를 감시하는 연구를 수행한 결과, 그 같은 단어의 사용 빈도가 높아진 후 병원의 응급실 방문이 늘어난다는 사실이 밝혀졌다.
지난해 영국 브리스톨대 연구팀은 인플루엔자의 진행 단계별로 트위터 상의 데이터베이스에서 발견되는 키워드가 무엇인지 자동으로 분류할 수 있는 ‘머신 러닝 알고리즘’을 이용해 트위터 상에서 발생하는 특정 단어들을 통해 인플루엔자가 어떤 방향으로 창궐할지에 대해 알 수 있는 일종의 예측 모델을 개발하기도 했다.
또한 미국 공동연구진은 블로그와 트위터, 공식적인 감시 데이터, 뉴스 사이트 등을 추적해 계절성 독감과 신종플루에 대한 인터랙티브 지도를 구성하는 연구를 하고 있다. 하지만 문제는 이런 데이터 사용도구가 지속성과 신뢰성을 갖는다는 증거가 없다는 점이다.
따라서 일본의 국립인포머틱스연구소의 컴퓨터 언어학자인 나이젤 콜리어(Nigel Collier)는 정보의 홍수 속에서 필요한 정보를 필터링할 수 있는 방법을 개발하고 있다. 그가 개발하고 있는 도구는 지난 2010년 하이티에서 발생한 콜레라 확산을 추적하기 위해 트위터에서 생성된 데이터를 활용해 보스턴의 어린이병원 연구팀이 만든 ‘헬스맵(HealthMap)’처럼 군집 형태의 데이터를 다양한 언어에서 찾는 형태의 정보포털을 구축하는 방식이다.
SNS 이용해 범죄 단서 추적하는 모델 연구
트위터에서 발생된 데이터를 사용해 다음날 상장된 주식의 양과 가치를 예측하는 모델도 개발되고 있다. 미국의 번즈공업대학 연구팀은 트위터에서의 활동이 주식 가격 및 거래량과 얼마나 관련이 있는지 알아보기 위해 우량 상장회사 150개사를 무작위로 선택한 다음 매일의 폐장 가격과 거래량을 분석한 후 이 회사들과 관련 있는 트윗들만을 선택할 수 있는 필터를 개발했다.
이를 통해 약 3개월간 시뮬레이션 투자를 진행한 결과 평균 2.4%의 손실을 기록했다. 이에 비해 무작위로 매일 주식을 사들이고 되파는 랜덤 모델의 시뮬레이션 투자에서는 평균 손실이 5.5%로 기록됐으며, 시가 총액 및 회사 규모, 총부채율 등을 적절히 결합한 데이터를 바탕으로 한 고정 모델의 시뮬레이션 투자에서는 평균 손실이 3.8%로 나타났다.
또 주식 가격이 지난 며칠 동안의 주식 가격과 관련이 있다는 가정 하에 매일 주식을 사들이는 회귀 모델의 시뮬레이션 투자에서는 무려 8.9~13.1%의 손실을 기록했다. 그 기간 동안 다우존스 평균 주가가 4.2% 하락한 것에 비하면 트위터 데이터를 사용해 연구자들이 개발한 모델의 주식 투자 손실은 매우 양호했던 편이다.
절도와 같은 범죄의 단서를 찾는 데도 SNS가 큰 활약을 할 것으로 기대되고 있다. SNS라고 하면 흔히 해커나 이메일 사기 등의 온라인 범죄를 연상하기 쉽지만, 오프라인의 흉악 범죄를 계획할 때도 온라인의 SNS를 사용하는 이들이 많기 때문이다. 예를 들면 친구들끼리 주고받는 장난스러운 낙서나 사진들이 범죄 추적의 단서가 될 수 있다.
오스트리아에 있는 ‘Secure Business Austria’사의 연구팀은 자동화된 웹브라우저를 사용해 용의자의 페이스북 프로파일을 방문하는 것만으로도 범죄 관련 정보를 수집할 수 있는 시스템을 개발했다.
이 시스템은 수많은 메시지에 따라서 친구들의 목록이나 용의자의 사회적 행동을 보여주는 시간표와 같은 다양한 방법을 통해 정보를 보여주는데, 이를 통해 경찰이 증거를 수집할 수 있는 것.
또 영국 존무어 대학의 연구팀은 트위터나 마이스페이스 등과 같이 공개적으로 정보가 보여지는 소셜네트워크를 샅샅이 뒤져 용의자를 찾을 수 있는 소프트웨어를 개발하고 있는 것으로 알려졌다.
자동차 품질 관리 및 생산성 향상에도 도움
이뿐만이 아니다. 소비자들이 SNS에 올린 글들을 이용해 자동차의 안전과 성능에 관한 정보를 효율적으로 파악할 수 있는 정보시스템도 개발되었다. 미국 버지니아공대 연구팀은 소비자들이 자동차의 안전과 신뢰성에 대한 정보를 얻기 위해 자동차 소비자 조사결과 및 보험회사 통계자료, 각종 불만신고 접수 등의 자료를 인터넷을 통해 수집하는 것에 주목했다.
소비자들은 그런 정보를 찾을 뿐만 아니라 동시에 새로운 정보를 생성해 SNS에서 공유하기도 하므로, 그것을 잘 이용하면 자동차 품질에 대한 유용한 정보를 얻을 수 있기 때문이었다.
이에 따라 연구팀은 소비자가 자동차와 관련해 생성한 다양하고 방대한 정보더미에서 자동차의 안전과 성능에 대한 내용을 우선적으로 처리해 분석할 수 있는 의사결정지원시스템을 개발했다.
이 시스템은 컴퓨터 기반의 정보 시스템으로서 업무 담당자의 의사결정을 도울 수 있도록 설계되었는데, 이를 활용함으로써 자동차 품질관리 담당자들이 생산성 향상에 많은 도움을 받을 수 있을 것으로 보인다고 연구팀은 밝혔다.
저작권자 2012.10.31 ⓒ ScienceTimes |


댓글 없음:
댓글 쓰기