텍스트 마이닝 즉 비정형 데이터를 주식에 활용할 방안을 고민중이었고.
과연 힘들게 만들어도 도움이될까 하는 고민이 깊었는데
저보다 먼저 정부에서 실행하고있는게 있네요.
저는 게시판을이용한 해당종목의 관심도 매매심리를 분석해서 변수화 시켜 사용하려고했었는데
한국거래소는 부정적발을 위해 만들었군요.
비정형 데이터를 증권에 이용하는 방안이 가능성이없는 내용은 아닌가봅니다.
정형데이터에 대한 연구가 끝나면 비정형데이터까지 연구해야 진정한 투자 인공지능 프로그램이 될거라고 생각해요
정형데이터로 스스로 패턴을 학습하는 부분은 연구중인데 빨리 이부분 완성시키고 비정형모델까지 도입하고싶어요.
원문: http://www.mt.co.kr/view/mtview.php?type=1&no=2016020114525341378&outlink=1
빅데이터가 주식 부정거래 적발에까지 활용되고 있다. 게시글의 말투, 추종 게시글 등을 보고 글쓴이가 단순한 투자자인지 주식시장을 호도하려는 '작전 세력'인지를 컴퓨터가 파악하는 것이다.
2일 증권업계에 따르면 한국거래소는 지난달부터 빅데이터를 활용해 부정거래를 적발하는 사이버 시장감시시스템을 시험 가동 중이다. 이 시스템은 인터넷 상에 공개된 주식 관련 글을 광범위하게 검색, 분석하게 된다.
작전 세력들이 인터넷 게시글을 활용하는 것은 특정 종목에 대한 기대감을 형성시키기 위해서다. 호재성 공시를 확대 해석하는 글을 아이디를 바꿔가며 반복해서 올리면 마치 많은 사람들이 주가 상승을 기대하고 있는 듯한 분위기가 형성된다. 이런 글을 믿고 투자자들이 주식을 매입해 주가가 오르게 되면 작전 세력들은 주식을 팔아버리는 것이다. 이를 위계(僞計)에 의한 부정거래라고 부른다.
특히 주식 투자 카페 운영자 등 추종 매매 규모가 많은 사람들의 글은 주의할 필요가 있다. 지난해에는 무료 증권 까페 등에서 파워유저로 활동하는 A씨가 자신의 명성을 이용한 반복적인 부정거래로 약 5억원의 부당이득을 취한 사례가 적발됐다. A씨는 종목명은 공개하지 않고 추천할 날짜만 회원에게 알리며 기대감을 고조시켜 놓고 미리 복수의 계좌를 통해 추천 예정 주식을 매집했다. 예고한 일시에 종목을 추천해 주가가 오르면 A씨는 주식을 처분하는 식이다.
거래소 관계자는 "인터넷에서 자신의 판단을 공유하는 것은 개인의 자유지만 10~ 20종목에 대해 아이디, 필명을 바꿔가며 유사한 글을 지속적으로 올리는 사람들이 있다"며 "이들이 관련 종목을 사고파는 정황이 포착되면 금융당국이 조사에 들어가고 검찰에 기소될 수 있다"고 말했다.
시장감시를 위한 빅데이터는 게시글을 분석하는 데서 시작한다. 사이버감시시스템이 구축된 이후 축적된 데이터 약 2000만건을 분석한 결과 부정거래에 이용되는 게시글의 성격을 지수화시켰다. 또 감성분석을 활용해 문장의 특징, 단어 구사력, 주장의 유사성 등으로 게시자가 동일 인물인지 보다 빠르고 쉽게 파악할 수 있다.
거래소는 앞으로 테마주 등 이상징후를 조기에 포착, 투자자 경보를 발동하고 다양한 매체를 활용하고 있는 사이버 불공정거래에 대응할 예정이다.
'주식' 카테고리의 다른 글
휴대폰 방수관련(유아이엘, 서원인텍) (0) | 2016.07.15 |
---|---|
기업의 배당가능 금액 한도 (0) | 2016.06.09 |
가격제한폭 (상한가, 하한가) (0) | 2016.05.06 |
주식 -호가단위 (호가창단위) (0) | 2016.05.06 |
주식 초기접근(유진투자, 동양, 대동스틸,한국타이어, 와토스코리아) (0) | 2016.04.26 |