2010년 6월 24일 목요일

네이버의 블로그 자동 분류

조용하던 네이버 랩에 블로그 자동 분류라는 새로운 기능이 하나 붙었다. 기계 분류로 블로그 포스트들을 자동 카테고리화하고 포스트 내의 주요 키워드를 추출하는 기능.

기계적인 구현 성능이야 랩이라는 곳에 붙은 것이니 아직은 서비스화 되기 어렵다는 것일텐데.. 그동안의 네이버 움직임을 보면 블로거들에게 가이드라인을 제시하면서 반강제적으로 따르라고 하는 듯한 느낌을 받는다.

과거에는 스마트에디터를 통해서 정형화된 항목들을 입력하게 만들었고, 이제 저런 자동 분류 및 주요 키워드 추출을 통해 평범한 포스트들이 생산되게 만드는 듯. 자동 분류의 한계는 기계 학습이기 때문에 보편적인 경우에는 상당한 적중률을 보이지만, 변형 패턴들에 대해서는 제대로 된 분류나 추출이 어렵게 된다.

이를테면 비유나 은유가 많이 사용된 포스트의 경우에는 기계 학습이 답을 주지 못할 확률이 크다. 따라서 정보성이 강한 스트레이트한 글들과 다르게 창의성이 많이 가미된 문학적(?) 글들은 정보 검색에서 소외될 수 있다. 많은 방문자를 원하는 블로거들은 점점 더 정보 검색 친화적인 글들을 쓰게 될 것이고, 정보는 많이 담겨 있으나 메마른 글들만이 인터넷에 남게 될 수도 있겠다. 개성이라는 것은 사라지고 그저 공장에서 찍어낸 듯한 똑같은 보편적인 것만 살아남는 블로고스피어? 아.. 재미없다.

inspired by http://diary.naver.com/150087364171

댓글 없음:

댓글 쓰기