실시간 뉴스



[인터뷰]뉴스 헤드라인 뽑는 AI…워싱턴포스트의 실험


AWS와 헤드라인 자동추천 프로젝트 추진 '주목'

[아이뉴스24 김국배 기자] 기사 헤드라인 뽑기란 쉽지 않다. 기사의 논지를 대표하면서 이목을 집중시킬 수 있어야 한다. 10자 안팎의 글자로 독자를 유혹하는 힘든 일이다.

그런데 인공지능(AI)이 헤드라인을 자동으로 추천해준다면 어떨까. 미국 워싱턴포스트가 이 같은 시도를 하고 나서 눈길을 끈다.

한의홍 워싱턴포스트 데이터사이언스팀 엔지니어링 디렉터는 최근 서울 삼성동 코엑스에서 기자와 만나 "헤드라인을 자동으로 추천해주는 툴(tool)을 만들려 한다"고 말했다.

이 '헤드라인 자동추천'은 워싱턴포스트가 디지털 혁신을 위해 아마존웹서비스(AWS)와 진행하는 협업 프로젝트 중 하나다. 디지털 시대에 따른 미디어 소비 패턴의 변화가 배경이 됐다.

한의홍 디렉터는 "옛날에는 종이신문 헤드라인 하나만 있었다면 이제는 웹페이지, 페이스북, 트위터에도 헤드라인이 있다"며 "어떤 채널로 가느냐에 따라 '잘 되는' 헤드라인 특성이 다르다"고 말했다.

이 같은 이유로 워싱턴포스트는 소속 기자들에게 웹페이지, 페이스북 등의 기사 헤드라인을 따로 뽑을 것을 요구하고 있다. 기자들에게는 적잖은 부담이라는 게 그의 말이다.

여기에 홈페이지에 노출되는 똑같은 기사에 두 개의 다른 제목을 달도록 유도한다. 이후 '밴디토(BANDITO)'라는 헤드라인 평가 툴로 실시간으로 조회수를 비교한다.

이를 통해 처음에는 랜덤 방식으로 두 기사를 보여주다가 나중엔 더 많은 독자가 클릭하는 기사로 모든 트래픽이 가게 한다. 워싱턴포스트 사이트는 미국 내에서만 한 달에 9천만 명이 방문한다고 한다.

그는 "그런 툴이 있으니 뉴스룸은 (왜 더 많은 테스트를 하지 않느냐는) 압박을 받고, 기자들은 점점 더 많은 헤드라인을 만들어야 한다"며 "그래서 AI를 활용, 헤드라인을 자동 추천해주는 툴을 개발하려고 노력하고 있다"고 설명했다.

물론 쉬운 일은 아니다. 1년 가까이 머신러닝을 써서 10만~20만 개 기사 샘플을 학습하고 있다.

한 디렉터는 "본문 내용에서 헤드라인을 뽑을 수 있어야 하는데, 실제로는 기사에 없는 단어를 헤드라인에 쓸 때도 있다"고 어려움을 토로했다.

이 뿐만 아니라 뉴스 관련 독자가 음성으로 질문 하면 답 해줄 수 있는 서비스도 준비 중이다. 가령 '남북정상회담과 관련해 최근에 일어난 일은 무엇입니까?' '남북정상회담에서 중요한 인물은 누구입니까?' 등의 질문을 하면 의도를 파악해 관련 기사를 찾고 요약해 답 해주는 식이다.

이에 대해 그는 "우리 세대는 종이신문을 읽으면 자랐지만 다음 세대는 음성 인터페이스를 통해 독자와 대화하고 정보를 나누는 일이 중요해질 것"이라며 배경을 설명했다.

현재 AWS와 협력을 통해 개발하고 있는 검색 키워드(태그), 비디오 추천 시스템은 연내 결과물이 나올 것으로 기대하고 있다. 이는 머신러닝을 통해 기사에 맞는 적합한 태그를 추천하거나 관련된 사진, 비디오를 자동으로 찾아넣어 주는 것이다.

그는 "뉴스룸에서 태그를 넣으라고 하면 기자들에게는 또 하나의 일"이라며 "게다가 충실하게 태그를 집어넣는 기자가 있는 반면 그렇지 않은 경우도 있어 퀄리티가 일정치 않다"고 했다.

또 "대부분 기억이나 간단한 검색을 통해 비디오나 사진을 불러 오는데 개인 편차가 크다"며 "머신러닝을 통해 이를 찾는 작업이 더 정확해질 수 있을 것"이라고 덧붙였다.

제프 베조스 아마존 최고경영자(CEO)가 소유한 워싱턴포스트는 언론사이면서 '테크놀로지 회사'를 자처하고 있다.

아크 퍼블리싱(arc publishing) 플랫폼을 통해 콘텐츠제작관리시스템(CMS) 등 소프트웨어를 서비스 방식(SaaS)으로 판매한다. 미 LA타임스 등이 고객이다.

그는 "저희는 최종 상품을 가져와 쓰기보다 같이 일하며 문제를 해결하는 협력 모델을 더 원한다"고 강조했다.

김국배기자 vermeer@inews24.com






alert

댓글 쓰기 제목 [인터뷰]뉴스 헤드라인 뽑는 AI…워싱턴포스트의 실험

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스