AI 학습 데이터 플랫폼 ‘셀렉트스타’, 인공지능 데이터셋 경진대회 개최(~2/13)


AI 학습 데이터 플랫폼인 ‘셀렉트스타(SelectStar)’는 오는 2월 13일까지 ‘2020 인공지능 데이터셋 경진대회’를 개최한다. 이번 대회는 한국정보화진흥원(NIA)이 후원하며 중소기업, 스타트업, 연구소, 개인 연구자 등이 활용 가능한 데이터셋 예시를 모으는게 목적이다.

20200116 dataset.or .kr - 와우테일

데이터셋이란 차세대 인공지능(AI) 학습에 활용할 수 있는 데이터를 수집해 놓은 자료다. 일례로 플레이된 바둑 게임 약 3천만 수를 가져와 정책망 학습 기록을 적용시킨 알파고, 얼굴로 나이·성별 등을 판별하기 위해 수많은 사진 데이터를 적용시킨 AI 솔루션 등이 있다. 이번 대회는 한국에 맞게 구축할 수 있는 데이터세트와 그 활용 예시들을 제안하는 것이 주요 골자다.

대회 참가자는 셀렉트스타 홈페이지에 업로드 된 이미지, 영상, 오디오, 텍스트 수집 및 가공 내용 예시들을 참고할 수 있다. 데이터세트 구축에 필요한 모든 데이터 수집, 가공은 셀렉트스타가 운영하는 캐시미션 앱을 통해 크라우드 소싱 방식으로 진행된다.

크라우드소싱 방식으로 불특정 다수의 대중들을 통해 수집, 가공할 수 있는 데이터를 제안하는 것이 참가 과정의 핵심이다. 독창적인 새로운 데이터세트를 제안하는 방법, 해외에 이미 구축된 데이터세트를 국내 환경에 맞게 새롭게 변모시키는 방법 등 다양한 과정으로 참여할 수 있다. 셀렉트스타는 실용성과 범용성을 주요 심사 기준으로 삼는다는 계획이다.

셀렉트스타 관계자는 “대회를 통해 한국의 AI 발전에 도움이 될 수 있는 데이터세트 구축에 대한 아이디어를 발굴하고 추후 셀렉트스타에서 이를 직접 구축한다는 것이 대회의 본 취지”라고 전했다.

셀렉트스타는 AI 개발에 필요한 데이터를 모바일 크라우드소싱으로 수집 및 가공하는 서비스 제공에 나서고 있다. 특히 모바일 앱 ‘캐시미션’의 2만여 사용자들이 AI 기업들이 요청한 데이터 수집과 레이블링을 수행하고 보상을 받아가는 시스템이다.

지난 2018년 말 카이스트 창업팀에서 시작된 셀렉트스타는 현재 네이버, LG CNS, 한국전력, 롯데정보통신, 카이스트 등 40여 개의 고객사와 14억원의 매출을 기록했다. 지난해 7월에는 카카오벤처스에서 투자를 받았다.

https://wowtale.net/2019/07/16/select-star-funding-from-kakao-ventures/

한편, 인공지능(AI) 학습 데이터를 제공하는 국내 스타트업도 점점 늘고 있다. 셀렉트스타와 비슷하게 크라우드소싱 방식으로 제공하는 크라우드웍스도 있고, 인공지능을 활용해서 학습 데이터를 만드는 와이컴비네이터 출신의 슈퍼브에이아이도 있다. 

기사 공유하기

답글 남기기