Trend

데이터라벨러 직업을 주목하는 이유

AI를 가르치는 선생님, 데이터라벨러

2023
.
04
.
28
데이터라벨러 직업을 주목하는 이유

데이터라벨러 는 무엇인가요?

‘데이터라벨링’이란 인공지능 알고리즘 고도화를 위해 AI가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업을 말합니다. 이를 도와주는 사람들을 데이터라벨러 라고 부릅니다.

데이터라벨러 는 사진, 동영상에 등장하는 동물, 사물 등 많은 요소에 라벨을 달아 속성을 부여합니다. AI는 이를 바탕으로 데이터들을 학습하면서 유사한 이미지를 인식하게 됩니다. 완결성 높은 데이터의 라벨링을 위해 ‘데이터라벨러’들은 많은 노력을 하고 있습니다.​

급속도로 떠오르기 시작한 데이터라벨러

이처럼 다양한 데이터에 인공지능(AI)이 이해할 수 있는 이름, 속성을 부여하는 ‘데이터라벨러’ 가 새로운 직업군으로 떠오른 지는 얼마 되지 않았습니다. N잡러, 부업 개념을 벗어나 ‘데이터라벨러’를 본업으로 삼는 사람까지 빠르게 증가하고 있습니다.

2021 ‘데이터라벨러’ 보고서에 따르면 국내에서 활동 중인 ‘데이터라벨러’의 46%가 전업으로 삼고 있는 것으로 나타납니다.

‘빅데이터에 눈알을 부착한다.’ 이런 표현과 인식으로 ‘데이터라벨링’에 대한 낮은 평가가 반전된 것으로 해석할 수 있습니다. 여기에 ‘데이터라벨러’가 주목받는 이유는 다음과 같습니다.

첫 번째, 일회성 작업으로 끝나지 않는 폭넓은 프로젝트

두 번째, ‘데이터라벨러’에 대한 기업들 수요의 꾸준한 증가

세 번째, 빠르게 성장하는 산업군과 더불어 증가하는 ‘데이터라벨러’의 몸값

‘데이터라벨링’을 주관하는 기업 상위 3개 기준 초급 데이터 가공 업무의 평균 시급은 17,000원 수준이며 고급 프로젝트는 평균 시급 25,000원으로 굉장히 높습니다.

더불어 자격요건에 해당하며 작업에 익숙해진 전문 ‘데이터라벨러’는 많은 금액을 가져갈 수 있습니다. 그리고 데이터 라벨링 시작이 급격히 성장함에 따라 많은 사람의 관심을 받고 있습니다.

데이터라벨링 교육생 양성

국가와 지자체가 데이터라벨링 인력 육성에 힘쓰고 있습니다

디지털 일자리에 대한 관심, 수요가 높아지는 현재, 광주광역시에서는 ‘데이터 라벨링’ 교육을 통해 2020년 시행 첫해에는 586명이 교육을 수료했고, 341명이 ‘데이터라벨러’로 활동했습니다.

이후 약 2년간의 데이터 가공인력 1,600명을 배출했습니다. 이는 기업들의 데이터 라벨링 수요가 증가함에 따른 영향이 크게 작용했습니다. 무엇보다 텍스트, 음성, 이미지 등 간단한 데이터에 컴퓨터가 스스로 학습이 가능하게 라벨링을 진행, 학습용 데이터를 구축하는 전처리 작업은 간단한 교육만으로 취업 준비생, 경력단절자 등 많은 사람들이 쉽게 취업할 수 있습니다.

관련 교육 수료자는 평과 결과를 토대로 과학기술정보통신부와 한국지능정보사회진흥원(NIA)의 ‘2022년 인공지능 학습용 데이터 구축 지원 사업’의 데이터 가공 업무에 참여해 현장 혹은 재택에서 근무할 수 있는 디지털 일자리를 제공받을 수 있습니다.

데이터라벨러, 다양한 데이터를 정제하다!

고급 프로젝트를 하는 ‘데이터라벨러’ 들은 숙련자로 인정받아서 전문적인 작업을 진행하게 됩니다. 예를 들면 높은 토익점수를 가진 데이터 라벨링은 영어 데이터 라벨링 프로젝트에 참여할 수 있습니다. 이 경우는 숙련자로 인정받아 일반 ‘데이터라벨링’ 보다 높은 활동비를 받으면서 진행할 수 있습니다.

그 외에도 스포츠 전공자는 운동과 관련된 슬로우 모션 영상 수집 프로젝트를 접하고 각자의 경험에 맞는 ‘데이터라벨링’을 진행할 수 있습니다. 20~59세 서울에 사는 일반인 500명을 대상으로 ‘데이터 라벨링’에 대해 알고 있는가?’ 설문조사를 실행했습니다. 이때 59%에 해당하는 인원이 ‘데이터 라벨링을 알고 있다’는 답변했습니다.

데이터 라벨링 시장은 업계에서는 주목할 만한 성장세를 보여주고 있으며 데이터 라벨링 시장이 꾸준히 확대될 것으로 예상합니다. 이에 대한 데이터 가공 영역·산업을 확장하는 등 생태계 활성화를 위해 노력 중입니다.

데이터헌트에서도 다양한 사람들이 쉽게 접근할 수 있는 데이터에 대해서 많은 고민을 이어가고 있습니다. 더불어 높은 완결성의 데이터를 제공하기 위해 많은 노력을 하고 있습니다.

대표적으로는 인공지능을 보조해 인간 전문가가 중간 결과물을 조정하고 그걸 다시 인공지능이 검수하는 휴먼인더루프(HITL:Human-in-the-loop) 방식을 채택하고 있으며 많은 연구개발을 앞으로 계속할 것입니다.

Table of Contents
Talk to Expert