Insight

휴먼인더루프, 데이터 품질 완결성에 중요한 이유

효율과 완결성 모두를 만족시키려는 노력

2023
.
05
.
3
휴먼인더루프, 데이터 품질 완결성에 중요한 이유

휴먼인더루프가 무엇인가요?

인공지능은 충분히 혁신적이지만, 변수에 의한 오차를 피할 수 없습니다. 데이터헌트에서도 이와 같은 딜레마를 극복하기 위해 데이터 라벨링 과정에서 휴먼인더루프(HITL : Human-in-the-loop) 모델을 채택했습니다.

물론 인공지능은 혼자서도 인간처럼 생각하는 것을 목표로 개발되었습니다. 하지만 혼자서 처음부터 끝까지 모든 일을 처리하는 것은 아직 어렵죠. 결국 알고리즘을 고르고, 결과물을 받아들이거나 피드백하는 것까지 모든 과정의 결정적인 주체는 인공지능이 아니라 사람이라고 할 수 있습니다.

만약 인공지능이 데이터를 분석한 뒤 정확도가 99%인 결과물을 별다른 설명 없이 사람에게 내어준다고 가정해 봅시다. 이를 본 사람은 알고리즘의 대화를 100% 신뢰하기는 어렵다는 판단이 들 수 있습니다. 1%의 변수가 어떤 일을 가져다줄지 모르기 때문입니다. 결국 인공지능의 변수를 최소화하고, 궁극적으로 상용화하기 위해서는 사람의 손길이 필요했죠. 인공지능과 사람의 컴퓨터 간 상호작용을 중심으로 한 HCI(Human-computer-interaction)를 주목하게 되었습니다.

사람과 컴퓨터의 지속적인 상호작용. 휴먼인더루프(HITL : Human-in-the-loop) 역시  HCI(Human-computer-interaction)의 소주제입니다. 데이터헌트는 이를 이용해 데이터에 대한 정확도와 신뢰도를 높이는 방법을 선택했습니다.

인공지능과 함께하는 미래와 한계

이미 인공지능 기술은 우리의 생활에 밀접하게 닿아있습니다. 예시로 자율주행 자동차의 사례를 들어보겠습니다. 자율주행 자동차는 Lv. 0부터 5까지 단계 구분이 되어있습니다. 이미 미국에서는 Lv. 4의 ‘고도 자동화 자율주행’이 실현되어 있죠. 현재까지 보고된 기술적인 문제도 없습니다.

그리고 많은 국가에서 자율주행의 상용화와 Lv. 5의 ‘완전 자동화 자율주행’을 추진하고 있습니다. 즉, 운전자가 없어도 자율주행이 가능한 시스템을 개발하기 위해 노력하고 있습니다.

하지만 아직 쉽게 상용화하기에는 넘어야 할 산이 많습니다. GM(General Motors)에서 2022년 4월 2일에 운영한 자율주행 자동차 ‘크루즈’는 주차 도중 밤에 상향등을 켜지 않아 경찰에게 정차 요청을 받았습니다. 그런데 자율주행 자동차는 경찰이 접근하자 도주했습니다. 아직 인공지능이 경찰을 만났을 때 해야 하는 알고리즘이 없었기 때문에, 장애물로 인식한 해프닝이었죠.

이렇듯 아직 인공지능은 완벽한 결과를 도출하지 못합니다. 이를 보조해 인간 전문가가 중간 결과물을 조정할 필요가 있죠. 이를 위한 최적의 해결 방안이 바로 휴먼인더루프입니다. 다양한 변수를 사람이 확인하며 데이터의 완결성을 높이는 것이죠.

답은 휴먼인더루프다

휴먼인더루프(HITL : Human-in-the-loop)는 인간 전문가가 인공지능 학습 과정 중에 중간 결과물을 확인하고, 학습 데이터를 조정하는 과정을 뜻합니다. 인공지능 학습 과정에서 인공지능이 자체적으로 결과를 도출할 때까지 기다리는 것이 원래라면 일반적인데요. 중간에 사람이 직접 개입하여 일종의 피드백 루프를 형성한다는 점에서 차별점이 있습니다.

쉽게 말하면 데이터 가공에 인공지능을 사용할 때, 인공지능이 전처리한 데이터를 사람이 검사합니다. 이후 다시 한번 인공지능이 후처리를 진행하는 것입니다. 이를 통해 데이터 처리시간과 비용은 줄이고, 정확도는 높일 수 있습니다.

휴먼인더루프 예시

자율수행 자동차에 휴먼인더루프 방식을 도입해 봅시다. 1차선 편도가 막혀있으면 인공지능은 ‘멈춤’이라는 동작만 학습·지도하게 됩니다. 이때 사람이 개입해 중앙선 반대편 차선에 차가 없는 것을 확인할 수 있으면, 중앙선을 임시로 넘어 경로를 주행할 수 있도록 하는 것입니다. 인간이 인공지능의 학습을 검수·피드백해 줌에 따라 더 나은 수행 결과를 이룰 수 있습니다.

휴먼인더루프는 인공지능의 학습으로 판단하기 어렵거나 효율이 떨어지는 상황에서 전문가의 개입으로 성능을 향상시키고, 신뢰할 수 있는 학습결과를 도출할 수 있도록 하는 방식입니다.

데이터헌트는 인공지능 기술이 상용화되고, 쉽게 접근할 수 있는 시대를 꿈꿉니다. 그래서 정확도도 높고, 속도도 빠른 데이터 라벨링과 휴먼인더루프를 통한 상호작용 체계를 채택했습니다. 사람의 도움으로 데이터 기술의 접근이 보다 쉬워지도록 개발 연구를 놓지 않을 것입니다.

Table of Contents
Talk to Expert