People

데이터헌트는 주도적으로 일하는 조직입니다

AI Engineer 유지수 인터뷰

2023
.
04
.
28
by
데이터헌트 피플팀
AI Engineer 유지수 인터뷰

데이터헌트는 머신러닝 라이프사이클 전반에 AI를 활용합니다. AI를 활용한 비즈니스 프로젝트에서 작업 시간과 운영비용을 낮춰 효율을 높이고, 작업의 정확도는 더욱 높일 수 있었죠. 소규모 스타트업이었던 데이터헌트가 이런 능력을 갖출 수 있었던 것은, 유능한 AI 엔지니어 조직이 고군분투하여 데이터헌트의 기술을 연구해왔기 때문입니다. 겨울의 초입, 눈 소식이 들려오던 12월의 어느날 누구보다 바쁜 연말을 보내는 AI 엔지니어 유지수님을 모셨습니다.

AI 엔지니어, 당신이 궁금해요

Q 안녕하세요. 만나 뵙게 되어서 반갑습니다. 간단한 자기소개 부탁드릴게요.

A 안녕하세요. 저는 데이터헌트 AI 엔지니어 유지수입니다. 저희 회사에는 크게 자연어 처리와 컴퓨터 비전을 연구하는 구성원들이 있는데요. 그중에서 저는 이미지나 비디오 데이터를 주로 다루는 컴퓨터 비전 쪽 연구를 진행하고 있습니다.

Q 데이터헌트에 근무하시기 전에도 AI 엔지니어 쪽 일을 하고 계셨나요?

A 네, 맞아요. 원래도 AI 연구원으로 근무하고 있었어요. 데이터헌트에 합류한 건 올해 2월이에요.

원래 대학원 석사 시절에는 자연어 처리, 텍스트 데이터에 연관된 연구를 진행했어요. 그런데 어쩌다보니, 첫 직장에서 컴퓨터 비전, 이미지 데이터를 맡게 되었죠. 새로운 연구 분야를 알아가고 경력이 쌓이는 것도 좋았지만 한편으로는 기존에 공부했던 자연어 처리를 버리기에 조금 아쉽다고 생각했었죠. 그 때 마침 데이터헌트를 알게 되었어요. 데이터헌트는 분야에 국한되지 않고 다양한 데이터를 가공하는 곳이기 때문에, 컴퓨터 비전 외에 기존에 제가 했던 NLP도 다시 이어나갈 수 있을 것이라 생각해서 합류를 결정하게 되었습니다.

데이터헌트 AI 엔지니어의 하루 일과

Q 스타트업으로 이직하시는 것에 대해 걱정은 없으셨나요? 엔지니어님께서 생각하시는 스타트업의 매력이 궁금합니다.

A 스타트업으로 가는 것에 대해, 크게 거부감이 들지 않았어요. 저는 운이 좋았는지 모르겠지만, 연구하는 데에 있어 크게 문제가 될 일도 없었구요. 내가 주도적으로 원하는 연구를 진행할 수 있고 그 결과도 가시적으로 바로 확인할 수 있다는 점이 매력적이었어요. 이런 부분에 만족감을 느끼는 사람이라면, 스타트업도 잘 맞을 거라고 생각합니다.

Q 요즘 하고 계신 업무는 어떤 일인지 궁금합니다. 데이터헌트의 AI 엔지니어 팀이 프로젝트를 진행하는 과정이나 업무 방식을 들어볼 수 있을까요?

A 최근에는 특정한 개인을 식별 할 수 있는 정보, 그러니까 얼굴이나 자동차 번호판, 주민등록번호 뒷 번호 등을 자동으로 마스킹하는 AI 연구를 진행했어요. 국가에서 데이터를 가공할 때 필수적으로 그런 내용을 다 지우도록 만들었거든요.

처음에는 요청 데이터가 이미지였기 때문에 이미지 내 얼굴이나 자동차 번호판을 탐지하고 마스킹 할 수 있는 객체 탐지(object detection) 모델을 개발했었어요. 하지만 이후에 비디오 데이터에 대한 비식별화 모델이 필요해지면서 객체 추적(object tracking) 연구를 진행했죠. 물론 단순히 영상을 프레임 단위로 쪼개서 이미지마다 별도의 추론을 할 수는 있지만 객체 추적에서는 이전 프레임과 다음 프레임의 정보가 연결되기 때문에 특정 프레임에서 모델이 객체를 탐지를 하지 못하더라도 이전 정보를 바탕으로 해당 결과를 보완해줄 수 있어요. 저희가 개발한 모델은 이전 프레임 정보뿐만 아니라 n개의 다음 프레임의 정보도 같이 참고하는 양방향 객체 추적(Bidirectional object tracking) 모델입니다. 이미지 단위 추론, 단방향 객체 추적, 양방향 객체 추적에 대한 탐지 성능을 비교했을 때 저희가 개발한 양방향 객체 추적 모델의 성능이 가장 우수했어요.

업무 진행 과정은 케이스마다 조금씩 상이하지만, 기본적으로 먼저 프로젝트에 필요한 기술이나 데이터 등의 종류와 목적을 토대로 기초 계획을 세워요. 그 다음엔 목적에 알맞은 데이터와 모델을 탐색하고 일차적인 실험을 진행합니다. 해당 베이스 결과를 기반으로 가능성 여부를 판단하고 이후 본격적인 개발을 위해 팀원들과 아이디어와 의견을 교환하면서 저희만의 모델을 만들어 나가는 거죠. 탐색, 소통, 연구, 평가의 반복이라고 할 수 있겠네요.

데이터헌트 AI 엔지니어 유지수 인터뷰

Q 최근 AI 엔지니어 팀에서 해낸 과제나 프로젝트 중 가장 흥미로웠다거나, 문제를 해결한 사례가 있을까요?

A 최근에 제가 비식별화를 위해 오브젝트 트래킹 연구를 했다고 말씀드렸었죠. 일부 케이스에서 각기 다른 사람임에도 불구하고 유사한 대상으로 판별되어서 트래킹이 매끄럽게 이뤄지지 않는 문제가 있었어요. 단순한 이미지 유사도 비교를 사용하기엔 얼굴의 디테일한 특성이 반영되지 않아 구별이 쉽지 않았어요. 그래서 안면 인식(face-recognition)을 적용해서 구분을 해보려고 시도했죠. 기본 이미지 유사도를 확인하는 것보다 훨씬 더 좋은 결과를 얻을 수 있었어요.

추가적으로 기본적으로 모델이 제공하는 기준점이라는 체계가 있어요. ‘이 정도면 유사한 사람이다’라고 표시해주는 기능이죠. 해당 기준이 최적일 수 있지만 저희 연구에서는 아닐 수도 있거든요. 그래서 여러 파라미터를 설정해서 우리 데이터에 최적화된 파라미터가 무엇인지 확인하는 실험도 진행했습니다. 이외에도 영상에서 오브젝트가 빠르게 움직이면, 아무리 이미지로 캡쳐한다고 해도 흔들리는 경우가 많습니다. 그런 것을 ‘블러링 됐다’라고 말하는데요. 그런 이미지를 디블러링해서 흔들림을 보정하고 이미지 유사도를 비교하는 실험도 진행했습니다. 보정 없이 유사도를 비교한 것보다 좀 더 정확한 결과를 얻을 수 있었죠.

이처럼 연구를 진행하다보면 모델 자체의 성능도 중요하지만 이를 보완해줄 수 있는 다른 아이디어나 기술들이 요구될 수 있습니다. 그때마다 팀원들과 생각을 나누고 새로운 아이디어를 적용하면서 저희 기술을 고도화시키기 위해 노력하고 있습니다. 또 그에 따른 성취감도 함께 느끼고 있고요.

Q 어느덧 2023년까지 한 달밖에 남지 않았어요. 내년 데이터헌트 AI 엔지니어 팀은 어떤 길을 걸을 예정인가요?

A 지금은 AI 엔지니어 모두 각각 다른 프로젝트를 맡고 있어요. 내년부터는 모든 연구원들이 하나의 프로젝트에 참여해서 모델 서비스를 준비할 예정입니다.

이 목표를 준비하기 위해서, 많은 직원분들과 연구원들이 AI에 관련해서 꾸준히 아이데이션을 진행하고 있어요. 또 그 과정에서 발생한 아이디어들의 시장성, 구현 가능성과 기술 등 다양한 측면을 검토하며 계획을 세우는 단계에 있습니다. 그 계획만 잘 세워진다면, 저는 저희 연구원들의 실력을 믿어 의심치 않기 때문에 잘 해내리라고 생각합니다.

AI 엔지니어 관점에서 보는 AI의 미래와 방향성

Q 신뢰의 한 팀, 멋지네요. 최근에 데이터헌트 사옥 이전 등 이슈가 많습니다. 여느 때보다 바쁜 연말을 보내고 계실 텐데, AI 엔지니어 팀 분위기는 어떤가요?

A 제가 처음 데이터헌트에 합류하면서 느꼈던 건 팀 자체가 참 화기애해하다는 거예요. 그리고 각자 할 업무에 대해서 스스로 책임감을 갖고 잘 해냈다는 인상을 받았습니다.

제가 입사할 때보다 구성원들의 숫자도 많이 늘었어요. 제가 대학원이나 다른 조직에 있을 때 인원이 많아질수록 이따금 힘들어하거나 누락되는 사람이 한 명씩은 생겼던 것 같아요. 그런데 아직까지 저희는 모든 분들이 함께 발 맞춰서 잘 가고 있다고 생각해요. 다들 으쌰으쌰해서 좋은 분위기가 나니, 힘든 연말도 잘 헤쳐나갈 수 있을 겁니다.

사옥 이전도 분위기 전환에 많은 도움이 되었어요. 그 전보다 사무 공간 자체도 넓고, 회의실도 생겼고요. 아! 일에 몰입하고 싶을 때 혼자 일할 수 있는 개인적인 공간도 생겼어요. 유난히 집중력이 흐트러지는 날에 혼자만의 공간에 있으면 생산력도 훨씬 높아져요. 언제 한 번 자랑하고 싶네요.

데이터헌트 AI 엔지니어 유지수 인터뷰

Q AI의 비전은 두 말할 것도 없죠. 이에 따라 AI 엔지니어 인력 수요도 더욱 오를 것으로 예상되는데요. AI 엔지니어 직업이 데이터헌트에서 얻을 수 있는 커리어적인 가치나 경험적인 장점이 있다면 무엇이 있을까요?

A 입사 초반에 일하면서 느꼈던 점인데요. 한편으로 당연할 수 있는 부분이지만 연구원을 포함해 프로젝트에 참여하는 모든 유관부서가 함께 회의를 진행하는 모습이 인상깊었어요.

제가 전 직장에서도 AI 연구를 했지만, 어떤 프로젝트에서 메인을 맡는다고 해도 모든 회의에 연구원을 참여시키진 않았거든요. 저희에게 기술에 대한 상담이나 조언을 구하기는 하지만, 거기서 그칠 때가 대부분이었어요. 외부 기관과 협업을 하다 보니 대부분 AI 기술과는 연관이 없으신 분들이 먼저 회의를 진행하고, 거기서 나온 결론을 저희에게 전달 및 통보하는 방식이었어요.

하지만 데이터헌트는 대표님을 포함해 담당자, 기획자, 운영팀과 저희 AI 엔지니어 조직도 모두가 함께 들어가서 회의를 시작하죠. 저희도 프로젝트 과정에서 저희의 입장을 좀 더 진솔하게 말할 수 있고, 비개발자들에게 기술적인 조언과 더불어 일정 등을 협의할 수 있다는 점에서 훨씬 프로젝트가 유연하게 흐르는 느낌이었어요.

연구원이라서 오로지 연구만 하는 것이 아니라, 내가 맡은 프로젝트의 흐름을 온전히 이해하고 함께할 수 있다는 것. 소통과 협업을 강조하는 데이터헌트에서만 가능한 일이라고 생각합니다.

데이터헌트 AI 엔지니어 유지수 인터뷰

Q 앞으로 데이터헌트도 AI 엔지니어를 추가 채용할텐데요. 엔지니어님께서 생각하시기에 데이터헌트 AI 팀에 적합한 인재는 어떤 사람인가요?

A 자기 분야에 대한 이해도가 있고, 본인의 연구를 위해 꾸준히 사고하고 고민하고 소통할 수 있는 사람이죠. 단순히 지금 맡은 일이 회사 일이라고 생각하기보단 자신이 주도적으로 책임감 있게 끌고 가야 할 업무이고, 이를 통해 스스로가 발전할 수 있다고 생각하는 사람, 그런 인재가 지금 저희 팀원들과 어울린다고 생각합니다. 그런 분이 들어오신다면 서로에게 좋은 시너지를 주면서 더 적극적으로 흥미롭게 연구에 임할 수 있지 않을까요.

Q 말씀 잘 들었습니다. 조금 다른 얘기를 해볼까요? 최근에 AI 기술이 다른 방향으로 발전하면서 일반인들에게 많은 관심을 모으고 있습니다. 지수님께서 생각하시기에 향후 비전이 있다고 생각하시는 기술이나, 일반적으로 가장 많이 활용될 것으로 추정하는 AI 기술이 있으신가요?

A 최근 이슈를 끌었던 ChatGPT, Dalle 2나 NovelAI를 보면 아무래도 생성 모델 쪽이 뜨거운 것 같아요. 한동안 이 기세가 유지되지 않을까 생각합니다. 또 텍스트와 이미지 데이터가 접합된  멀티모달 모델 연구의 수요도 더욱 많아질 것 같습니다. Dalle 2나 NovelAI도 멀티모달 모델 범주에 속해있죠.

Q AI 엔지니어로써, 가장 보람을 느꼈던 순간이 있다면 언제인지 궁금합니다.

A 제가 만든 모델이 현장에서 사용되거나 다른 분들이 결과에 만족스러워하실 때 보람을 많이 느꼈던 것 같아요.

예전 회사에서 기업 보안을 위해 가방 내 위험한 물건(스마트폰, USB, 저장장치 등)을 자동으로 탐지해주는 모델을 개발했었어요. 저희가 공항에서 항공기 반입 금지 물품 검수를 위해 캐리어를 어떤 장비에 통과시키잖아요? 대기업이나 보안이 필요한 곳에서는 회사 입구에서도 그걸 하거든요.

당시 다른 카테고리에 비해 USB 탐지 성능이 좋지 않았어요. 제가 듣기로는 다른 회사도 마찬가지였다고 합니다. 문제를 해결하기 위해 여러 모델과 방안을 조사해보면서 다양한 시도를 거쳤어요. 그 과정에서 성능을 향상할 수 있었고, 실제 고객사 분들에게 시연해드렸을 때 결과를 보시고 놀라 하셨던 모습이 기억에 남습니다.

데이터헌트에서는 추천 시스템을 연구할 때가 생각나는데요. 예를 들어 사용자에게 어떤 활동을 추천해주려고 할 때, 사용자의 특성 정보가 사용될 수 있습니다. 간단하게 키나 성별이 있다고 생각해보죠. 여기서 키가 성별보다 더 중요한 정보라면 큰 가중치를 주어 결과에 대한 영향력을 높여줘야겠죠? 이렇게 원하는 추천 결과를 얻기 위해 데이터값마다 중요도를 지정하는 과정이 필요해요. 클라이언트가 중요도를 설정해줄 수도 있지만, 저희는 이것도 서비스의 일부로 가중치를 자동으로 계산해줄 방법이 없을까 고민했어요. 처음엔 힘들 것 같다는 의견도 있었죠. 하지만 고민 끝에 이 계산을 가능케 하는 방법을 찾아냈고, 납득할 수 있는 결과물을 낼 수 있었습니다. 회의에서 옆 자리에 계셨던 대표님께서 조용히 작은 목소리로 “수고하셨습니다”라고 말씀하셨던 모습이 생각이 나네요.

Q ’납득 가능한 AI’라고 하니 생각이 나는데요. 비즈니스에 AI 사용을 고려하는 기업 입장에서는 성능이 다소 떨어지더라도 ‘설명 가능한 AI’를 선호한다는 조사 결과가 있었습니다. 이 말에 대해서는 어떻게 생각하시나요?

A ‘설명 가능한 AI’에 대한 연구도 활발히 이뤄지고 있습니다. XAI라고 하죠. AI가 전달한 결과를 사용자가 이해할 수 있고, 왜 이런 식으로 결과가 나오는지 과정을 이해하는 것도 굉장히 중요한 일이라고 생각합니다. 그 과정을 토대로 성능을 개선할 수도 있고, 사용자에게는 AI의 성능에 신뢰감을 줄 수 있기 때문이죠. 저희도 이 분야에 많은 관심을 가지고 서비스 개선의 기준점으로 삼고 있습니다.

Q 오늘 긴 시간 내주셔서 감사합니다. 끝으로, 연말을 고군분투하고 계실 데이터헌트 구성원 여러분께 하고 싶으신 말씀이 있다면 부탁드립니다.

A 모든 팀원들이 자기 자리에서 책임감 있게 본인 할 일을 하고 있다는 것을 알고 있습니다. 다른 팀원이 어려움을 겪고 있을 때는 자발적으로 나서서 도와주려고 하는 모습도 알고요. 저는 그런 게 우리 회사의 좋은 점이라고 생각해요. 우리 팀원들 모두 멋있습니다. 다들 으쌰으쌰해서 건강한 연말 보냈으면 좋겠어요.

Talk to Expert