Insight

테슬라의 자율주행을 lidar 없이 카메라만으로 구현한 방법

FSD의 정수는 Image Segmentation 에서 시작된다

2023
.
04
.
28
테슬라의 자율주행을 lidar 없이 카메라만으로 구현한 방법

자율주행 자동차를 연구하는 대부분의 기업들이 Lidar을 사용하고 있습니다. 하지만 테슬라는 lidar 기술을 “바보”라고 정의하면서 거부했죠. 완전 자율주행 , 오토파일럿을 꿈꾸는 테슬라의 Model 3 및 Model Y 시스템은 카메라 기반으로 구축되었으며, Model S 및 Model X는 lidar에 의존하고 있습니다. 하지만 차후 만들어질 모든 모델은 ‘테슬라 비전’이라 불리는 카메라를 기반으로 제작할 것이라고 선언했습니다. Uber이나 Toyota 등 다른 자율주행 자동차들이 lidar을 사용하는 것과 달리 테슬라는 어떻게 카메라로 자율주행 기능을 완성한 것일까요?

Lidar vs. Tesla vision

Lidar(Light Detection and Ranging)는 대상 물체의 거리, 속도의 방향, 온도, 대기 물질 농도 등을 측정하여 기상 관측이나 지형 매핑, 비행체 착륙 유도 등에 활용하는 기술입니다. 특히 자율주행 분야에서는 3차원 영상을 만들기 위한 핵심 센서로 사용하고 있죠.

테슬라가 사용하는 자율주행 자동차의 카메라 기능과 lidar의 가장 큰 차이점은 주변 환경을 인식하고 해석하는 방식입니다.

lidar는 레이저 센서를 사용하여 자동차 주변 환경의 3D 지도를 생성하는 원격 감지 기술입니다. lidar 센서는 물체에 반사되어 렌즈로 되돌아 오는 레이저 빔을 방출하는 방식으로 물체와의 거리나 위치 및 모양을 정확하게 측정할 수 있습니다.

테슬라 오토파일럿, 자율 주행 차량의 카메라 기능은 컴퓨터 비전 시스템으로 차량에 설치된 여러 대의 카메라를 사용해 환경의 시각적 데이터를 캡쳐합니다. 그런 다음, 캡쳐된 이미지는 머신러닝 알고리즘으로 처리되어 물체를 감지하고 식별합니다. 다시 말하자면 인간의 시각을 리버스 엔지니어링하는 셈이죠.

lidar의 주요 장점은 조도가 낮거나 악천후에도 물체를 정확하게 감지하고 측정할 수 있다는 점입니다. 도로의 잔해처럼, 카메라만으로는 놓칠 수 있는 작은 물체에 대응하는 데에 특화되어 있죠. 또한 lidar는 높은 수준의 세부 정보와 정밀도를 제공합니다.

반면 카메라는 lidar 센서보다는 상대적으로 저렴하고 크기가 작다는 것이 가장 큰 장점입니다. 카메라는 도로 표지판 및 신호등과 같은 시각적 신호를 더 잘 감지하고 식별할 수 있습니다.

테슬라 자율주행 카메라, Lidar 대신 Tesla vision
현재 대부분의 자율주행 차량은 lidar를 사용하고 있다.

테슬라 자율주행 카메라, Lidar 대신 Tesla vision

lidar는 레이저를 쏘아 돌아오는 데에 걸리는 시간을 감지해 거리를 측정하는 방식으로, 매우 높은 정확도를 자랑합니다. 최대 밀리미터까지 물체를 감지할 수 있죠. 반면, 컴퓨터 비전은 컴퓨터가 시각적으로 인식한 것들을 이해하도록 훈련시키는 인공지능 분야입니다.

테슬라는 2021년 MODEL 3와 MODEL Y에서 lidar를 제거했습니다. 뒤이어 2022년에는 MODEL S와 MODEL X에서 레이더를 제거하면서 본격적으로 Tesla Vision으로의 전환을 시작했습니다.

테슬라의 주장에 따르면, lidar가 장착된 차량과 비교했을 때 Tesla vision이 탑재된 MODEL 3와 MODEL Y는 미국과 유럽에서 능동 안전 등급을 유지하거나 개선했다고 합니다. 보행자 자동 긴급 제동(AEB) 측면에서는 더 나은 성능을 보이기도 했죠.

테슬라 자율주행 단계: Lidar 없이 카메라만으로 가능한 이유

Tesla의 카메라는 전면, 측면, 후면을 포함한 차량 주변의 적절한 위치에 배치되어 주변 환경을 포괄적으로 보여줍니다. 엄청난 양의 데이터 라벨링을 통해 사전 학습한 자동차는 실시간으로 여러 각도에서 잠재적인 위험을 감지해 대응하고, 충돌을 피할 수 있게 되었죠.

테슬라의 자율 주행 자동차는 Autopilot 시스템에 사용되는 고급 컴퓨터 비전 기술과 머신러닝 알고리즘 덕분에 lidar 없이도 자율주행이 가능해졌습니다. Autopilot 시스템은 차량 주변 환경을 인식하고 해석하기 위해 함께 작동하는 카메라와 레이더, 초음파 센서로 구성되어 있습니다. 전략적으로 배치된 카메라는 다른 차량이나 보행자, 장애물과 같은 존재들을 인식합니다.

그런 다음 카메라 피드는 딥 러닝 알고리즘을 사용하여 객체를 식별 및 추적하고, 움직임을 예측합니다. 그 결과를 기반으로 차량의 안전한 경로를 계획하는 것이 테슬라 자율 주행 자동차의 핵심입니다.

2022년 AI DAY에서 테슬라는 완전 자율 주행(FSD) 플랫폼에 대한 개선사항을 공개한 적이 있습니다. 이 날 테슬라는 교차로에서 이상하게 배치된 자동차와 관련한 사례 연구를 통해 FSD의 개선을 직접 시연했습니다.

한번에 이루어지지는 않는다

과거 테슬라 비전은 교차로를 건너기 위해 기다리고 있던 자동차를 정차된 차량으로 인식한 적이 있습니다. 테슬라는 위와 같은 시나리오에 대응하기 위해 잘못 예측된 물체를 식별하는 도구를 만들었습니다. 이 tool은 레이블을 수정하고 비디오 클립을 평가 세트로 분류하는 과정을 거칩니다.

이를 위해 테슬라는 126개의 테스트 비디오로 구성된 데이터 평가 세트를 구축했으며, 다른 비디오에서 마이닝된 데이터로 훈련 과정을 거쳤습니다. 그 결과, fsd는 더 이상 횡단 차량이 주차된 것으로 예측하지 않고 횡단을 위해 대기 중인 것으로 정확하게 식별할 수 있게 되었죠.

도로 위에서는 수많은 변수가 일어납니다. 완전 자율 주행을 위해서는 곡선 도로의 교통량이나 좁은 주차장 등의 상황에도 대응해야 합니다. 버스와 같은 대형 차량이 앞에 있을 수도 있죠. 테슬라는 방대한 데이터를 기반으로 솔루션을 강화해왔습니다. 또한, 한 차량의 문제에서 발생한 솔루션은 모델 자체의 아키텍처를 변경하지 않고도 FSD를 지원하는 모든 테슬라의 차량에 구현할 수 있도록 구축되었습니다.

테슬라 자율주행 분석 – FSD 신경망 강화를 위한 Dojo

테슬라는 앞으로 다가올 레벨 4-5 자율 주행을 위해 FSD의 신경망을 반드시 개선해야만 했습니다. 이를 위해 Dojo라고 불리는 자체 슈퍼 컴퓨터를 개발하고 있었죠.

Dojo는 캐비닛 안과 캐비닛 사이에 6개의 훈련 타일을 연결하는 시스템 트레이를 갖추고 있어, 균일한 통신이 가능합니다. 인터페이스 프로세서는 교육 타일에 데이터를 공급할 수 있죠. 통신을 위한 전체 대역폭 메모리와 고속 이더넷도 갖추고 있습니다.

각 시스템 트레이는 54개의 페타플롭을 수용할 수 있으며, 초당 800GB의 총 메모리 대역폭을 가지고 있습니다. 이 중 2개의 조립품이 하나의 캐비닛에 배치되고, 7개의 ExaPOD가 테슬라의 Palo Alto 시설에 수용될 예정이라고 하죠.

테슬라는 Dojo를 통해 보다 빠르고 적은 비용으로 모델을 훈련시킬 수 있다고 밝혔습니다.

테슬라 자율주행 원리: 왜 테슬라는 Lidar를 거부했을까?
Tesla Ai Day 2022, Full Self Driving에 대한 발표

테슬라 자율주행 원리: 왜 테슬라는 Lidar를 거부했을까?

Lidar는 자율 주행 기능을 구현하기 위해 많은 회사에서 사용하는 기술입니다. 하지만 테슬라는 카메라 기반 접근 방식을 선택했죠. 테슬라의 CEO인 Elon Musk는 자율 주행 자동차를 완성하는 핵심은 lidar가 아닌 카메라라고 강조했습니다.

비용적인 측면

그들은 이 방식이 더 비용 효율적이고 자율 주행에 적합하다고 주장해왔습니다.

실제로 카메라 기반 시스템은 일반적으로 lidar 기반 시스템보다 저렴합니다. lidar 센서는 비용이 많이 들고, 설치나 보정에도 전문 기술과 장비가 필요합니다. 반면 카메라는 쉽게 구할 수 있고 유지 관리 역시 쉽죠. 카메라는 자주 교체가 필요한 lidar 센서보다 유지 관리에 손이 덜 가는 편입니다.

카메라는 lidar 센서보다 더 작고 부피가 작기에 자동차 디자인을 단순화하고 무게를 줄일 수 있습니다. 이를 통해 자동차의 연비와 범위를 개선하면 시장에서 경쟁력을 높일 수 있죠.

카메라 비전을 사용하면 제조 비용을 절감할 수 있고, 테슬라의 자율 주행 자동차를 소비자에게 보다 저렴하게 제공할 수 있습니다.

실제 도로 위 lidar 성능

우리가 도로에서 보는 모든 것이 시각 정보입니다. lidar는 표지판처럼 고정된 물체를 감지하는 데에는 특화되어 있지만, 움직이는 물체를 인식하는 것은 다른 이야기입니다. 고속도로에서 비닐봉지가 달려든다고 해서 문제가 될 게 없지만, lidar는 그렇게 생각할 수 없죠. 갑자기 차가 멈출 것이고, 도로는 난장판이 될 지도 모릅니다. 이러한 상황은 자율 주행 자동차가 출시된 직후부터 지속적으로 제기되었던 문제였습니다.

테슬라는 그들의 카메라가 lidar와는 달리 물체가 무엇인지 감지할 수 있다고 밝혔습니다. 물체가 시야에 들어오면, 카메라가 먼저 물체의 정체에 대해 판단한 다음 그에 따라 자동차가 상황에 반응할 수 있습니다.

부족한 적응력

완전 자율 주행(FSD)에서 lidar의 가장 큰 문제점은 적응력이 부족하다는 것입니다. 대부분이 지도에 크게 의존하는 방식으로 구현되어 있으며, 실제 도로에서 테스트된 경험이 매우 적습니다. 있다고 하더라도 지도 효율이 높은 대형 도로에서만 실사용이 가능한 정도입니다. 하지만 보통 사람들이 매일 그런 도로를 운전하는 것은 아니기 때문에, 실전성이 떨어진다는 평가입니다.

사람들은 테슬라의 자동차로 10억 마일 이상을 운전했기 때문에, 예측 불가능한 도로 데이터를 방대한 양으로 쌓을 수 있었습니다. 테슬라 비전은 이렇게 얻은 데이터를 학습하고 개선하는 방식이기 때문에, lidar보다 훨씬 더 유의미한 성과를 보일 것이라고 판단한 것이죠.

Tesla Vision의 방향성과 미래: 테슬라 자율주행은 실패였나?
lidar 없이 카메라에만 의존한 테슬라 자율주행 차량의 사고 빈도가 높아지자, 비난을 피할 수 없었습니다.

Tesla Vision의 방향성과 미래: 테슬라 자율주행은 실패였나?

하지만 안타깝게도 테슬라의 오토파일럿 혁신은 시기를 잘못 찾았다는 평가를 받고 있습니다. 일론 머스크는 lidar 대신 차량에 8대의 카메라를 다는 것으로 충분하다고 주장했지만 엔지니어들의 생각은 조금 달랐죠. lidar가 없이 카메라에만 의존한다면, 빗방울이나 밝은 햇빛에 가려지는 것만으로도 오류에 노출될 수 있으며 차량 충돌과 직결될 수 있는 문제라고 말했습니다.

테슬라의 오토 파일럿은 적극적인 운전자 감독이 필요하며, 차량을 자율적으로 만들지는 못한다는 점에서 ‘레벨 2’ 판정을 받았습니다. 레벨 3의 고급 운전자 지원 시스템은 차량이 스스로 완전히 제어할 수 있고, 이상적인 조건에서 활성화된다면 운전자가 짧은 시간 동안 핸들에서 손을 뗄 수 있습니다.

엔지니어들은 FSD를 위한 테슬라 비전이 완벽하게 준비되기도 전에, 일론 머스크가 대중에게 이 기술을 공개하는 바람에 엄청난 준비를 해야만 했습니다. 테슬라가 무결점 주행을 홍보한 지 6년만에 FSD 베타 소프트웨어를 사용한 자동차는 오류 없이 주행을 마칠 수 있었지만, 여전히 일부 엔지니어들은 이 소프트웨어의 사용 위험성에 대해 경고하고 있습니다.

그럼에도, 테슬라는 자율 주행 자동차 업계에서 여전히 많은 관심을 받는 스타 브랜드입니다. 언젠가 테슬라의 말처럼 lidar 없이 카메라 비전만으로 복잡한 도로 상황을 한 눈에 판단하게 되는 날이 올 것입니다. 다만 이미 바닥에 떨어진 소비자들의 신뢰를 다시 붙잡기 위해서는, 다음 발표에는 지금보다 더 정밀한 기술 설계가 필요할 것입니다.

Talk to Expert