본문 바로가기
Project/Lane detection

4. 차선인식 데이터셋 (2) - 데이터셋 소개 (BDD100K, KITTI)

by Gnaseel 2021. 8. 14.
728x90
반응형

섹션4는 차선인식에 사용되는 데이터셋의 특징을 비교하는 부분이므로, 메소드에만 관심이 있다면 넘어가도 뒤 내용을 이해하는데 지장이 없다.

섹션 4에서 다루는 내용

  1. 차선 인식 데이터셋
  2. 데이터셋의 특징 비교
  3. 각 데이터셋 별 벤치마킹 방법 소개

차선 인식 데이터셋

차선인식 데이터셋에는 많은 종류가 있다. 하지만 데이터셋마다의 특징이 있기 때문에 자신이 구현하고자 할 네트워크에 알맞은 데이터셋을 사용해야한다.

3. BDD100K

BAIR(버클리 인공지능 연구 실험실)에서 공개한 오픈소스로, 120,000,000개라는 엄청난 이미지 데이터를 가진 데이터셋이다. 이미지 뿐만 아니라 GPS, IMU, 타임스탬프까지 포함되어있어서 다양한 용도로 활용 될 수 있다.

차선인식을 위해 만들어진 데이터셋이 아니라, 도로 주행 상황에서 사용되는 모든 네트워크를 타겟으로 제작되었기 때문에 차선 뿐만 아니라 차량, 사람 등도 라벨링되어있다.

차선 분류

 

  • 2*2*8+1 가지

 

 

 

다른 데이터셋과는 다르게 조금 복잡한데, laneDirection, laneStyle, laneType 3가지로 구성되어있다.

  • laneDirection - 차선의 방향 (수직 수평)

0: parallel 1: vertical

  • laneStyle - 차선의 모양(실선, 점선)

0: solid 1: dashed

  • laneType - 차선의 종류(싱글, 더블)과 색

0: crosswalk 1: double other 2: double white 3: double yellow

4: road curb 5: single other 6: single white 7: single yellow

 

즉, 2*2*8 의 차선 조합과 차선이 아닌 지형의 조합인 2*2*8+1 = 33개의 조합을 가진다.

 

데이터셋 크기

  • Train - 84,000,000
  • Validation + Test - 36,000,000
  • TOTAL 120,000,000

이미지 크기

  • 1280 * 720 ( w * h )

특이사항

  • 차선 이외에도 많은 데이터가 존재함
  • 1억 2천만개라는 압도적인 데이터 수
  • 사실 차선인식보다는 객체인식분야에서 많이 사용됨

공식 사이트

https://bair.berkeley.edu/blog/2018/05/30/bdd/

회원가입 하고 어그리 눌러주고 다운받으면 된다. 위에 기술했다시피 용도가 매우 다양하므로, 차선인식을 위해서는 Lane marking을 다운받을것... 용량이 큰 이미지파일의 다운로드는 다른 페이지에 있기때문에

이것저것 아무거나 눌러보다가 컴퓨터에 1억2천만개의 이미지가 저장되는 참사는 일어나지 않는다.

 

장점

밤낮 시간대, 비가오거나 흐린 날씨 등 수많은 상황이 존재해서 범용적으로 사용하기 편리하고, 데이터의 개수가 아주 많음 이외에도 GPS, IMU, 도로 위 객체 등에 대한 다양한 데이터가 존재하기 때문에 여러 데이터를 함께 통합하는 목적의 네트워크에서도 사용하기 편리함

 

단점

차선 위치 정보를 파악하기 힘들다. 

구체적으로는 위와 같은 형태인데, poly2d로 2점의 위치를 제공하기 때문에 직관적으로 파악하기 힘들다.

4. KITTI vision benchmark suite

KITTI 데이터셋은 객체 인식 및 추적, 실외환경의 깊이 추정 분야에서 매우 많이 사용되는 데이터셋이지만, 차선인식을 위한 데이터셋도 존재한다.

차선 분류

  • 3가지 (도로 전체, 주행중인 도로, 도로 아님)

데이터셋 크기

  • Train - 289
  • Test - 290
  • TOTAL 579

이미지 크기

  • 1242 * 375 ( w * h ) → 이미지마다 미세하게 크기가 다름

특이사항

  • 데이터 개수 매우 적음 - 학습보다는... 검증 용도로 사용하는게 좋을 듯 함
  • 픽셀단위로 라벨링되어있음
  • VLP-16으로 측정한 라이다 데이터 제공

장점

픽셀단위로 라벨링 되어있는게 큰장점. 그리고 KITTI답게 벨로다인 퍽(VLP-16)으로 측정한 데이터도 같이 제공해준다.

 

단점

매우 작은 데이터셋. 데이터 개수가 매우 작음

500장 정도의 데이터로는 네트워크를 학습시키기 힘들다. 학습보다는 검증 용도로 사용하는게 더 적절하다.

그리고 이건 조금 의아한데, 데이터마다 사진 크기가 미묘하게 다른 경우가 있다.

이부분은 이해가 안가서 이유를 조사중...

반응형