Open Dataset

  • KITTI
  • BDD100K
  • Cityscape

Instance Segmentation vs Semantic Segmentation

  • Segmentation은 형태를 다각형으로 표현하고 Detection은 4개의 포인트(사각형)를 사용하여 그림

image

KITTI

  • 자동차의 주행에 대한 영상을 포함한 다양한 센서로 수집된 정보들을 수집 및 가공해서 제공

  • http://www.cvlibs.net/datasets/kitti/

BDD100K

  • 2017년에 공개한 자율주행을 위한 다양한 딥러닝 어플리케이션 데이터셋
  • 다양한 도시, 환경(날씨, 시간)에 대한 데이터로 보다 현실적인 상황을 담음
  • Object Detection, Segmentation, Lane Marking 등 다양한 데이터가 존재함
  • https://bdd-data.berkeley.edu/index.html 에서 데이터 셋 다운로드 가능(로그인)

    • 100K Images와 Detection2020 Labels을 사용하여 실습

      • 100K Images
  • Detection 2020 Labels

image

image

JSON

  • JavaScript Object Notation
  • JavaScript 언어의 자료형을 텍스트로 표현한 포맷

image

  • 괄호 { } 를 기준으로 블록을 분할함
  • “이름” : 값(숫자), “값(문자열)” 형식으로 지정함
  • 괄호 [ ] 은 배열을 의미함

image

image

Cityscape

  • 다양한 도시의 도로 Semantic Segmentation Dataset
  • https://www.cityscapes-dataset.com/

image

  • 구조

image

  • aanchen_000000-000019_leftImg8bit.png : 원본 데이터

image

  • aanchen_000000-000019_gtFine_color.png : 객체를 고유한 색상으로 표현한 이미지

image

  • aanchen_000000-000019_gtFine_instanceIds.png : 각 객체를 개별적인 아이디로 구분한 이미지

image

  • aanchen_000000-000019_gtFine_labelIds.png : 각 객체를 동일한 클래스로 구분한 이미지

image

Scale을 이용해 Dataset을 찾는 방법

  • 자율주행과 관련된 다양한 데이터를 전체적으로 확인할 수 있는 사이트
    • https://scale.com/open-datasets
  • 실제 풀어야하는 문제에 대한 완벽한 공개 데이터셋은 존재하지 않음
  • 최대한 공개 데이터셋을 이용하여 시간과 비용을 절약하면서 자신만의 데이터셋을 구축하는 것이 필요
    • 데이터셋은 구축하는데 비용, 유지보수(클래스 수정 및 추가 등)가 더 힘듬
    • 공개 데이터를 보고 어떤 규격과 정책으로 데이터를 만드는지 데이터에 대한 지식을 확보하는 것이 중요

###

딥러닝 모델을 찾는 방법(Papers with code)

  • Papers With Code는 코드와 함께 공개한 논문들을 모아둔 사이트로 SOTA 모델을 활용하기 좋음