본문으로 이동

데이터 어노테이션

위키백과, 우리 모두의 백과사전.

데이터 어노테이션(Data annotation)은 기계가 데이터를 정확하게 해석할 수 있도록 데이터세트 내에서 관련 메타데이터에 레이블을 지정하거나 태그를 다는 과정이다. 데이터세트는 이미지, 오디오 파일, 비디오 영상 또는 텍스트를 포함하여 다양한 형태를 취할 수 있다.

응용 분야

[편집]

데이터는 인공지능(AI) 개발의 근간이 되는 요소이다. AI 모델, 특히 컴퓨터 비전 및 자연어 처리 분야의 모델을 훈련시키려면 대량의 어노테이션된 데이터가 필요하다.[1] 적절한 어노테이션은 머신 러닝 알고리즘이 패턴을 인식하고 정확한 예측을 수행할 수 있도록 보장한다.[2] 일반적인 데이터 어노테이션 유형에는 분류, 바운딩 박스, 의미론적 분할, 키포인트 어노테이션 등이 있다.[3]

데이터 어노테이션은 헬스케어, 자율 주행차, 소매, 보안, 엔터테인먼트 등 AI 기반 분야에서 사용된다. 데이터를 정확하게 레이블링함으로써 머신 러닝 모델은 객체 감지, 감성 분석, 음성 인식과 같은 복잡한 작업을 더 높은 정밀도로 수행할 수 있다.[4][5]

컴퓨터 비전에서의 데이터 어노테이션

[편집]

이미지 분류

[편집]

이미지 분류(image classification)는 이미지에 미리 정의된 레이블을 할당하는 것을 포함한다. 분류된 이미지를 학습한 머신 러닝 알고리즘은 나중에 객체를 인식하고 범주를 구별할 수 있다. 예를 들어, 가구 스타일을 인식하도록 훈련된 AI 모델은 조지아 시대 안락의자와 로코코 안락의자를 구별할 수 있다.[6]

의미론적 분할

[편집]

의미론적 분할(Semantic segmentation)은 이미지의 각 픽셀을 나무, 차량, 사람, 건물 등 특정 클래스에 할당한다. 이 유형의 어노테이션은 머신 러닝 모델이 유사한 픽셀을 그룹화하여 객체를 구별하고 이미지에 대한 상세한 이해를 가능하게 한다.[7][8]

바운딩 박스

[편집]

바운딩 박스(Bounding box) 어노테이션은 이미지 내 객체 주위에 직사각형 상자를 그리는 것을 포함한다. 이 기법은 보행자, 차량, 상점 진열대의 제품과 같은 객체를 감지하고 분류하기 위해 자율 주행, 보안 감시, 소매 분석에 흔히 사용된다.[9]

3D 큐보이드

[편집]

3D 큐보이드(3D cuboid) 어노테이션은 기존 바운딩 박스에 깊이를 추가하여 모델이 객체의 공간 방향, 움직임 및 크기를 예측할 수 있도록 한다. 이 방법은 객체의 치수와 깊이를 이해하는 것이 중요한 자율 주행차 및 로봇 공학에 특히 유용하다.[10][11]

다각형 어노테이션

[편집]

곡선 또는 다면체 항목과 같이 불규칙한 모양의 객체의 경우, 다각형 어노테이션(Polygonal annotation)은 바운딩 박스보다 더 정밀한 레이블링을 제공한다. 이 기법은 의료 영상 또는 항공 지도와 같이 상세한 객체 인식이 필요한 응용 분야에 자주 사용된다.[11]

키포인트 어노테이션

[편집]

키포인트 어노테이션(Keypoint annotation)은 객체의 특정 지점(예: 얼굴 특징점 또는 신체 관절)을 표시하여 추적 및 동작 분석을 가능하게 한다. 이 방법은 얼굴 인식, 감정 감지, 스포츠 분석, 증강 현실 응용 분야에 널리 사용된다.[12]

비디오 어노테이션

[편집]

비디오 주석은 컴퓨터가 객체를 인식하고 추적할 수 있도록 비디오 속 객체에 레이블을 지정하는 과정입니다. 단일 사진에 레이블을 지정하는 것과는 달리, 비디오 주석은 객체의 움직임이나 시간 경과에 따른 변화를 보여주기 위해 여러 프레임에 걸쳐 동일한 객체를 표시해야 합니다. 이 기술은 자율주행 자동차와 보안 카메라에 필수적이지만, 객체가 빠르게 움직이거나 시야에서 가려지는 경우에는 어려움이 있을 수 있습니다.[13]

같이 보기

[편집]

각주

[편집]
  1. Data Annotation (영국 영어). 2024년 12월 7일에 원본 문서에서 보존된 문서. 2025년 3월 11일에 확인함.
  2. Sajid, Haziqa (2024년 12월 18일). The Hidden Role of Data Annotation in Everyday AI Tools (미국 영어). Unite.AI. 2025년 3월 11일에 확인함.
  3. Freire, Juliana; Koop, David (2008년 11월 19일). Provenance and Annotation of Data and Processes: Second International Provenance and Annotation Workshop, IPAW 2008, Salt Lake City, UT, USA, June 17-18, 2008 (영어). Springer. ISBN 978-3-540-89965-5.
  4. The Complete Guide to Data Annotation (영어). Anolytics. 2023년 9월 12일. 2025년 3월 11일에 확인함.
  5. Spair, Rick. 200 Tips for Mastering Generative AI (영어). Rick Spair.
  6. Ghani, Arfan (2024). Innovations in Computer Vision and Data Classification: From Pandemic Data Analysis to Environmental and Health Monitoring (영어). Springer Nature. ISBN 978-3-031-60140-8.
  7. Antonacopoulos, Apostolos. Pattern Recognition: 27th International Conference, ICPR 2024, Kolkata, India, December 1-5, 2024, Proceedings, Part XVIII. (영어). Springer Nature. ISBN 978-3-031-78456-9.
  8. Lei, Tao; Nandi, Asoke K. (2022년 10월 3일). Image Segmentation: Principles, Techniques, and Applications (영어). John Wiley & Sons. ISBN 978-1-119-85900-0.
  9. Adhikari, Bishwo; Huttunen, Heikki (January 2021). Iterative Bounding Box Annotation for Object Detection. 2020 25th International Conference on Pattern Recognition (ICPR). 4040–4046쪽. arXiv:2007.00961. doi:10.1109/ICPR48806.2021.9412956. ISBN 978-1-7281-8808-9.
  10. Moschidis, Christos; Vrochidou, Eleni; Papakostas, George A. (2025). Annotation tools for computer vision tasks. Osten, Wolfgang (편집). Seventeenth International Conference on Machine Vision (ICMV 2024). 11쪽. doi:10.1117/12.3055065. ISBN 978-1-5106-8827-8.
  11. 1 2 Thakur, Kutub; Pathan, Al-Sakib Khan; Ismat, Sadia (2023년 4월 3일). Emerging ICT Technologies and Cybersecurity: From AI and ML to Other Futuristic Technologies (영어). Springer Nature. ISBN 978-3-031-27765-8.
  12. Blomqvist, Kenneth; Hietala, Julius (2021년 9월 15일), 3D Annotation Of Arbitrary Objects In The Wild, arXiv:2109.07165
  13. SunTec (2025년 8월 1일). A Complete Video Annotation Guide. A Complete Video Annotation Guide.