비전 트랜스포머

위키백과, 우리 모두의 백과사전.
(비전 변환기에서 넘어옴)

이미지 분류를 위한 비전 변환기 아키텍처

비전 트랜스포머(Vision transformer)는 트랜스포머로 구축된 이미지 처리 모델이다. 2020년 "An image is worth 16x16 words" 논문에 의해 이미지를 단어처럼 처리하면 어떨까 하는 아이디어에서 시작되어, 분야에 따라 종래의 합성곱 신경망과 비슷한 성능을 내고 있다.

잘 알려진 프로젝트로는 Xception, ResNet,[1] DenseNet,[2] Inception[3] 등이 있다.

응용 분야[편집]

같이 보기[편집]

각주[편집]

  1. Tan, Mingxing; Le, Quoc V. (2021년 6월 23일). “EfficientNet V2: Smaller Models and Faster Training”. arXiv:2104.00298 [cs.CV]. 
  2. Huang, Gao; Liu, Zhuang; van der Maaten, Laurens; Q. Weinberger, Kilian (2018년 1월 28일). “Densely Connected Convolutional Networks”. arXiv:1608.06993 [cs.CV]. 
  3. Sarkar, Arjun (2021년 5월 20일). “Are Transformers better than CNN's at Image Recognition?”. 《Medium》 (영어). 2021년 7월 11일에 확인함. 

외부 링크[편집]