비전 변환기

위키백과, 우리 모두의 백과사전.

비전 변환기(Vision transformer) 또는 비전 트랜스포머이미지 처리를 하는 변환기이다. 2020년 "An image is worth 16x16 words" 논문에 의해 이미지를 단어처럼 처리하면 어떨까 하는 아이디어에서 시작되어, 분야에 따라 종래의 합성곱 신경망과 비슷한 성능을 내고 있다.