MNIST 데이터베이스

위키백과, 우리 모두의 백과사전.
둘러보기로 가기 검색하러 가기

MNIST 데이터베이스 (Modified National Institute of Standards and Technology database)는 손으로 쓴 숫자들로 이루어진 대형 데이터베이스이며, 다양한 화상 처리 시스템을 트레이닝하기 위해 일반적으로 사용된다.[1][2] 이 데이터베이스는 또한 기계 학습 분야의 트레이닝 및 테스트에 널리 사용된다.[3][4] NIST의 오리지널 데이터셋의 샘플을 재혼합하여 만들어졌다. 개발자들은 NIST의 트레이닝 데이터셋이 미국의 인구조사국 직원들로부터 취합한 이후로 테스팅 데이터셋이 미국중등학교 학생들로부터 취합되는 중에 기계 학습 실험에 딱 적합하지는 않은 것을 느꼈다.[5] 게다가 NIST의 흑백 그림들은 28x28 픽셀의 바운딩 박스와 앤티엘리어싱 처리되어 그레이스케일 레벨이 들어가 있도록 평준화되었다.[5]

MNIST sample images.
MNIST 테스트 데이터셋의 샘플 이미지.

MNIST 데이터베이스는 60,000개의 트레이닝 이미지와 10,000개의 테스트 이미지를 포함한다.[6] 트레이닝 세트의 절반과 테스트 세트의 절반은 NIST의 트레이닝 데이터셋에서 취합하였으며, 그 밖의 트레이닝 세트의 절반과 테스트 세트의 절반은 NIST의 테스트 데이터셋으로부터 취합되었다.[7]

같이 보기[편집]

각주[편집]

  1. “Support vector machines speed pattern recognition - Vision Systems Design”. 《Vision Systems Design》. 2013년 8월 17일에 확인함. 
  2. Gangaputra, Sachin. “Handwritten digit database”. 2013년 8월 17일에 확인함. 
  3. Qiao, Yu (2007). “THE MNIST DATABASE of handwritten digits”. 2013년 8월 18일에 확인함. 
  4. Platt, John C. (1999). “Using analytic QP and sparseness to speed training of support vector machines” (PDF). 《Advances in Neural Information Processing Systems》: 557–563. 2016년 3월 4일에 원본 문서 (PDF)에서 보존된 문서. 2013년 8월 18일에 확인함. 
  5. LeCun, Yann; Corinna Cortes; Christopher J.C. Burges. “MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges”. 2013년 8월 17일에 확인함. 
  6. Kussul, Ernst; Tatiana Baidyk (2004). “Improved method of handwritten digit recognition tested on MNIST database”. 《Image and Vision Computing》 22 (12): 971–981. doi:10.1016/j.imavis.2004.03.008. 
  7. Zhang, Bin; Sargur N. Srihari (2004). “Fast k -Nearest Neighbor Classification Using Cluster-Based Trees” (PDF). 《IEEE Transactions on Pattern Analysis and Machine Intelligence》 26 (4): 525–528. doi:10.1109/TPAMI.2004.1265868. PMID 15382657. 2013년 8월 18일에 확인함. 

추가 문헌[편집]

외부 링크[편집]