MP3

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
MPEG-1 or MPEG-2 Audio Layer III
확장자 .mp3
MIME 종류 audio/mpeg,[1] audio/MPA,[2] audio/mpa-robust[3]
개발 벨 연구소, 프라운호퍼 집적회로 연구소
파일 포맷 종류 오디오 압축 포맷

MP3(엠피쓰리 또는 엠피스리, MPEG Audio Layer-3, 문화어: 엠피삼[4])는 MPEG-1의 오디오 규격으로 개발된 손실압축 포맷이다. MP1, MP2를 개량하여 만들어져 가장 대중적인 음악 파일 포맷으로 여겨진다. 컴퓨터 디스크 등의 PCM 음성을 일반적으로 들을 만한 음질로 압축하여 크기를 1/10까지 줄일 수 있다.

1987년 AT&T 벨 연구소, 톰슨사와 함께 독일의 프라운호퍼 집적회로 연구소에서 개발되었다.

MPEG-2에도 Audio Layer-3이 있어 MP3라고 부르지만, MPEG-2 AudioBC (Backward Compatible)이 정식 명칭이다. MPEG-2 MP3는 압축 방식은 동일하지만, 비트율이 낮은 매체를 위한 낮은 고정 비트율, 다채널 대응이 포함되어 있다. 이 형식은 유럽형 DVD에 채용되어 있다.

또한 ISO 표준 규격이 아닌 MPEG2.5 Audio Layer 3 이라는 것도 있다.

개요[편집]

MP3는 손실 오디오 압축 포맷이다. MP3는 PCM 오디오 데이터를 사람이 듣는 데 중요하지 않은 부분을 버리고 다시 표현한 것이다.(JPEG 이미지의 손실압축기법과 비슷하다)

MP3 에서 사용하는 기술의 대부분은 음향심리학에서의 오디오 데이터의 어느 부분을 폐기할 것인가를 결정하는 데에 있다. MP3 오디오는 각기 다른 비트레이트로 압축된다. 데이터의 크기와 음질에 서로 관계가 있다. 다시 말해, 데이터의 크기가 커지면 음질은 좋아지는 반면 데이터의 크기가 작아지면, 음질과 성능은 떨어진다.

MP3PRO는 휴대용 기기가 유행하던 2003년도에 적은 용량에 많은 곡을 넣을 수 있게 고안된 리코딩테크놀레이지에서 제작한 MP3 개선판이다. SBR기술로 64Kbps에서도 음질이 128Kbps보다 더 좋은 음질을 내어준다. 최대 256Kbps까지 지원하며, 기존 MP3에 문제점이었던 낮은 KB에서의 음질 문제를 해결 한 것이다. 하지만 자체 MP3PRO 디코더를 사용하지 않고 일반 MP3 디코더를 사용하면 SBR인코딩 부분을 디코딩 못하기에 128Kbps 24Khz로 디코딩되어 음질이 떨어진다.

MP3 서라운드는, 2004년 12월에 소개된 서라운드 사운드를 위한 5.1 채널을 지원하는 포맷의 버전이다. MP3 서라운드는 표준 스테레오 MP3와 후반부, 그리고 모노가 호환된다. 또한 파일 크기 또한 비슷하다.

MP3HD 는, 무손실 방식이다.

역사[편집]

개발[편집]

MPEG, MP3를 포함하여 최근의 손실 압축은 아르헨티나 부에노스 아이레스(Buenos Aires) 대학 Oscar Bonello 교수의 초기 연구에 기본을 두고 있다. 그는 방송용 라디오 자동화를 위한 스튜디오 장비 설계에 관련이 있었다. 또한, 주된 연구 분야인 음향심리학과 음향학을 대학에서 가르쳤다(실내 음향 디자인에 관한 "Bonello Criterion"이라는 책을 낸 적도 있다.) 1983년, 그는 오디오 신호를 부호화할 때 필요한 비트 스트림을 줄이기 위해 크리티컬 밴드 마스킹(Critical Band Masking) 원리를 사용하는 아이디어를 연구하기 시작했다. 마스킹 원리는 1924년에 처음 개발되었으며 1959년 Egan-Hake와 Richard Ehmer에 의해 더욱 발전되었다. Bonello의 연구는 1987년 IBM 개인용 컴퓨터에서 하드웨어에 의해 구현되며 실시간으로 동작하는 세계 최초의 비트 압축 시스템을 만들어 냈다. 이것은 ECAM이라고 불렸다. 이 플러그인 카드와 관련된 제어 소프트웨어는 완벽히 동작하는 하나의 제품으로써 1988년 오디컴(Audicom)이란 이름으로 처음 전시되었다. 그 뒤 1990년 미국 아틀란타의 국제 NAB 라디오 전시회(Radio Exhibition)를 통해 세계에 알려졌다. 기본적인 Bonello 구현은 현재 MP3와 다른 시스템에서 쓰이고 있다. 그는 이 기술과 관련하여 어떠한 특허 내는 것을 거절하였다.

MPEG-1 Audio Layer 2 인코딩은 독일Deutsche Forschungs- und Versuchsanstalt fu"r Luft- und Raumfahrt(나중에는 Deutsches Zentrum fu"r Luft- und Raumfahrt, German Aerospace Center로 불림) 소속 Egon Meier-Engelen가 관리하는 디지털 오디오 방송(Digital Audio Broadcast) 프로젝트로 시작되었다. 이 프로젝트는 일반적으로 EU-147(1987년부터 1994년까지 운영됨)로 알려진 유레카(EUREKA) 연구 프로그램의 한 부분으로써 유럽 연합의 재정 지원을 받았다.

독일의 Erlangen-Nuremberg 대학 박사 연구생인 Karlheinz Brandenburg는 1980년대 초반 디지털 음악 압축에 대한 연구를 시작했다. 그는 어떻게 사람들이 음악을 인지하는지에 초점을 맞추고 있었다. 1989년에 그의 박사 연구는 완성되었으며 Erlangen-Nuremberg에서 조교수가 되었다. 그 뒤 프라운호퍼 게셀샤프트(1993년 Karlheinz Brandenburg는 Fraunhofer Institute의 staff로 합류)에서 과학자들과 함께 음악 압축에 관한 연구를 이어나갔다.

1991년 적용할 수 있는 두 개의 제안이 있었으나 Philips(네덜란드),CETT(프랑스), Institut fu"r Rundfunktechnik(독일)이 제안한 Musicam 기술은 높은 음질의 압축 오디오를 인코딩하는 경우에 아주 적은 계산 능력으로 소화해 낼 뿐만 아니라 명료함과 오류 내구성 때문에 채택되었다. 서브밴드 인코딩(sub-band encoding)에 기반을 둔 Musicam 포맷은 MPEG 오디오 압축 포맷(샘플 레이트, 프레임 구조, 헤더, 프레임 당 샘플 수)의 기반을 마련하는 데 주요한 역할을 했다. 그 기술과 아이디어들은 ISO MPEG Audio Layer I과 Layer II, Layer III(MP3) 형식의 정의에 모두 추가되어 있다. Honnover 대학의 Mussmann 교수가 주도하며 Leon van de Kerkhof(Layer I)와 Gerhard Stoll(Layer II)의 책임하에 표준이 수정되었다.

Leon Van de Kerkhof(네덜란드), Gerhard Stoll(독일), Leonardo Chiariglione(이탈리아), Yves-Franc,ois Dehery(프랑스), Karlheinz Brandenburg(독일)들로 구성된 연구 모임은 Musicam과 ASPEC으로부터 아이디어를 가져오는 한편 그들 스스로의 아이디어를 덧붙이기도 하였다. 그래서 192Kbps의 MP2와 같은 음질의 128kbps를 만들어 내는 방법을 만들어냈다.

모든 알고리즘은 1991년에 승인되었으며 1992년, MPEG의 첫 번째 표준 모음들 중의 한 부분으로써 완성시켰다. 그 뒤 1993년 International Organization for Standardization(ISO)/International Electrotechnical Commission(IEC) 11172-3에서 국제 표준이 되었다.

MPEG 오디오에 대한 더 많은 연구가 1994년에 이루어졌다. 그것은 MPEG-2라고 하는 MPEG의 2번째 세트 가운데 한 부분이었으며 1995년 발행된 국제 표준 International Organization for Standardization(ISO)/International Electrotechnical Commission(IEC) 13818-3로써 공식적으로 더 알려지게 된다.

인코더의 압축 효율은 일반적으로 비트 레이트에 따라 결정된다. 왜냐하면 압축율은 입력신호의 샘플링 레이트와 비트 깊이에 의존하기 때문이다. 그러나 보통 CD 매개변수를 레퍼런스(44.1KHz, 2 채널, 1채널 당 16 비트 또는 2x16 비트)로 사용하여 압축율을 나타내곤 한다. 때로는 디지털 오디오 테이프(DAT) SP가 매개변수로 쓰이기도 한다.(48KHz, 2x16 비트). 이것을 레퍼런스로 사용한 압축률은 더 높아서 손실 인코더에서 "압축률(compression ratio)"이란 단어를 무색하게 만들기도 한다.

Karlheinz Brandenburg MP3의 압축 알고리즘을 평가하기 위해 선택했던 노래가 Suzanne Vega의 노래 Tom's Diner이다. 이 노래는 부드럽고 단조로웠기 때문에 재생하는 동안 압축 포맷에서의 잘못된 부분을 듣기가 쉬웠다. 어떤 사람들은 농담 삼아 Suzanne Vega를 "MP3의 어머니"라 하기도 한다.

오늘날의 MP3에 VBR(Valiable Bit Rate) 기술은 프라운호퍼사가 아닌 Xing에서 추가한 기술이다 하지만 Xing Encoder 1.5에서는 16khz가 잘리는 버그가 있었으나 추후 개선되었다.

대중화[편집]

1994년 7월 7일, Fraunhofer Society는 I3enc라는 첫 번째 MP3 소프트웨어를 선보였다. 그 뒤 1995년 7월 14일 .mp3라는 확장자가 Fraunhofer팀에 의해 정의되었다.(이전까지는 .bit로 사용되었었다) 첫 번째 실시간 MP3 플레이어 프로그램(1995년 9월 9일 발표)과 함께 많은 사람들이 그들의 PC에서 MP3를 인코딩하고 재생할 수 있게 되었다. 그 때까지는 아주 작은 용량의 하드 디스크였기 때문에(~500MB) 컴퓨터에서 음악을 듣기 위해서는 비악기 기반 음악(non-instrument based Music)을 저장해야 했다.

MP2[편집]

1993년 10월, MP2(MPEG-1 Audio Layer 2)파일이 인터넷에 모습을 드러냈다. MP2는 Xing MPEG Audio Player를 사용하여 재생할 수 있었다. 그 뒤 MAPlay라고 하는 Tobias Banding의 유닉스 프로그램(1994년 2월 22일 초기 버전 발표. 마이크로소프트 윈도에서 동작하는 버전도 있음)을 사용하여 재생하기도 했다. 초창기 MP2를 만들어 내는 프로그램은 Xing가 유일하게 가능하였으며 cdda2wav라든지, CD 오디오에서 웨이브 형태의 오디오 파일을 만들어내는 CD 리퍼 같은 것들이 함께 쓰였다. Internet Underground Music Archive (IUMA)는 온라인 음악의 대변화의 시작점을 인정하기 시작했다. IUMA는 MP3와 웹이 대중화되기 앞서, 인터넷의 고품질 음악 웹 사이트였다. 그들은 MP3와 웹이 대중화되기 앞서 MP3 레코딩에 관한 수천가지의 권한을 제공했다.

인터넷[편집]

1995년 전반기부터 1990년 후반기까지. MP3는 인터넷에서 퍼지기 시작했다. MP3의 대중성은 널소프트(Nullsoft)의 오디오 플레이어인 윈앰프(1997년 발표)와 유닉스 오디오 플레이어인 mpg123, 그리고 네트워크 P2P 파일 공유 프로그램인 냅스터(1999년 발표)의 출현과 함께 빠르게 성장해 나갔다. 이 프로그램들은 사용자들로 하여금 MP3 공유와 수집, 제작, 재생을 보다 쉽게 해주도록 하였다.

작은 크기의 MP3파일은 P2P를 이용하여 음악을 광범위하게 공유할 수 있게 하였다. 그것은 이전까지는 불가능한 것이었다. 그렇게 무료로 음악을 공유하는 것은 음반 판매를 감소시킨다고 주장하는 주된 레코드 회사들은 냅스터에 법적소송을 걸어 냅스터를 폐쇄시켰다. 그리고 파일 공유에 적극적으로 참여한 개인 사용자들에 대해서도 법적 소송을 걸었다.

MP3의 대중성에 반하여, 온라인 소매상인들은 소유권이 있는 포맷을 사용하기 시작했다. 그 포맷은 DRM로 암호화되어 있어서 사용자들이 레코드 회사에 의해 특별히 인증되지 않은 경로로 구매된 음악을 사용하는 것을 막았다. 레코드 회사들은 P2P로 네트워크에서 파일 공유되어 사용하는 것을 막기 위해 이것은 꼭 필요한 것이라 주장했다. 그러나 이것은 또 다른 문제가 있었다. 바로 사용자들이 정식으로 구입한 노래를 다른 형태의 장치에서 재생하는 것까지 막아 버린 것이었다.(이를테면, MP3 플레이어에서는 재생할 수 있지만 개인용 컴퓨터에서는 재생하지 못한다든지) eMusic과 같은 곳은 MP3 포맷으로 서비스를 계속하여 어떤 장치에서든지 사용자들이 음악을 들을 수 있게 하고 있다.하지만 이런 일들이 있어도 꾸준히 판매가 늘어났지만 이런 일이 많아지고 계속되자 점점 판매가 줄어들었다.

인코딩[편집]

MPEG-1 표준은 MP3의 정확한 정의는 포함하고 있지 않지만 음향심리학적 예제 모델과, 비율 반복, 비규범적인 부분을 제공하고 있다. 현재에는, 구현에 대한 부분은 매우 진부하다고 암시하고 있다. 표준 구현자(표준에 따른 개발을 하는 개발자)들은 RAW 음원에 독립적인 알고리즘을 만드는 데 노력하고 있다.

인코딩 과정중 576회의 시간 도메인 샘플들이 576개의 주파수 도메인 샘플로 변환된다.(이부분은 실세계에서 음원과 컴퓨터 상의 음원의 원리를 비교해보면 이해할 수 있음) 만약 시간이 매우 짧다면, 576개 대신에 192개의 샘플만 추출될 수도 있다.(음원의 엔코딩 시간이 여유롭지 못할때). 이럴 때는 잠시동안의 약간의 노이즈가 동반 될 수 있다.(Jit)

결론적으로, 많은 MP3 인코더들이 존재하는데, 모두 생성하는 품질은 다를 수 있다. 그들에 대한 비교결과는 유효하며, 사용자에게 가장 편한 인코더를 선택하는 것이 최선의 방법이다. 매우 높은 비트레이트 샘플링에 요구되는 숙련된 사용방법은 낮은 비트레이트에서는 요구되지 않는다.

주석[편집]

  1. The audio/mpeg Media Type — RFC 3003. IETF (November 2000). 7 December 2009에 확인.
  2. MIME Type Registration of RTP Payload Formats — RFC 3555. IETF (July 2003). 7 December 2009에 확인.
  3. A More Loss-Tolerant RTP Payload Format for MP3 Audio — RFC 5219. IETF (February 2008). 7 December 2009에 확인.
  4. http://www.segye.com/Articles/SPN/ENTERTAINMENTS/Article.asp?aid=20110103003565&subctg1=&subctg2=

같이 보기[편집]