사용자:Sephyr84/연습장

이곳은 Sephyr84의 사용자 연습장으로, 사용자 문서 아래에 위치합니다. 이곳은 위키 문법 연습 및 문서 발전을 위한 공간입니다.

맵리듀스(MapReduce)는 2004년 구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 발표한 프로그래밍 모델이다.^[1]

/*맵리듀스 프로그램은 선택과 정렬을 하는 Map() 작업과 요약을 하는 Reduce() 작업으로 구성된다. "맵리듀스 시스템(기반 시설, 프레임워크)"은 대용량의 데이터를 분산 서버들에서 여러개의 작업으로 병렬 처리하고 각 작업의 결과들을 하나의 서버로 전송하고 합친다.*/

이 모델은 함수형 프로그래밍에서 일반적으로 사용되는 Map과 Reduce라는 함수에서 영감을 받았다.^[2] 맵리듀스 프레임워크의 가장 중요한 성과는 맵과 리듀스 함수에 있는 것이 아니라 확장성과 장애 허용 시스템이라는 것이다.

현재 MapReduce는 Java와 C++, 그리고 기타 언어에서 적용이 가능하도록 작성되었다. 대표적으로 아파치 하둡에서 오픈 소스 소프트웨어로 적용된다.

개요[편집]

'맵리듀스'는 대용량 데이터를 많은 수의 컴퓨터로 구성된 클러스터에서 병렬처리하는 프레임워크이다.

"Map" 과정: 마스터 노드(master node)는 입력값을 좀 더 작은 여러 문제로 나누고 워커 노드(worker node)로 분산시킨다. 워커 노드는 작은 문제들을 처리하고 그 결과를 마스터 노드로 전달한다.

"Reduce" 과정: 마스터 노드는 모든 결과값을 모아서 (처음에 풀기로 한 문제의 해답와 같은)출력값 형태로 결합한다.

맵리듀스는 map과 reduce 작업을 분산처리가 가능하게 한다. 각각의 map 작업은 다른 작업에 독립적으로 수행이 되고 모든 map 작업은 병렬로 처리된다. 그리고 비슷하게 reduce 작업은 map 작업의 결과

논리적 관점[편집]

같이 보기[편집]

참조[편집]

↑ Google spotlights data center inner workings | Tech news blog - CNET News.com
↑ "Our abstraction is inspired by the map and reduce primitives present in Lisp and many other functional languages." -"MapReduce: Simplified Data Processing on Large Clusters", by Jeffrey Dean and Sanjay Ghemawat; from Google Research

바깥 고리[편집]

위키미디어 공용에 관련된
미디어 분류가 있습니다.

Sephyr84/연습장

MapReduce-MPI MapReduce-MPI Library

이 글은 소프트웨어에 관한 토막글입니다. 여러분의 지식으로 알차게 문서를 완성해 갑시다.

[1] Google spotlights data center inner workings | Tech news blog - CNET News.com

[map-2] "Our abstraction is inspired by the map and reduce primitives present in Lisp and many other functional languages." -"MapReduce: Simplified Data Processing on Large Clusters", by Jeffrey Dean and Sanjay Ghemawat; from Google Research

[1]

[2]