OpenCL

OpenCL
개발자	크로노스 그룹
발표일	2009년 8월 28일(14년 전)
안정화 버전	3.0.14 / 2023년 4월 17일(11개월 전)
운영 체제	크로스 플랫폼
종류	API
라이선스	OpenCL 규격 라이센스(OpenCL specification license)
웹사이트	www.khronos.org/opencl

OpenCL(Open Computing Language)은 개방형 범용 병렬 컴퓨팅 프레임워크이다. CPU, GPU, DSP 등의 프로세서로 이루어진 이종 플랫폼에서 실행되는 프로그램을 작성할 수 있게 해 준다. OpenCL은 커널 코드를 작성하기 위한 C99 기반의 언어인 OpenCL C와 플랫폼을 정의하고 제어하기 위한 API를 포함하고 있다. OpenCL은 작업 기반(task-based) 및 데이터 기반(data-based) 병렬 컴퓨팅을 제공한다.

OpenCL이 만들어진 이유는 OpenGL이나 OpenAL이 만들어진 이유와 비슷하다. OpenGL과 OpenAL은 각각 3차원 컴퓨터 그래픽스 및 컴퓨터 오디오에 대한 산업계의 개방형 표준이다. OpenCL은 비영리 기술 컨소시엄인 크로노스 그룹(Khronos Group)에서 관리하고 있다.

역사[편집]

OpenCL은 애플이 최초로 개발했으며 OpenCL의 상표권도 애플이 가지고 있다. 그 후 AMD, 인텔, 엔비디아 등과 함께 애플은 문서를 다듬어 최초의 제안서(proposal)를 크로노스 그룹에 제출하였다. 2008년 6월 16일 크로노스 컴퓨트 워킹 그룹(Khronos Compute Working Group)이 결성되었다.^[2] 크로노스 컴퓨트 워킹 그룹에는 CPU, GPU, 임베디드 프로세서, 소프트웨어 업체들이 참여하였다. 2008년 6월부터 5개월 동안 이 그룹은 OpenCL 1.0을 만들기 위해 작업하였다. 2008년 11월 18일 마침내 기술 규격 정보를 담은 OpenCL 1.0 명세서(specification)가 완성되었다.^[3] 이 기술 명세서는 크로노스 그룹 그룹원들이 검토(review)하였다. 그 후, 2008년 12월 8일 공식적으로 발표되었다.^[4]

OpenCL은 맥 OS X 10.6 스노 레퍼드에서부터 지원된다.^[5]

스노우 레퍼드(MAC OS 10.6)는 오픈 컴퓨팅 언어(OpenCL)로 최신의 하드웨어에 대한 지원을 확장하였다. 이전에는 GPU의 방대한 기가플롭스 계산 능력을 그래픽 애플리케이션에만 사용해 왔지만, OpenCL을 통하여 이제 어떠한 응용 프로그램에서도 끌어와 쓸 수 있다. OpenCL은 C 프로그래밍 언어에 기반하고 있으며, 개방형 표준으로 제안되었다.^[6]

Snow Leopard further extends support for modern hardware with Open Computing Language (OpenCL), which lets any application tap into the vast gigaflops of GPU computing power previously available only to graphics applications. OpenCL is based on the C programming language and has been proposed as an open standard.

— 애플, 프레스 릴리즈^[5]

최초의 OpenCL 구현은 LLVM 및 Clang 컴파일러를 기반으로 한 것으로 알려졌다.

AMD는 OpenCL 및 다이렉트엑스 11을 지원하는 대신 AMD 고유의 스트림 프레임워크 내 "Close to Metal"을 포기하기로 결정했다.^[7]^[8] RapidMind는 OpenCL 채택을 공식 선언하여 자신들의 개발 플랫폼의 밑단에 쓰기로 하였는데, 여러 제조업체의 GPU를 단일 인터페이스를 통해 지원하기 위해서였다.^[9] 엔비디아는 2008년 12월 9일 자사의 GPU 컴퓨팅 툴킷에서 OpenCL 1.0을 완벽히 지원한다고 발표하였다.^[10] OpenCL과 쿠다를 비교한다면 두개의 컴퓨터 언어를 비교하는 것과 비슷하다는 입장이다.

OpenCL 명세서는 크로노스에서 개발 중이며, 관심 있는 어떤 회사에라도 개방되어 있다.

구현[편집]

2008/12/10 AMD와 엔비디아는 OpenCL 최초의 대중 시연을 실시하여 75분짜리 발표를 Siggraph Asia 2008에서 선보였다. AMD는 CPU 가속 OpenCL 시연으로 OpenCL의 코어 개수에 대한 규모가변성을 보였고, 엔비디아는 GPU-가속 시범을 보였다.^[11]^[12]

2009/03/26 GDC 2009에서는 AMD와 하복이 최초로 AMD 라데온 HD 4000 시리즈 GPU 상에서 OpenCL을 이용하여 하복 클로스(Havok Cloth)를 가속시키는 시연을 실시하였다.^[13]

2009/04/20, 엔비디아가 OpenCL 조기 접근 프로그램 참가 개발자 대상으로 자신의 OpenCL 드라이버와 SDK를 배포한다고 발표하였다.^[14]

2009년 9월 애플에서 맥 OS X 10.6 스노 레퍼드 버전에 OpenCL이 구현되었다.^[15] 스노 레퍼드에 포함되는 OpenCL은 초기에는 다음 GPU를 지원한다:^[16]

NVIDIA Geforce 8600M GT, GeForce 8800 GT, GeForce 8800 GTS, Geforce 9400M, GeForce 9600M GT, GeForce GT 120, GeForce GT 130,
ATI Radeon 4850, Radeon 4870.

예제[편집]

다음은 고속 푸리에 변환을 하는 예제이다. 호스트 프로그램은 다음과 같다. ^[17]

// GPU 장치와 계산 context를 생성한다
context = clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU, NULL, NULL, NULL);

// 작업 대기열을 생성한다
clGetDeviceIDs(NULL, CL_DEVICE_TYPE_GPU, 1, &device_id, NULL);
queue = clCreateCommandQueue(context, device_id, 0, NULL);

// 버퍼 메모리 객체를 생성한다
memobjs[0] = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(float)*2*num_entries, srcA, NULL);
memobjs[1] = clCreateBuffer(context, CL_MEM_READ_WRITE, sizeof(float)*2*num_entries, NULL, NULL);

// 계산 프로그램을 생성한다
program = clCreateProgramFromSource(context, 1, &fft1D_1024_kernel_src, NULL, NULL);

// 계산 프로그램 실행 코드를 생성한다
clBuildProgram(program, 0, NULL, NULL, NULL, NULL);

// 계산 커널을 생성한다
kernel = clCreateKernel(program, "fft1D_1024", NULL);

// args 값을 설정한다
clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&memobjs[0]);
clSetKernelArg(kernel, 1, sizeof(cl_mem), (void *)&memobjs[1]);
clSetKernelArg(kernel, 2, sizeof(float)*(local_work_size[0]+1)*16, NULL);
clSetKernelArg(kernel, 3, sizeof(float)*(local_work_size[0]+1)*16, NULL);

// 커널을 실행시킨다
global_work_size[0] = num_entries;
local_work_size[0] = 64;
clEnqueueNDRangeKernel(queue, kernel, 1, NULL, global_work_size, local_work_size, 0, NULL, NULL);

실제 계산이 이루어지는 커널 함수는 다음과 같다.^[18]^[19]

// This kernel computes FFT of length 1024. The 1024 length FFT is decomposed into
// calls to a radix 16 function, another radix 16 function and then a radix 4 function

__kernel void fft1D_1024 (__global float2 *in, __global float2 *out,
                          __local float *sMemx, __local float *sMemy) {
  int tid = get_local_id(0);
  int blockIdx = get_group_id(0) * 1024 + tid;
  float2 data[16];

  // 전역 메모리 입출력 영역 시작 주소
  in = in + blockIdx;  out = out + blockIdx;

  globalLoads(data, in, 64); // 한 덩어리로 전역 메모리 읽기
  fftRadix16Pass(data);       // 자리 변경 없이 radix-16 처리
  twiddleFactorMul(data, tid, 1024, 0);

  // 지역 메모리를 이용한 지역 shuffle
  localShuffle(data, sMemx, sMemy, tid, (((tid & 15) * 65) + (tid >> 4)));
  fftRadix16Pass(data);               // 자리 변경 없이 radix-16 처리
  twiddleFactorMul(data, tid, 64, 4); // 회전 인수 곱셈

  localShuffle(data, sMemx, sMemy, tid, (((tid >> 4) * 64) + (tid & 15)));

  // radix-4 함수 호출 4회
  fftRadix4Pass(data);
  fftRadix4Pass(data + 4);
  fftRadix4Pass(data + 8);
  fftRadix4Pass(data + 12);

  //한덩어리로 전역 메모리에 기록
  globalStores(data, out, 64);
}

같이 보기[편집]

위키미디어 공용에 관련된
미디어 분류가 있습니다.

OpenCL

참고 문헌[편집]

↑ “Khronos OpenCL Registry” (영어). Khronos Group. 2020년 4월 27일. 2020년 4월 27일에 확인함.
↑ “Khronos Launches Heterogeneous Computing Initiative”. Khronos Group. 2008년 6월 18일. 2008년 6월 20일에 원본 문서에서 보존된 문서. 2008년 6월 20일에 확인함.
↑ “OpenCL gets touted in Texas”. MacWorld. 2008년 11월 20일에 확인함.
↑ “The Khronos Group Releases OpenCL 1.0 Specification”. Khronos Group. 2010년 7월 13일에 원본 문서에서 보존된 문서. 2008년 12월 8일에 확인함.
↑ ^가 ^나 “Apple Previews Mac OS X Snow Leopard to Developers”. Apple. 2008년 6월 9일. 2012년 3월 19일에 원본 문서에서 보존된 문서. 2008년 6월 11일에 확인함.
↑ 비공식 번역
↑ “AMD Drives Adoption of Industry Standards in GPGPU Software Development”. AMD. 2008년 8월 14일. 2008년 8월 6일에 확인함.
↑ “AMD Backs OpenCL, Microsoft DirectX 11”. eWeek. 2008년 8월 14일. 2012년 3월 19일에 원본 문서에서 보존된 문서. 2008년 8월 6일에 확인함.
↑ “HPCWire: RapidMind Embraces Open Source and Standards Projects”. HPCWire. 2008년 11월 11일. 2008년 12월 18일에 원본 문서에서 보존된 문서. 2008년 11월 11일에 확인함.
↑ “NVIDIA Adds OpenCL To Its Industry Leading GPU Computing Toolkit”. Nvidia. 2008년 12월 10일. 2008년 12월 9일에 확인함.
↑ “OpenCL Demo, AMD CPU”. 2008년 12월 10일. 2009년 3월 28일에 확인함.
↑ “OpenCL Demo, NVIDIA GPU”. 2008년 12월 10일. 2009년 3월 28일에 확인함.
↑ “AMD and Havok demo OpenCL accelerated physics”. PC Perspective. 2009년 3월 26일. 2009년 4월 5일에 원본 문서에서 보존된 문서. 2009년 3월 28일에 확인함.
↑ “NVIDIA Releases OpenCL Driver To Developers”. NVIDIA. 2009년 4월 20일. 2012년 3월 19일에 원본 문서에서 보존된 문서. 2009년 4월 27일에 확인함.
↑ Dan Moren; Jason Snell (2009년 6월 8일). “Live Update: WWDC 2009 Keynote”. 《macworld.com》. MacWorld. 2009년 6월 12일에 확인함.
↑ “Mac OS X Snow Leopard – Technical specifications and system requirements”. Apple Inc. 2009년 6월 8일. 2009년 6월 12일에 확인함.
↑ “OpenCL” (PDF). SIGGRAPH2008. 2008년 8월 14일. 2012년 3월 19일에 원본 문서 (PDF)에서 보존된 문서. 2008년 8월 14일에 확인함.
↑ Fitting FFT onto the G80 Architecture를 바탕으로 구현함
↑ “Fitting FFT onto G80 Architecture” (PDF). Vasily Volkov and Brian Kazian, UC Berkeley CS258 project report. 2008년 11월 14일. May 2008에 확인함.

외부 링크[편집]

(영어) OpenCL 홈페이지
(영어) OpenCL 1.2 기술 명세서
(영어) OpenCL: What you need to know - article published in Macworld, August 2008
(영어) HPCWire: OpenCL on the Fast Track
(영어) The Khronos Group Releases OpenCL 1.0 Specification

[1] “Khronos OpenCL Registry” (영어). Khronos Group. 2020년 4월 27일. 2020년 4월 27일에 확인함.

[2] “Khronos Launches Heterogeneous Computing Initiative”. Khronos Group. 2008년 6월 18일. 2008년 6월 20일에 원본 문서에서 보존된 문서. 2008년 6월 20일에 확인함.

[macWorld-3] “OpenCL gets touted in Texas”. MacWorld. 2008년 11월 20일에 확인함.

[khronosGroup-4] “The Khronos Group Releases OpenCL 1.0 Specification”. Khronos Group. 2010년 7월 13일에 원본 문서에서 보존된 문서. 2008년 12월 8일에 확인함.

[pressrelease-5] 가 ^나 “Apple Previews Mac OS X Snow Leopard to Developers”. Apple. 2008년 6월 9일. 2012년 3월 19일에 원본 문서에서 보존된 문서. 2008년 6월 11일에 확인함.

[6] 비공식 번역

[AMDpressrelease-7] “AMD Drives Adoption of Industry Standards in GPGPU Software Development”. AMD. 2008년 8월 14일. 2008년 8월 6일에 확인함.

[eweekAMD-8] “AMD Backs OpenCL, Microsoft DirectX 11”. eWeek. 2008년 8월 14일. 2012년 3월 19일에 원본 문서에서 보존된 문서. 2008년 8월 6일에 확인함.

[RapidMindHPCWire-9] “HPCWire: RapidMind Embraces Open Source and Standards Projects”. HPCWire. 2008년 11월 11일. 2008년 12월 18일에 원본 문서에서 보존된 문서. 2008년 11월 11일에 확인함.

[Nvidia_Press_Release_2008-12-09-10] “NVIDIA Adds OpenCL To Its Industry Leading GPU Computing Toolkit”. Nvidia. 2008년 12월 10일. 2008년 12월 9일에 확인함.

[11] “OpenCL Demo, AMD CPU”. 2008년 12월 10일. 2009년 3월 28일에 확인함.

[12] “OpenCL Demo, NVIDIA GPU”. 2008년 12월 10일. 2009년 3월 28일에 확인함.

[13] “AMD and Havok demo OpenCL accelerated physics”. PC Perspective. 2009년 3월 26일. 2009년 4월 5일에 원본 문서에서 보존된 문서. 2009년 3월 28일에 확인함.

[14] “NVIDIA Releases OpenCL Driver To Developers”. NVIDIA. 2009년 4월 20일. 2012년 3월 19일에 원본 문서에서 보존된 문서. 2009년 4월 27일에 확인함.

[15] Dan Moren; Jason Snell (2009년 6월 8일). “Live Update: WWDC 2009 Keynote”. 《macworld.com》. MacWorld. 2009년 6월 12일에 확인함.

[16] “Mac OS X Snow Leopard – Technical specifications and system requirements”. Apple Inc. 2009년 6월 8일. 2009년 6월 12일에 확인함.

[siggraph-17] “OpenCL” (PDF). SIGGRAPH2008. 2008년 8월 14일. 2012년 3월 19일에 원본 문서 (PDF)에서 보존된 문서. 2008년 8월 14일에 확인함.

[18] Fitting FFT onto the G80 Architecture를 바탕으로 구현함

[VolkovKazianFFTG80-19] “Fitting FFT onto G80 Architecture” (PDF). Vasily Volkov and Brian Kazian, UC Berkeley CS258 project report. 2008년 11월 14일. May 2008에 확인함.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

v t e 크로노스 그룹 표준
활동	EGL glTF NNEF OpenCL OpenGL OpenGL ES OpenGL SC OpenVG OpenVX OpenXR SPIR SYCL Vulkan WebGL 3D Commerce Anari
비활동	COLLADA OpenML OpenKODE OpenKCam OpenMAX OpenSL ES OpenWF StreamInput WebCL

v t e macOS
버전	서버 1.0 헤라 공개 베타 10.0 치타 10.1 퓨마 10.2 재규어 10.3 팬서 10.4 타이거 10.5 레퍼드 10.6 스노 레퍼드 10.7 라이언 10.8 마운틴 라이언 10.9 매버릭스 10.10 요세미티 10.11 엘카피탠 10.12 시에라 10.13 하이 시에라 10.14 모하비 10.15 카탈리나 11.0 빅서 12.0 몬터레이 13.0 벤투라 14.0 소노마
응용 프로그램	주소록 오토메이터 계산기 체스 대시보드 사전 DVD 플레이어 페이스타임 파인더 프론트로 그래퍼 캘린더 아이챗 아이싱크 아이튠즈 (버전 역사) 맥 앱 스토어 메일 포토 부스 프리뷰 퀵타임 사파리 (버전 역사) 스티키스 텍스트에디트 미리보기
유틸리티	액티비티 모니터 에어포트 유틸리티 아카이브 유틸리티 오디오 미디 설정 블루투스 파일 교환 컬러싱크 콘솔 충돌 보고자 디지털컬러 미터 디렉터리 유틸리티 디스크이미지마운터 디스크 유틸리티 폰트 북 Grab 도움말 뷰어 이미지 캡처 인스톨러 키체인 액세스 마이그레이션 어시스턴트 네트워크 유틸리티 ODBC 관리자 리모트 인스톨 맥 OS X 화면 공유 소프트웨어 업데이트 시스템 환경 설정 시스템 프로파일러 터미널 유니버설 액세스 보이스오버 X11.app
기술 및 사용자 인터페이스	게이트키퍼 에어드롭 커맨드 키 옵션 키 애플 메뉴 애플 푸시 통보 서비스 애플스크립트 아쿠아 오디오 유닛 봉주르 부트 캠프 BootX 브러시드 메탈 카본 코코아 컬러싱크 코어 애니메이션 코어 오디오 코어 데이터 코어 파운데이션 코어 이미지 코어 OpenGL 코어 텍스트 코어 비디오 CUPS 커버 플로 다윈 독 미션 컨트롤 파일볼트 그랜드 센트럴 디스패치 icns 잉크웰 I/O 키트 커널 패닉 키체인 launchd 런치패드 Mach-O 맥루비 메뉴 엑스트라 OpenCL 환경 설정 틀 프로퍼티 리스트 쿼츠 퀵타임 퀵 룩 로제타(레거시) 스마트 폴더 번들 시스템 무결성 보호 스페이스 스피커블 아이템스 스포트라이트 스택스 타임 머신 UTI 유니버설 바이너리 웹키트 Xgrid XNU