OpenCL

OpenCL Ã© um padrÃ£o aberto e livre de royalties para a programaÃ§Ã£o paralela em ambientes computacionais heterogÃªneos, compostos de CPUs, GPUs e outros processadores. OpenCL permite a escrita de cÃ³digo multi-plataforma para execuÃ§Ã£o nestes dispositivos, possibilitando a utilizaÃ§Ã£o de todo o poder computacional disponÃvel no ambiente.

Para mais informaÃ§Ãµes sobre o padrÃ£o, consulte o site do Khronos Group: http://www.khronos.org/opencl/

Minicursos

A V3D vem apresentando minicursos de OpenCL em alguns eventos no paÃs. Abaixo, vocÃª pode realizar o download do material disponibilizado nestes minicursos.

ProgramaÃ§Ã£o introdutÃ³ria em OpenCL e aplicaÃ§Ãµes em realidade virtual e aumentada
CÃ©sar L. B. Silveira e Luiz G. da Silveira Jr.
SVR 2010 (XII Symposium on Virtual and Augmented Reality)
[Texto (PDF)]Â [Slides (PDF)]

ProgramaÃ§Ã£o Paralela em Ambientes ComputacionaisÂ HeterogÃªneos com OpenCL
CÃ©sar L. B. Silveira, Luiz G. da Silveira Jr e Gerson Geraldo H. Cavalheiro
WSCAD 2010 (XI SimpÃ³sio em Sistemas Computacionais)
[Texto (PDF)]Â [Slides (PDF)]Â [Slides (PPTX)]

ProgramaÃ§Ã£o em OpenCL: Uma introduÃ§Ã£o prÃ¡tica
CÃ©sar L. B. Silveira, Luiz G. da Silveira Jr e Gerson Geraldo H. Cavalheiro
SBGames 2010 (IX SimpÃ³sio Brasileiro de Jogos e Entretenimento Digital)
[Texto (PDF)]Â [Slides (PDF)]Â [Slides (PPTX)]

ProgramaÃ§Ã£o paralela em OpenCL
CÃ©sar L. B. Silveira
GDS 2010 (Game Development School Unisinos 2010)
[Slides (PDF)]Â [Slides (PPTX)]

Exemplos de cÃ³digo

SubtraÃ§Ã£o de elementos de doisÂ arrays

O exemplo a seguir demonstra a configuraÃ§Ã£o de um contexto OpenCL para a execuÃ§Ã£o de um kernel cuja finalidade Ã© realizar a subtraÃ§Ã£o dos elementos de dois array de entrada, armazenando o resultado em um terceiro array. Os arrays sÃ£o preenchidos com valores aleatÃ³rios. Ao final, os dados de entrada e saÃda sÃ£o impressos no console.

#include <stdio.h>
#include <stdlib.h>
 
#ifdef __APPLE__
#include <OpenCL/opencl.h>
#else
#include <CL/opencl.h>
#endif
 
#define ARRAY_LENGTH 1000
 
int main(int argc, char** argv)
{
    /* VariÃ¡veis para armazenamento de referÃªncias a
       objetos OpenCL */
    cl_platform_id platformId;
    cl_device_id deviceId;
    cl_context context;
    cl_command_queue queue;
    cl_program program;
    cl_kernel kernel;
    cl_mem bufA;
    cl_mem bufB;
    cl_mem bufC;
 
    /* VariÃ¡veis diversas da aplicaÃ§Ã£o */
    int* hostA;
    int* hostB;
    int* hostC;
    size_t globalSize[1] = { ARRAY_LENGTH };
    int i;
 
    /* CÃ³digo-fonte do kernel */
    const char* source =
    "__kernel void ArrayDiff( \
        __global const int* a, \
        __global const int* b, \
        __global int* c) \
    { \
        int id = get_global_id(0); \
        c[id] = a[id] - b[id]; \
    }";
 
    /* ObtenÃ§Ã£o de identificadores de plataforma
       e dispositivo. SerÃ¡ solicitada uma GPU. */
    clGetPlatformIDs(1, &platformId, NULL);
    clGetDeviceIDs(platformId, CL_DEVICE_TYPE_GPU,
        1, &deviceId, NULL);
 
    /* CriaÃ§Ã£o do contexto */
    context = clCreateContext(0, 1, &deviceId,
        NULL, NULL, NULL);
 
    /* CriaÃ§Ã£o da fila de comandos para o
       dispositivo encontrado */
    queue = clCreateCommandQueue(context, deviceId,
        0, NULL);
 
    /* CriaÃ§Ã£o do objeto de programa a partir do
       cÃ³digo-fonte armazenado na string source */
    program = clCreateProgramWithSource(context, 1, &source,
        NULL, NULL);
 
    /* CompilaÃ§Ã£o do programa para todos os
        dispositivos do contexto */
    clBuildProgram(program, 0, NULL, NULL, NULL, NULL);
 
    /* ObtenÃ§Ã£o de um kernel a partir do
        programa compilado */
    kernel = clCreateKernel(program, "ArrayDiff", NULL);
 
    /* AlocaÃ§Ã£o e inicializaÃ§Ã£o dos arrays no hospedeiro */
    hostA = (int*) malloc(ARRAY_LENGTH * sizeof(int));
    hostB = (int*) malloc(ARRAY_LENGTH * sizeof(int));
    hostC = (int*) malloc(ARRAY_LENGTH * sizeof(int));
 
    for (i = 0; i < ARRAY_LENGTH; ++i)
    {
        hostA[i] = rand() % 101 - 50;
        hostB[i] = rand() % 101 - 50;
    }
 
    /* CriaÃ§Ã£o dos objetos de memÃ³ria para comunicaÃ§Ã£o com
       a memÃ³ria global do dispositivo encontrado */
    bufA = clCreateBuffer(context, CL_MEM_READ_ONLY,
        ARRAY_LENGTH * sizeof(int), NULL, NULL);
 
    bufB = clCreateBuffer(context, CL_MEM_READ_ONLY,
        ARRAY_LENGTH * sizeof(int), NULL, NULL);
 
    bufC = clCreateBuffer(context, CL_MEM_READ_WRITE,
        ARRAY_LENGTH * sizeof(int), NULL, NULL);
 
    /* TransferÃªncia dos arrays de entrada para a memÃ³ria
       do dispositivo */
    clEnqueueWriteBuffer(queue, bufA, CL_TRUE, 0,
        ARRAY_LENGTH * sizeof(int), hostA, 0,
        NULL, NULL);
 
    clEnqueueWriteBuffer(queue, bufB, CL_TRUE,  0,
        ARRAY_LENGTH * sizeof(int), hostB, 0,
        NULL, NULL);
 
    /* ConfiguraÃ§Ã£o dos argumentos do kernel */
    clSetKernelArg(kernel, 0, sizeof(cl_mem), &bufA);
    clSetKernelArg(kernel, 1, sizeof(cl_mem), &bufB);
    clSetKernelArg(kernel, 2, sizeof(cl_mem), &bufC);
 
    /* Envio do kernel para execuÃ§Ã£o no dispositivo */
    clEnqueueNDRangeKernel(queue, kernel, 1, NULL,
        globalSize, NULL, 0, NULL, NULL);
 
    /* SincronizaÃ§Ã£o (bloqueia hospedeiro atÃ© tÃ©rmino da
       execuÃ§Ã£o do kernel */
    clFinish(queue);
 
    /* TransferÃªncia dos resultados da computaÃ§Ã£o para a
       memÃ³ria do hospedeiro */
    clEnqueueReadBuffer(queue, bufC, CL_TRUE, 0,
        ARRAY_LENGTH * sizeof(int), hostC, 0,
        NULL, NULL);
 
    /* ImpressÃ£o dos resultados na saÃda padrÃ£o */
    for (i = 0; i < ARRAY_LENGTH; ++i)
    {
        printf("%d - %d = %d\n", hostA[i], hostB[i], hostC[i]);
    }
 
    /* LiberaÃ§Ã£o de recursos e encerramento da aplicaÃ§Ã£o */
    clReleaseMemObject(bufA);
    clReleaseMemObject(bufB);
    clReleaseMemObject(bufC);
    clReleaseKernel(kernel);
    clReleaseProgram(program);
    clReleaseCommandQueue(queue);
    clReleaseContext(context);
 
    free(hostA);
    free(hostB);
    free(hostC);
 
    return 0;
}

#include <stdio.h> #include <stdlib.h> #ifdef __APPLE__ #include <OpenCL/opencl.h> #else #include <CL/opencl.h> #endif #define ARRAY_LENGTH 1000 int main(int argc, char** argv) { /* VariÃ¡veis para armazenamento de referÃªncias a objetos OpenCL */ cl_platform_id platformId; cl_device_id deviceId; cl_context context; cl_command_queue queue; cl_program program; cl_kernel kernel; cl_mem bufA; cl_mem bufB; cl_mem bufC; /* VariÃ¡veis diversas da aplicaÃ§Ã£o */ int* hostA; int* hostB; int* hostC; size_t globalSize[1] = { ARRAY_LENGTH }; int i; /* CÃ³digo-fonte do kernel */ const char* source = "__kernel void ArrayDiff( \ __global const int* a, \ __global const int* b, \ __global int* c) \ { \ int id = get_global_id(0); \ c[id] = a[id] - b[id]; \ }"; /* ObtenÃ§Ã£o de identificadores de plataforma e dispositivo. SerÃ¡ solicitada uma GPU. */ clGetPlatformIDs(1, &platformId, NULL); clGetDeviceIDs(platformId, CL_DEVICE_TYPE_GPU, 1, &deviceId, NULL); /* CriaÃ§Ã£o do contexto */ context = clCreateContext(0, 1, &deviceId, NULL, NULL, NULL); /* CriaÃ§Ã£o da fila de comandos para o dispositivo encontrado */ queue = clCreateCommandQueue(context, deviceId, 0, NULL); /* CriaÃ§Ã£o do objeto de programa a partir do cÃ³digo-fonte armazenado na string source */ program = clCreateProgramWithSource(context, 1, &source, NULL, NULL); /* CompilaÃ§Ã£o do programa para todos os dispositivos do contexto */ clBuildProgram(program, 0, NULL, NULL, NULL, NULL); /* ObtenÃ§Ã£o de um kernel a partir do programa compilado */ kernel = clCreateKernel(program, "ArrayDiff", NULL); /* AlocaÃ§Ã£o e inicializaÃ§Ã£o dos arrays no hospedeiro */ hostA = (int*) malloc(ARRAY_LENGTH * sizeof(int)); hostB = (int*) malloc(ARRAY_LENGTH * sizeof(int)); hostC = (int*) malloc(ARRAY_LENGTH * sizeof(int)); for (i = 0; i < ARRAY_LENGTH; ++i) { hostA[i] = rand() % 101 - 50; hostB[i] = rand() % 101 - 50; } /* CriaÃ§Ã£o dos objetos de memÃ³ria para comunicaÃ§Ã£o com a memÃ³ria global do dispositivo encontrado */ bufA = clCreateBuffer(context, CL_MEM_READ_ONLY, ARRAY_LENGTH * sizeof(int), NULL, NULL); bufB = clCreateBuffer(context, CL_MEM_READ_ONLY, ARRAY_LENGTH * sizeof(int), NULL, NULL); bufC = clCreateBuffer(context, CL_MEM_READ_WRITE, ARRAY_LENGTH * sizeof(int), NULL, NULL); /* TransferÃªncia dos arrays de entrada para a memÃ³ria do dispositivo */ clEnqueueWriteBuffer(queue, bufA, CL_TRUE, 0, ARRAY_LENGTH * sizeof(int), hostA, 0, NULL, NULL); clEnqueueWriteBuffer(queue, bufB, CL_TRUE, 0, ARRAY_LENGTH * sizeof(int), hostB, 0, NULL, NULL); /* ConfiguraÃ§Ã£o dos argumentos do kernel */ clSetKernelArg(kernel, 0, sizeof(cl_mem), &bufA); clSetKernelArg(kernel, 1, sizeof(cl_mem), &bufB); clSetKernelArg(kernel, 2, sizeof(cl_mem), &bufC); /* Envio do kernel para execuÃ§Ã£o no dispositivo */ clEnqueueNDRangeKernel(queue, kernel, 1, NULL, globalSize, NULL, 0, NULL, NULL); /* SincronizaÃ§Ã£o (bloqueia hospedeiro atÃ© tÃ©rmino da execuÃ§Ã£o do kernel */ clFinish(queue); /* TransferÃªncia dos resultados da computaÃ§Ã£o para a memÃ³ria do hospedeiro */ clEnqueueReadBuffer(queue, bufC, CL_TRUE, 0, ARRAY_LENGTH * sizeof(int), hostC, 0, NULL, NULL); /* ImpressÃ£o dos resultados na saÃda padrÃ£o */ for (i = 0; i < ARRAY_LENGTH; ++i) { printf("%d - %d = %d\n", hostA[i], hostB[i], hostC[i]); } /* LiberaÃ§Ã£o de recursos e encerramento da aplicaÃ§Ã£o */ clReleaseMemObject(bufA); clReleaseMemObject(bufB); clReleaseMemObject(bufC); clReleaseKernel(kernel); clReleaseProgram(program); clReleaseCommandQueue(queue); clReleaseContext(context); free(hostA); free(hostB); free(hostC); return 0; }

InteroperaÃ§Ã£o com OpenGL

O exemplo de cÃ³digo a seguir demonstra a possibilidade de interoperaÃ§Ã£o entre OpenCL e OpenGL. Quando executado, este cÃ³digo exibe uma malha tridimensional animada segundo uma funÃ§Ã£o senÃ³ide. Os vÃ©rtices da malha sÃ£o armazenados em um Vertex Buffer Object (VBO) no contexto OpenGL. Este VBO Ã© compartilhado com o contexto OpenCL, no qual Ã© executado um kernel responsÃ¡vel pelo posicionamento dos vÃ©rtices da malha de acordo com o tempo da animaÃ§Ã£o.

#include <stdio.h>
#include <stdlib.h>
#include <GL/glew.h>
#include <GL/gl.h>
#include <GL/glut.h>
#include <CL/opencl.h>
 
#ifndef _WIN32
#include <GL/glx.h>
#endif
 
/* DimensÃµes da janela e da malha */
const unsigned int windowWidth = 512;
const unsigned int windowHeight = 512;
const unsigned int meshWidth = 256;
const unsigned int meshHeight = 256;
 
/* Objetos OpenGL */
GLuint vbo;
int window = 0;
 
/* Objetos OpenCL */
cl_platform_id platformId;
cl_context context;
cl_device_id deviceId ;
cl_command_queue queue;
cl_kernel kernel;
cl_mem vboCL;
cl_program program;
 
/* CÃ³digo-fonte do kernel */
const char* kernelSource = " \
__kernel void sine_wave( \n  \
   __global float4* pos, \n  \
   unsigned int width, \n    \
   unsigned int height, \n   \
   float time) \n            \
{ \n                                            \
   unsigned int x = get_global_id(0); \n        \
   unsigned int y = get_global_id(1); \n        \
\n                                              \
   float u = x / (float) width; \n              \
   float v = y / (float) height; \n             \
   u = u*2.0f - 1.0f; \n                        \
   v = v*2.0f - 1.0f; \n                        \
\n                                              \
   float freq = 4.0f; \n                                             \
   float w = sin(u * freq + time) * cos(v * freq + time) * 0.5f; \n  \
\n                                                                   \
   pos[y * width + x] = (float4)(u, w, v, 1.0f); \n                  \
}";
 
/* Tempo de simulaÃ§Ã£o (determina posiÃ§Ã£o dos vÃ©rtices na malha) */
float anim = 0.0;
 
void initGL(int argc, char** argv);
void initCL();
void displayGL(void);
void keyboard(unsigned char key, int x, int y);
void cleanup();
 
int main(int argc, char** argv)
{
   /* InicializaÃ§Ã£o GLUT */
   glutInit(&argc, argv);
   glutInitDisplayMode(GLUT_RGBA | GLUT_DOUBLE);
   glutInitWindowPosition(glutGet(GLUT_SCREEN_WIDTH)/2 - windowWidth/2,
                          glutGet(GLUT_SCREEN_HEIGHT)/2 - windowHeight/2);
   glutInitWindowSize(windowWidth, windowHeight);
   window = glutCreateWindow("OpenCL/GL Interop (VBO)");
   glutDisplayFunc(displayGL);
   glutKeyboardFunc(keyboard);
 
   /* InicializaÃ§Ã£o OpenGL e OpenCL*/
   initGL(argc, argv);
   initCL();
 
   glutMainLoop();
 
   cleanup();
 
   return 0;
}
 
void initGL(int argc, char** argv)
{
   glClearColor(0.0, 0.0, 0.0, 1.0);
   glDisable(GL_DEPTH_TEST);
   glViewport(0, 0, windowWidth, windowHeight);
   glMatrixMode(GL_PROJECTION);
   glLoadIdentity();
   gluPerspective(
      60.0, (GLfloat) windowWidth / (GLfloat) windowHeight, 0.1, 10.0);
   glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);
   glMatrixMode(GL_MODELVIEW);
   glLoadIdentity();
   glTranslatef(0.0, 0.25, -3.0);
   glRotatef(45.0, 1.0, 0.0, 0.0);
   glRotatef(45.0, 0.0, 1.0, 0.0);
 
   glewInit();
 
   /* CriaÃ§Ã£o do VBO */
   glGenBuffers(1, &vbo);
   glBindBuffer(GL_ARRAY_BUFFER, vbo);
   glBufferData(
      GL_ARRAY_BUFFER, meshWidth * meshHeight * 4 * sizeof(float),
      0, GL_DYNAMIC_DRAW);
}
 
void initCL()
{
   /* ObtenÃ§Ã£o de identificadores de plataforma e dispositivo (GPU) */
   clGetPlatformIDs(1, &platformId, NULL);
   clGetDeviceIDs(platformId, CL_DEVICE_TYPE_GPU, 1, &deviceId, NULL);
 
   /* CriaÃ§Ã£o do contexto com propriedades para o compartilhamento
    * com OpenGL */
#ifdef _WIN32
   cl_context_properties props[] =
      {
         CL_GL_CONTEXT_KHR, (cl_context_properties) wglGetCurrentContext(),
         CL_WGL_HDC_KHR, (cl_context_properties) wglGetCurrentDC(),
         CL_CONTEXT_PLATFORM, (cl_context_properties) platformId,
         0
	  };
#else
   cl_context_properties props[] =
      {
         CL_GL_CONTEXT_KHR, (cl_context_properties)glXGetCurrentContext(),
         CL_GLX_DISPLAY_KHR, (cl_context_properties)glXGetCurrentDisplay(),
         CL_CONTEXT_PLATFORM, (cl_context_properties)platformId,
         0
      };
#endif
   context = clCreateContext(props, 1, &deviceId, NULL, NULL, NULL);
 
   /* CriaÃ§Ã£o da fila de comandos do dispositivo */
   queue = clCreateCommandQueue(context, deviceId, 0, NULL);
 
   /* CriaÃ§Ã£o de compilaÃ§Ã£o do programa e do kernel */
   program = clCreateProgramWithSource(
      context, 1, (const char **) &kernelSource, NULL, NULL);
   clBuildProgram(program, 0, NULL, "-cl-fast-relaxed-math", NULL, NULL);
   kernel = clCreateKernel(program, "sine_wave", NULL);
 
   /* CriaÃ§Ã£o do objeto de memÃ³ria para o VBO OpenGL */
   vboCL = clCreateFromGLBuffer(context, CL_MEM_WRITE_ONLY, vbo, NULL);
 
   /* ConfiguraÃ§Ã£o dos argumentos fixos do kernel */
   clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *) &vboCL);
   clSetKernelArg(kernel, 1, sizeof(unsigned int), &meshWidth);
   clSetKernelArg(kernel, 2, sizeof(unsigned int), &meshHeight);
}
 
void displayGL()
{
   /* DimensÃµes do espaÃ§o Ãndices */
   const size_t globalSize[2] = { meshWidth, meshHeight };
 
   /* Incremento do tempo de simulaÃ§Ã£o */
   anim += 0.01f;
 
   /* Aguarda tÃ©rmino das operaÃ§Ãµes OpenGL */
   glFinish();
 
   /* AquisiÃ§Ã£o do VBO para uso com OpenCL */
   clEnqueueAcquireGLObjects(queue, 1, &vboCL, 0,0,0);
 
   /* AtualizaÃ§Ã£o do tempo de simulaÃ§Ã£o no kernel */
   clSetKernelArg(kernel, 3, sizeof(float), &anim);
 
   /* ExecuÃ§Ã£o do kernel */
   clEnqueueNDRangeKernel(queue, kernel, 2, NULL, globalSize, NULL, 0,0,0 );
 
   /* LiberaÃ§Ã£o do VBO de volta para OpenGL */
   clEnqueueReleaseGLObjects(queue, 1, &vboCL, 0,0,0);
 
   /* SincronizaÃ§Ã£o */
   clFinish(queue);
 
   /* RenderizaÃ§Ã£o da malha */
   glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);
   glBindBuffer(GL_ARRAY_BUFFER, vbo);
   glVertexPointer(4, GL_FLOAT, 0, 0);
   glEnableClientState(GL_VERTEX_ARRAY);
   glColor3f(1.0, 0.0, 0.0);
   glDrawArrays(GL_POINTS, 0, meshWidth * meshHeight);
   glDisableClientState(GL_VERTEX_ARRAY);
   glutSwapBuffers();
   glutPostRedisplay();
}
 
void keyboard(unsigned char key, int x, int y)
{
   if (key == 'q' || key == 'Q')
	   cleanup();
}
 
void cleanup()
{
   clReleaseKernel(kernel);
   clReleaseProgram(program);
   clReleaseCommandQueue(queue);
 
   glBindBuffer(1, vbo);
   glDeleteBuffers(1, &vbo);
   clReleaseMemObject(vboCL);
 
   clReleaseContext(context);
   glutDestroyWindow(window);
 
   exit(0);
}

#include <stdio.h> #include <stdlib.h> #include <GL/glew.h> #include <GL/gl.h> #include <GL/glut.h> #include <CL/opencl.h> #ifndef _WIN32 #include <GL/glx.h> #endif /* DimensÃµes da janela e da malha */ const unsigned int windowWidth = 512; const unsigned int windowHeight = 512; const unsigned int meshWidth = 256; const unsigned int meshHeight = 256; /* Objetos OpenGL */ GLuint vbo; int window = 0; /* Objetos OpenCL */ cl_platform_id platformId; cl_context context; cl_device_id deviceId ; cl_command_queue queue; cl_kernel kernel; cl_mem vboCL; cl_program program; /* CÃ³digo-fonte do kernel */ const char* kernelSource = " \ __kernel void sine_wave( \n \ __global float4* pos, \n \ unsigned int width, \n \ unsigned int height, \n \ float time) \n \ { \n \ unsigned int x = get_global_id(0); \n \ unsigned int y = get_global_id(1); \n \ \n \ float u = x / (float) width; \n \ float v = y / (float) height; \n \ u = u*2.0f - 1.0f; \n \ v = v*2.0f - 1.0f; \n \ \n \ float freq = 4.0f; \n \ float w = sin(u * freq + time) * cos(v * freq + time) * 0.5f; \n \ \n \ pos[y * width + x] = (float4)(u, w, v, 1.0f); \n \ }"; /* Tempo de simulaÃ§Ã£o (determina posiÃ§Ã£o dos vÃ©rtices na malha) */ float anim = 0.0; void initGL(int argc, char** argv); void initCL(); void displayGL(void); void keyboard(unsigned char key, int x, int y); void cleanup(); int main(int argc, char** argv) { /* InicializaÃ§Ã£o GLUT */ glutInit(&argc, argv); glutInitDisplayMode(GLUT_RGBA | GLUT_DOUBLE); glutInitWindowPosition(glutGet(GLUT_SCREEN_WIDTH)/2 - windowWidth/2, glutGet(GLUT_SCREEN_HEIGHT)/2 - windowHeight/2); glutInitWindowSize(windowWidth, windowHeight); window = glutCreateWindow("OpenCL/GL Interop (VBO)"); glutDisplayFunc(displayGL); glutKeyboardFunc(keyboard); /* InicializaÃ§Ã£o OpenGL e OpenCL*/ initGL(argc, argv); initCL(); glutMainLoop(); cleanup(); return 0; } void initGL(int argc, char** argv) { glClearColor(0.0, 0.0, 0.0, 1.0); glDisable(GL_DEPTH_TEST); glViewport(0, 0, windowWidth, windowHeight); glMatrixMode(GL_PROJECTION); glLoadIdentity(); gluPerspective( 60.0, (GLfloat) windowWidth / (GLfloat) windowHeight, 0.1, 10.0); glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT); glMatrixMode(GL_MODELVIEW); glLoadIdentity(); glTranslatef(0.0, 0.25, -3.0); glRotatef(45.0, 1.0, 0.0, 0.0); glRotatef(45.0, 0.0, 1.0, 0.0); glewInit(); /* CriaÃ§Ã£o do VBO */ glGenBuffers(1, &vbo); glBindBuffer(GL_ARRAY_BUFFER, vbo); glBufferData( GL_ARRAY_BUFFER, meshWidth * meshHeight * 4 * sizeof(float), 0, GL_DYNAMIC_DRAW); } void initCL() { /* ObtenÃ§Ã£o de identificadores de plataforma e dispositivo (GPU) */ clGetPlatformIDs(1, &platformId, NULL); clGetDeviceIDs(platformId, CL_DEVICE_TYPE_GPU, 1, &deviceId, NULL); /* CriaÃ§Ã£o do contexto com propriedades para o compartilhamento * com OpenGL */ #ifdef _WIN32 cl_context_properties props[] = { CL_GL_CONTEXT_KHR, (cl_context_properties) wglGetCurrentContext(), CL_WGL_HDC_KHR, (cl_context_properties) wglGetCurrentDC(), CL_CONTEXT_PLATFORM, (cl_context_properties) platformId, 0 }; #else cl_context_properties props[] = { CL_GL_CONTEXT_KHR, (cl_context_properties)glXGetCurrentContext(), CL_GLX_DISPLAY_KHR, (cl_context_properties)glXGetCurrentDisplay(), CL_CONTEXT_PLATFORM, (cl_context_properties)platformId, 0 }; #endif context = clCreateContext(props, 1, &deviceId, NULL, NULL, NULL); /* CriaÃ§Ã£o da fila de comandos do dispositivo */ queue = clCreateCommandQueue(context, deviceId, 0, NULL); /* CriaÃ§Ã£o de compilaÃ§Ã£o do programa e do kernel */ program = clCreateProgramWithSource( context, 1, (const char **) &kernelSource, NULL, NULL); clBuildProgram(program, 0, NULL, "-cl-fast-relaxed-math", NULL, NULL); kernel = clCreateKernel(program, "sine_wave", NULL); /* CriaÃ§Ã£o do objeto de memÃ³ria para o VBO OpenGL */ vboCL = clCreateFromGLBuffer(context, CL_MEM_WRITE_ONLY, vbo, NULL); /* ConfiguraÃ§Ã£o dos argumentos fixos do kernel */ clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *) &vboCL); clSetKernelArg(kernel, 1, sizeof(unsigned int), &meshWidth); clSetKernelArg(kernel, 2, sizeof(unsigned int), &meshHeight); } void displayGL() { /* DimensÃµes do espaÃ§o Ãndices */ const size_t globalSize[2] = { meshWidth, meshHeight }; /* Incremento do tempo de simulaÃ§Ã£o */ anim += 0.01f; /* Aguarda tÃ©rmino das operaÃ§Ãµes OpenGL */ glFinish(); /* AquisiÃ§Ã£o do VBO para uso com OpenCL */ clEnqueueAcquireGLObjects(queue, 1, &vboCL, 0,0,0); /* AtualizaÃ§Ã£o do tempo de simulaÃ§Ã£o no kernel */ clSetKernelArg(kernel, 3, sizeof(float), &anim); /* ExecuÃ§Ã£o do kernel */ clEnqueueNDRangeKernel(queue, kernel, 2, NULL, globalSize, NULL, 0,0,0 ); /* LiberaÃ§Ã£o do VBO de volta para OpenGL */ clEnqueueReleaseGLObjects(queue, 1, &vboCL, 0,0,0); /* SincronizaÃ§Ã£o */ clFinish(queue); /* RenderizaÃ§Ã£o da malha */ glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT); glBindBuffer(GL_ARRAY_BUFFER, vbo); glVertexPointer(4, GL_FLOAT, 0, 0); glEnableClientState(GL_VERTEX_ARRAY); glColor3f(1.0, 0.0, 0.0); glDrawArrays(GL_POINTS, 0, meshWidth * meshHeight); glDisableClientState(GL_VERTEX_ARRAY); glutSwapBuffers(); glutPostRedisplay(); } void keyboard(unsigned char key, int x, int y) { if (key == 'q' || key == 'Q') cleanup(); } void cleanup() { clReleaseKernel(kernel); clReleaseProgram(program); clReleaseCommandQueue(queue); glBindBuffer(1, vbo); glDeleteBuffers(1, &vbo); clReleaseMemObject(vboCL); clReleaseContext(context); glutDestroyWindow(window); exit(0); }

Toolkits OpenCL

Para desenvolver soluÃ§Ãµes OpenCL, Ã© necessÃ¡rio instalar um toolkit de desenvolvimento OpenCL para os dispositivos que vocÃª deseja utilizar. Seguem links para alguns destes toolkits:

NVIDIA CUDA (para GPUs NVIDIA)
ATI Stream SDK (para GPUs ATI e CPUs AMD)
Intel OpenCL SDK (para CPUs Intel)

V3D Labs