domingo, 13 de febrero de 2011

ULTIMO ARTICULO= REVOLUCION EN LOS (CPU) (REVISTA PC EN LINEA ACTUAL)

 la última revolución en desarrollo

CUDA: la última revolución en desarrollo
A medida que se han ido incorporando en la tarjeta de vídeo funciones más avanzadas, influidas por la necesidad de satisfacer requisitos más exigentes en la generación de gráficos y también las nuevas APIs de programación (OpenGL y DirectX), ha surgido un nuevo concepto: el de GPU (Graphics Processor Unit), como analogía de las CPU (Central Processing Unit) o microprocesadores clásicos.
Si bien la denominación GPU hace referencia a una arquitectura especializada, dirigida específicamente al tratamiento gráfico, cada vez es mayor el número de aplicaciones que aprovechan la potencia de estos circuitos integrados para otro tipo de propósitos.
Es aquí donde cobran protagonismo soluciones como Cg, ATI Stream, OpenCL y CUDA, infraestructuras compuestas de bibliotecas, compiladores y lenguajes que dan a luz a una nueva filosofía de desarrollo: GPGPU (General Purpose computing on Graphics Processing Units), la computación de propósito general usando GPU en lugar de CPU.
¿Cuál es la razón de que los programadores se interesen en desarrollar aplicaciones que se ejecuten en una GPU? La respuesta es que las actuales CPU cuentan con cuatro núcleos y son capaces de ejecutar hasta ocho hilos de manera simultánea (dos por núcleo) mientras que las GPU más avanzadas disponen de hasta 240 núcleos de procesamiento y tienen capacidad para ejecutar hasta 128 hilos por procesador, lo que ofrece un total de 30.720 hilos.
Programación de GPU
Para aprovechar la potencia de las GPU es necesario contar con herramientas de desarrollo adecuadas, capaces de explotar el alto nivel de paralelismo que ofrecen estos dispositivos. Hasta no hace mucho eran primitivas, ya que su objetivo era facilitar la programación de pixel shaders y vertex shaders, pequeños bloques de código que aplican un cierto procesamiento a los vértices de la geometría y los píxeles resultantes. Ese código se ejecuta paralelamente en cada núcleo, lo cual permite aplicar un cierto algoritmo masivamente a miles o millones de vértices y puntos.
Estos bloques de código tienen una longitud máxima limitada y se programan en una suerte de lenguaje ensamblador a medida, por lo que difícilmente pueden aplicarse más que a la función para la que están pensados.

No hay comentarios:

Publicar un comentario