Ir directamente a la navegación principal Ir directamente a la búsqueda Ir directamente al contenido principal

Análisis de Resiliencia sobre Estrategias para Optimización Energética de Modelos de Aprendizaje Profundo en Inteligencia Artificial

  • Meneses, Esteban (Persona académica coordinadora institucional)
  • Ciorba, Florina (Persona académica colaboradora externo )
  • Asch, Christian (Persona académica colaboradora externo )
  • Rojas, Elvis (Persona académica colaboradora externo )
  • Navarro Todd, Luis Carlos (Persona académica colaboradora externo )
  • University of Basel
  • Centro Nacional de Alta Tecnología
  • Universidad Nacional de Costa Rica
  • Escuela de Ingeniería en Computación

Proyecto: Proyectos Investigación Con fondos externos nacionalesInvestigación básica y aplicada

Detalles del proyecto

Descripción

La inteligencia artificial (IA) moderna posee un impacto transformador pero a la vez problemático. Si bien los modelos de IA han avanzado enormemente, desde chatbots hasta herramientas para la agricultura de precisión, su desarrollo y uso masivo plantean desafíos significativos en términos de sostenibilidad y fiabilidad. Un punto crítico es el alto consumo de energía. Entrenar un modelo de lenguaje grande (LLM) como GPT-3 puede requerir una cantidad de electricidad comparable al consumo anual de más de 100 hogares, debido a la necesidad de miles de procesadores (GPU) funcionando durante semanas. Aunque cada consulta individual (inferencia) consume menos energía, el impacto global es considerable y creciente, contribuyendo a las emisiones de carbono y a la sobrecarga de las redes eléctricas. Esto contradice los principios de sostenibilidad establecidos por organizaciones como la UNESCO y la OCDE. La literatura reporta varias estrategias para optimizar energéticamente modelos de IA. Además del consumo energético, se debe abordar el problema de la fiabilidad de los sistemas computacionales. Las supercomputadoras utilizadas para entrenar estos modelos experimentan fallos constantes, a menudo cada pocas horas. A pesar de los sofisticados mecanismos de tolerancia a fallos, persisten riesgos como la "corrupción de datos silenciosa" (SDC, por sus siglas en inglés), donde un solo bit incorrecto puede llevar a un resultado catastrófico. Esta propuesta de proyecto de investigación busca entender la relación entre la eficiencia energética y la tolerancia a fallos en la IA. El objetivo es determinar cómo las estrategias de optimización energética se comportan en presencia de fallos, y así contribuir al desarrollo de sistemas de IA más sostenibles y robustos. Esta propuesta tiene como meta principal la publicación de hallazgos científicos y la creación de una plataforma experimental para futuras investigaciones.

Objetivo General

Evaluar la resiliencia de los principales mecanismos de optimización energética en modelos de aprendizaje profundo.

Lineas de Investigación

1) Teoría y Metodologías en Computación
2) Aplicación de la computación en distintos dominios científicos, tecnológicos,
organizacionales y sociales
Título cortoAprendizaje profundo
EstadoActivo
Fecha de inicio/Fecha fin1/01/2631/12/27

Palabras clave

  • inteligencia artificial
  • aprendizaje profundo
  • resiliencia
  • eficiencia energética

Huella digital

Explore los temas de investigación que se abordan en este proyecto. Estas etiquetas se generan con base en las adjudicaciones/concesiones subyacentes. Juntos, forma una huella digital única.