Posibles malas noticias para la energía en el futuro – ButterWord

La revolución tecnológica liderada por Deepseek ha abierto la puerta a otras empresas para desarrollar sus propios modelos de razonamiento de bajo costo, lo que podría cambiar la perspectiva sobre el consumo de energía en el campo de la inteligencia artificial.

El ciclo de vida de cualquier modelo de IA consta de dos fases: entrenamiento e inferencia. El entrenamiento implica un proceso de meses en el que el modelo aprende de los datos, mientras que la inferencia ocurre cuando el modelo responde a las consultas. Ambas fases suelen llevarse a cabo en centros de datos que consumen mucha energía para operar chips y servidores.

En el desarrollo de su modelo R1, el equipo de Deepseek ha mejorado técnicas como la “mezcla de expertos” y el aprendizaje por refuerzo, automatizando procesos que antes requerían intervención humana. Sin embargo, aunque estas mejoras podrían hacer que el entrenamiento sea más eficiente, no necesariamente se traducen en un menor consumo de energía.

Según Dario Amodei, cofundador de Deepseek, las empresas tienden a gastar más en modelos de entrenamiento más avanzados, lo que conlleva un aumento en el uso de energía. Esta paradoja, conocida como la paradoja de Jevons, señala que las mejoras en eficiencia suelen destinarse a entrenar modelos más complejos, lo que incrementa el consumo energético.

A pesar de esto, el verdadero impacto en el consumo de energía se encuentra en la fase de inferencia. Deepseek está diseñado como un modelo de razonamiento, lo que le permite realizar tareas complejas como deducción, búsqueda de patrones y matemáticas de manera eficiente. Esto se logra a través de la “dependencia de pensamiento”, que le permite al modelo dividir tareas y trabajar de manera ordenada antes de llegar a una conclusión.

LEAR  Chris Billam-Smith predice una victoria por nocaut sobre Richard Riakporhe en la pelea por el título mundial en Selhurst Park | Noticias de Boxeo

Este enfoque se puede observar en Deepseek al abordar cuestiones éticas, como la mentira para proteger los sentimientos de los demás. El modelo considera diferentes enfoques éticos antes de llegar a una conclusión, mostrando una capacidad de razonamiento sofisticada.