La polémica de los 5 millones de dólares: el debate sobre cuánto le ha costado a DeepSeek realmente su IA

Escrito por Eduardo Peralta

La Inteligencia Artificial al Alcance de Todos

La Polémica de los 5 Millones de Dólares en el Desarrollo de DeepSeek

¿Un costo realista para la inteligencia artificial?

5,576 millones de dólares. Esta exorbitante cifra es presentada por los creadores de DeepSeek V3 como el costo total del entrenamiento de su innovador modelo de inteligencia artificial. Según su informe técnico oficial, se utilizaron 2,788 millones de horas de GPU (NVIDIA H800) para alcanzar este impresionante logro.

Cuestionando las Cifras: ¿Es Creíble el Gasto?

Pese a que los números parecen cuadrar para DeepSeek, la comunidad tecnológica se ha dividido en cuanto a su veracidad. Desde el lanzamiento de DeepSeek-R1, un modelo de IA que compite con las grandes firmas, se ha generado un intenso debate sobre si estas cifras pueden ser realmente ciertas, especialmente al considerar la pérdida de 400,000 millones de dólares en bolsa que algunas empresas, como NVIDIA, han experimentado tras el anuncio.

Análisis de Costes: La Realidad Detrás de los Números

Ben Thompson, un conocido analista tecnológico, ha señalado que el informe de DeepSeek excluye costos importantes relacionados con investigaciones previas y pruebas de diferentes arquitecturas y algoritmos. Esto sugiere que no basta con tomar los 5,576 millones de dólares para replicar su modelo.

Las Opiniones de los Expertos en la Industria

Los expertos son cautelosos. Thompson indica que, a pesar del fervor por las cifras, es difícil creer que el costo del entrenamiento se haya mantenido en ese nivel. Otros analistas, como Nathan Lambert, también han expresado su escepticismo sobre la transparencia y los detalles del informe de DeepSeek.

Gastos Precios: ¿Cuánto se ha invertido antes?

Existen dudas en torno a si el modelo actual de DeepSeek podría haber sido desarrollado sin una inversión significativa en modelos previos. Dylan Patel de SemiAnalysis argumenta que DeepSeek ha tenido acceso a un amplio número de GPUs de NVIDIA para entrenar modelos anteriores, lo que lleva a cuestionar el costo del desarrollo reciente.

Un Contexto Comparativo

Comparando con otros modelos, es importante destacar que la mayoría de las grandes empresas invierten miles de millones en sus infraestructuras de IA. Patel sugiere que DeepSeek ha invertido claramente más de 500 millones de dólares en GPUs a lo largo de su historia, subrayando las similitudes en gasto de otras compañías en el sector.

Costos Ocultos y Adaptaciones Necesarias

Los 5,576 millones de dólares no reflejan los costos de adaptación del modelo, como salarios, trabajo de anotación de datos para asegurar su calidad, o interrupciones en procesos de entrenamiento. Estas variables pueden sumar considerablemente al costo final.

Una Comparativa con Llama 3

El investigador Praneet Rathi ha realizado un análisis exhaustivo, contrastando el costo de entrenamiento de DeepSeek V3 con Llama 3 de Meta. Se estima que Llama 3 requirió 30 millones de horas de GPU, contrastando con las 2,8 millones mencionadas para DeepSeek, lo que abre la discusión sobre la precisión de las estimaciones de DeepSeek.

Posibilidades de Replicación en el Futuro

Con DeepSeek-R1 como modelo Open Source, surge la pregunta de si otros desarrolladores podrán replicar esta estructura. Aunque muchos datos han sido compartidos, todavía se desconocen detalles cruciales que podrían influir en futuras reproducciones de su modelo.

La Eficiencia en Costos de Entrenamiento de Modelos de IA

A medida que avanza la tecnología, el costo de entrenar modelos de inteligencia artificial sigue disminuyendo. En un análisis reciente, se estimó que el entrenamiento de GPT-4 costaba 63 millones de dólares a principios de 2023, cifra que se ha visto reducida notablemente. El futuro de la IA podría estar marcado por una continua reducción de costos, lo que cambiaría la dinámica del desarrollo en este campo.

Conclusiones Finales

El costo de desarrollo de DeepSeek V3 sigue generando controversia. A medida que se presentan nuevos modelos y se evolucionan los métodos de entrenamiento, las cifras continuarán siendo objeto de discusión y análisis. La tecnología avanza, y con ella, la forma en que abordamos el costo y el desarrollo de la inteligencia artificial.

Deja un comentario