Más noticias en nuestro canal de "X"

PRIME_$type=blogging$author=hide$comment=hide$rm=hide$title=out-of-thumbnail$count=1

TECNOLOGÍA. DeepSeek: la empresa china de IA que ha revolucionado la industria de la inteligencia artificial

inteligencia artificial, IA, DeepSeek

 

DeepSeek ha revolucionado la industria multimillonaria de la inteligencia artificial. Robert Way/Shutterstock

28 enero 2025.- La empresa china de inteligencia artificial (IA) DeepSeek ha conmocionado a la comunidad tecnológica con el lanzamiento de modelos de IA extremadamente eficientes que pueden competir con productos de vanguardia de empresas estadounidenses como OpenAI y Anthropic.

Fundada en 2023, DeepSeek ha logrado sus resultados con una fracción del efectivo y el poder computacional de sus competidores.

El modelo de razonamiento R1 de DeepSeek, publicado la semana pasada, provocó entusiasmo entre los investigadores, conmoción entre los inversores y reacciones de los pesos pesados ​​de la inteligencia artificial. El 28 de enero, la empresa presentó un modelo que puede funcionar tanto con imágenes como con texto.

Entonces, ¿qué ha hecho DeepSeek y cómo lo hizo?

Lo que hizo DeepSeek

En diciembre, DeepSeek lanzó su modelo V3 . Se trata de un modelo de lenguaje grande “estándar” muy potente que funciona a un nivel similar al GPT-4o de OpenAI y al Claude 3.5 de Anthropic.

Si bien estos modelos son propensos a errores y a veces inventan sus propios datos , pueden realizar tareas como responder preguntas, escribir ensayos y generar códigos informáticos. En algunas pruebas de resolución de problemas y razonamiento matemático, obtienen mejores resultados que el ser humano promedio.

Según se informa, el costo de entrenamiento de V3 fue de aproximadamente 5,58 millones de dólares, una cifra considerablemente más barata que, por ejemplo, GPT-4, cuyo desarrollo costó más de 100 millones de dólares .

DeepSeek también afirma haber entrenado a V3 utilizando alrededor de 2.000 chips informáticos especializados, en concreto GPU H800 fabricadas por NVIDIA . Se trata de una cifra mucho menor que la de otras empresas, que pueden haber utilizado hasta 16.000 de los chips H100 más potentes.

El 20 de enero, DeepSeek lanzó otro modelo, llamado R1 . Se trata de un modelo denominado de “razonamiento”, que intenta resolver problemas complejos paso a paso. Estos modelos parecen ser mejores en muchas tareas que requieren contexto y tienen múltiples partes interrelacionadas, como la comprensión lectora y la planificación estratégica.

El modelo R1 es una versión modificada del modelo V3 con una técnica llamada aprendizaje por refuerzo. R1 parece funcionar a un nivel similar al o1 de OpenAI , lanzado el año pasado.

DeepSeek también utilizó la misma técnica para crear versiones “razonables” de pequeños modelos de código abierto que pueden ejecutarse en computadoras domésticas.

Este lanzamiento ha provocado un gran aumento del interés en DeepSeek, lo que ha aumentado la popularidad de su aplicación de chatbot basada en V3 y ha provocado una caída masiva de los precios de las acciones tecnológicas, ya que los inversores están reevaluando la industria de la IA. Al momento de escribir este artículo, el fabricante de chips NVIDIA ha perdido alrededor de 600 mil millones de dólares en valor.

Cómo lo hizo DeepSeek

Los avances de DeepSeek han sido en la consecución de una mayor eficiencia: se han obtenido buenos resultados con menos recursos. En particular, los desarrolladores de DeepSeek han sido pioneros en dos técnicas que pueden ser adoptadas por investigadores de IA de forma más amplia.

La primera tiene que ver con una idea matemática llamada “escasez”. Los modelos de IA tienen muchos parámetros que determinan sus respuestas a las entradas (V3 tiene alrededor de 671 mil millones), pero solo una pequeña fracción de estos parámetros se utiliza para cualquier entrada dada.

Sin embargo, predecir qué parámetros serán necesarios no es fácil. DeepSeek utilizó una nueva técnica para hacerlo y luego entrenó solo esos parámetros. Como resultado, sus modelos necesitaron mucho menos entrenamiento que un enfoque convencional.

El otro truco tiene que ver con la forma en que V3 almacena la información en la memoria del ordenador. DeepSeek ha encontrado una forma inteligente de comprimir los datos relevantes, de modo que sea más fácil almacenarlos y acceder a ellos rápidamente.

Qué significa

Los modelos y técnicas de DeepSeek se han publicado bajo la licencia MIT gratuita , lo que significa que cualquiera puede descargarlos y modificarlos.

Si bien esto puede ser una mala noticia para algunas empresas de IA, cuyas ganancias podrían verse erosionadas por la existencia de modelos poderosos y de libre acceso, es una gran noticia para la comunidad de investigación de IA en general.

En la actualidad, gran parte de la investigación en IA requiere acceso a enormes cantidades de recursos informáticos. Los investigadores como yo, que trabajamos en universidades (o en cualquier otro lugar, excepto en grandes empresas tecnológicas), hemos tenido una capacidad limitada para realizar pruebas y experimentos.

La situación cambia gracias a modelos y técnicas más eficientes. Ahora la experimentación y el desarrollo pueden resultarnos mucho más fáciles.

Para los consumidores, el acceso a la IA también puede resultar más barato, ya que es posible que se ejecuten más modelos de IA en los propios dispositivos de los usuarios, como computadoras portátiles o teléfonos, en lugar de ejecutarlos “en la nube” a cambio de una tarifa de suscripción.

Para los investigadores que ya cuentan con muchos recursos, una mayor eficiencia puede tener un efecto menor. No está claro si el enfoque de DeepSeek ayudará a crear modelos con un mejor rendimiento en general o simplemente modelos que sean más eficientes.

COMENTARIOS

Nombre

25N,4,actualidad,1232,ADN,7,agricultura,144,agujeros negros,6,ALCINE,4,alergia,5,alimentación,4,alquiler,5,alzheimer,70,analgésicos,1,anemia,1,animales,139,anorexia,1,antibióticos,5,antiinflamatorios,1,apnea,1,aranjuez,1,arañas,1,ARNm,2,arqueologia,111,arte,1,artrosis,1,aspirina,1,astronomia,177,atrofia muscular espinal,1,audiovisual,311,autismo,23,ávaros,1,aviso,10,avuelapluma,18,ayudas,1,banca,1,BEI,1,BIC,6,biocombustibles,7,biodiversidad,43,biotecnología,23,BIP,1,botox,1,calefacción,1,calentamiento global,23,calor,6,cambio climático,104,cancer,226,cannabidiol,1,cannabis,7,caquexia,1,CAR-T,10,carnavales_2024,15,CBD,1,células_madre,1,cemento,1,cerebro,3,ciberseguridad,2,ciencia,469,cine,153,civilizaciones,2,clima,11,CO2,19,COE,1,colesterol,3,compromiso179,8,computación cuántica,5,contaminación,35,convocatoria,49,COP28,5,COP29,3,corales,1,covid-19,125,CRISPR,4,Crohn,1,cultura,240,cultura_alcala,6,cultura_torrejon,2,Cygnus,1,DANA,1,danza,8,deal,62,demencia,5,dengue,2,dependencia,1,deportes,362,depresión,11,diabetes,69,dieta,2,digitalización,1,dinosaurios,1,discapacidad,1,Doggerland,1,economia,451,economia_empleo,147,economia_negocios,387,economia_sociales,79,economia_vivienda,93,edición genética,9,EII,1,El Niño,1,ELA,2,elecciones,26,elecciones_partidos,8,elecciones_UE2024,26,elecciones2023,78,elecciones2023_alcala,6,elecciones2023_coslada,1,elecciones2023_guadalajara,31,elecciones2023_madrid,7,elecciones2023_torrejon,24,elecciones2023_villalbilla,3,empleo,24,endometriosis,1,energia,972,energía nuclear,11,energía solar,73,energia_almacenamiento,8,energia_eolica,24,energías renovables,126,enfermedades infecciosas,23,enfermedades raras,1,enigmas,171,ensayos,3,enseñanza,3,envejecimiento,10,epigenética,2,epilepsia,3,esclerosis,22,esnoticia,4484,esnoticia_alcala,1137,esnoticia_anchuelo,1,esnoticia_azuqueca,131,esnoticia_breves,20,esnoticia_coslada,436,esnoticia_guadalajara,475,esnoticia_madrid,1800,esnoticia_sanfernando,216,esnoticia_torrejon,519,esnoticia_velilla,2,esnoticia_villalbilla,104,espacio,8,especiales,1,esquizofrenia,2,estrés,1,europa,74,eventos,16,exposiciones,32,extremófilos,1,fagos,1,fertilidad,1,FESCIGU,3,Fiestas_Alcala,9,fiestas_azuqueca,9,financiación_autonómica,1,FITUR_2023,18,FITUR_2024,16,FITUR_2025,10,FIVE,1,formacion,54,foros y debates,66,gastronomia,61,gemelo digital,1,geoingeniería,1,geología,1,glioblastoma,1,GNL,1,grammy,1,gripe aviar,5,halloween,6,hidrógeno verde,38,hispanidad,2,Hispanidad_2024,4,historia,200,historias,473,HMPV,1,hogar,1,horteralia,1,huracanes,1,ictus,1,IMDEA,2,imserso,1,inca,1,incendios,3,inflación,2,influenza,1,inmigración,5,inmunología,1,inmunoterapia,47,inteligencia artificial,122,investigación,2,IPC,2,ITS,1,James Webb,11,jazz,2,ketamina,2,laboral,47,LGBT,1,libros,184,lídar,2,listeriosis,1,litio,4,malaria,2,marburgo,2,mariposas,1,mayas,3,MDMA,1,medicamentos,42,medioambiente,391,melanoma,2,menopausia,1,metanol,1,micenas,1,microplásticos,10,migrañas,2,miocarditis,1,mitosyleyendas,62,motor,610,motor_electricos,143,motor_hibridos,85,motor_innovacion,65,motor_mercado,167,motor_noticias,163,movilidad,24,mpox,8,mujer,1,mundo antiguo,1,museos,2,musica,19,naturaleza,144,naturgy,1,Navidad2023,52,Navidad2024,51,neardental,4,neurociencia,41,neurotecnología,1,Nobel2024,4,nocturia,1,nutricion,161,nutrición,5,obesidad,17,ocio,1,ondas_gravitacionales,1,opinión,238,osteoartritis,3,paleontología,1,parkinson,26,peliculas,38,pensiones,3,permanente,1,personajes,109,pesca,1,pesticidas,1,plantas,40,plásticos,5,poesia,52,polen,2,presupuestos2024,1,prime,88,psicologia,1,psicosis,1,psilocibina,1,pymes,1,relatos,2,RENFE,5,residuos,3,robótica,30,ruido,1,sal,1,salud,807,salud dental,16,salud mental,20,sanidad,1,semana_santa,15,servicios_profesionales,1,SIDA,4,Sudán,1,sueño,4,tabaco,1,TDAH,2,teatro,26,tecnologia,272,telemedicina,1,terremotos,1,THC,1,tradiciones,69,transmisión_sexual,1,transporte,3,trasplantes,1,TRIAPOL,1,tuberculosis,1,turismo,286,TV,1,UCAM,1,ucrania,1,universidad,1,universo,21,vacunas,8,vacunas ARN,8,vidasaludable,171,video,42,VIH,7,violenciadegenero,2,viruela,2,virus,6,virus del nilo,2,visión,1,volcanes,1,VRS,1,yuca,1,zinebi,5,zoonosis,1,
ltr
item
La Crónica del Henares: TECNOLOGÍA. DeepSeek: la empresa china de IA que ha revolucionado la industria de la inteligencia artificial
TECNOLOGÍA. DeepSeek: la empresa china de IA que ha revolucionado la industria de la inteligencia artificial
inteligencia artificial, IA, DeepSeek
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidgbUAPXtKwLI1xDLZosYEuStgyqu0fnsKPOsOwSaCdrJZKSKJJlEfHEw7GBjNEEKRhjfWArWnJfJRgeb2SJ22LLUSTp_5WNeT9OvjHEnofWNI0c6oly9S8EAEPr2P8JzqLXzfMkL2K5NLpUez5B-OsKNY1u6gg1yeIZ6elVTZGsx49Fxynr8h68f51sMB/s320/tecno.jpg
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidgbUAPXtKwLI1xDLZosYEuStgyqu0fnsKPOsOwSaCdrJZKSKJJlEfHEw7GBjNEEKRhjfWArWnJfJRgeb2SJ22LLUSTp_5WNeT9OvjHEnofWNI0c6oly9S8EAEPr2P8JzqLXzfMkL2K5NLpUez5B-OsKNY1u6gg1yeIZ6elVTZGsx49Fxynr8h68f51sMB/s72-c/tecno.jpg
La Crónica del Henares
https://www.cronicadelhenares.com/2025/01/tecnologia-deepseek-la-empresa-china-de.html
https://www.cronicadelhenares.com/
https://www.cronicadelhenares.com/
https://www.cronicadelhenares.com/2025/01/tecnologia-deepseek-la-empresa-china-de.html
true
5995595061750506997
UTF-8
Cargar todos los posts No se encuentra Ver todo Leer más Responder Cancelar respuesta Borrar Por Inicio Páginas Posts Ver todo Relacionados Etiqueta ARCHIVO BUSCAR Todos los posts No se encuentra INICIO Domingo Lunes Martes Miércoles Jueves Viernes Sábado Dom Lun Mar Mie Jue Vie Sab Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Ene Feb Mar Abr Mayo Jun Jul Ago Sep Oct Nov Dic justo ahora hace 1 minuto hace $$1$$ minutos hace 1 hora hace $$1$$ horas Ayer hace $$1$$ días hace $$1$$ semanas hace más de 5 semanas Seguidores Siguen THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Tabla de contenidos