Por qu¨¦ DeepSeek ha tumbado con su IA a los gigantes de?Silicon?Valley
La compa?¨ªa china ha creado un modelo m¨¢s barato y eficiente de inteligencia artificial exprimiendo los desarrollos previos
La revoluci¨®n de los modelos de inteligencia artificial (IA) de la china DeepSeek se basa en un motivo clave: hacen lo mismo pero m¨¢s barato. Su funcionamiento en general es igual de bueno que los l¨ªderes del mercado de Silicon Valley, pero son mucho menos costosos de crear y de usar. OpenAI, Anthropic y Google, creadores de los modelos m¨¢s c¨¦lebres, y Nvidia, al cargo de los sofisticados chips que emplean esas compa?¨ªas, han visto derrumbarse toda su aparente ventaja en apenas unos d¨ªas. Hoy hay menos expertos que creen que entrenar y usar un modelo de IA requiera la potencia de un gigante tecnol¨®gico. La monumental ca¨ªda en bolsa de Nvidia es la ilustraci¨®n de esa creencia.
Los chatbots de la china DeepSeek funcionan igual que todos. El usuario se da de alta con un email y una contrase?a en la p¨¢gina de la compa?¨ªa y puede empezar a preguntarle lo que quiera. A veces tarda algo m¨¢s de responder, no contesta siempre a preguntas pol¨ªticas delicadas sobre Tiananmen o Taiwan y funciona bastante bien en espa?ol. Lo mejor, sin embargo, es que es gratis. El modelo de negocio de DeepSeek se basa en cobrar a usuarios que requieren un uso profesional.
R1 es el modelo m¨¢s reciente de la compa?¨ªa china, el que ha provocado el derrumbe del edificio de la IA occidental. Razona igual que la creaci¨®n m¨¢s avanzada de OpenAI, el o1. Pero en plenas fiestas navide?as, los chinos lanzaron su modelo V3, equivalente al m¨¢s com¨²n ChatGPT-4, que ya inclu¨ªa los avances t¨¦cnicos que han generado el revuelo.
DeepSeek ha logrado que entrenar un modelo nuevo, que costaba m¨¢s de 100 millones de d¨®lares en el caso de ChatGPT-4, haya pasado a menos de 6 millones. Andrei Karpathy, cofundador de OpenAI, exdirector de IA en Tesla y uno de los expertos m¨¢s respetados del sector, describi¨® ese presupuesto como ¡°de broma¡± y a?adi¨®: ¡°Hay que asegurarse de que no somos derrochadores con lo que tenemos y este modelo parece una buena demostraci¨®n de que hay mucho que revisar tanto en datos como en algoritmos¡±. El ¨²ltimo modelo de DeepSeek es tan eficiente que requiri¨® una d¨¦cima parte del poder inform¨¢tico del modelo comparable de Meta.
Estos modelos de IA son extremadamente caros tanto de entrenar como luego de usar. DeepSeek ha logrado rebajar costes en ambos casos. Para entrenarlos, ha logrado que su modelo aprenda de otros anteriores. Esto es algo que los t¨¦rminos de servicio de estas empresas no permiten, pero es muy dif¨ªcil de detectar y de evitar. Igual que los modelos originales de OpenAI tomaron todos los datos de internet sin pagar por ellos, ahora un modelo chino emplea los modelos cerrados con un coste m¨ªnimo. Esto se logra con una t¨¦cnica llamada destilaci¨®n, que permite hacer preguntas al modelo anterior y guardar las respuestas y as¨ª ir aprendiendo y entren¨¢ndose. Esta t¨¦cnica implica que los modelos pueden aprender unos de otros, lo que nos arroja a otro escenario de evoluci¨®n a¨²n m¨¢s r¨¢pido y desconocido.
La otra t¨¦cnica que usa DeepSeek para rebajar costes es un sistema llamado de ¡°expertos¡±. Cada vez que el usuario hace una pregunta, el modelo decide si debe activar a su experto m¨¦dico, traductor, abogado o f¨ªsico. Los modelos cl¨¢sicos activan a todos de golpe, lo que supone un despilfarro de energ¨ªa y computaci¨®n. Es como necesitar una enorme planta propia de electricidad para poner en marcha una cadena de montaje elaborad¨ªsima. DeepSeek ha hecho lo mismo conectando su peque?a f¨¢brica a un enchufe y un pu?ado de generadores.
De repente, los usuarios que hasta ahora pagan unos 20 euros por usar los modelos de OpenAI ven c¨®mo pueden obtener casi los mismos resultados gratis. La expansi¨®n de la IA est¨¢ llegando m¨¢s r¨¢pido de lo previsto a su etapa de comoditizaci¨®n, cuando la nueva tecnolog¨ªa se convierte en un producto com¨²n y accesible a todos.
Todo esto ha ocurrido adem¨¢s en una empresa de Hangzhou, una ciudad china cercana a Shanghai. La Administraci¨®n de Biden vet¨® la exportaci¨®n de los chips m¨¢s nuevos para limitar la competencia china. La respuesta del gigante asi¨¢tico ha sido simple: no los necesitamos. Y lo han logrado con c¨®digo abierto, ense?ando las tripas de sus logros con documentaci¨®n publicada en internet. Hacer de la necesidad virtud.
El fin de esta etapa inicial de la IA parece ser una mala noticia para los gigantes pioneros, que ven como una buena parte de su ventaja desaparece. Pero el resto de grandes compa?¨ªas, como Amazon o Apple, que no estaban al frente de esta competici¨®n de la inteligencia artificial, pueden claramente beneficiarse y ofrecer los mismos beneficios que el resto a una porci¨®n del coste.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.