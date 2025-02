La mayor obsesión de EE.UU. en su lucha tecnológica contra la potencia que amenaza su hegemonía ha sido mantenerse a la vanguardia del desarrollo de la Inteligencia Artificial: lo venía logrando con comodidad. Esto cambió en la misma semana que asumió Donald Trump. ¿El saludito de bienvenida? Los chinos parecen haber ascendido en la tabla de posiciones de la IA para compartir ya esa cima con su adversario. Cuando a EE.UU. se le mueve la estantería, repercute en Wall Street: las acciones de Nvidia --mayor productor de microchips de EE.UU. para la IA-- se desplomaron en un día por un valor de 589.000 millones de dólares: nunca en la historia le había pasado algo así a una empresa. Hay graves problemas, desde la perspectiva norteamericana. Pero el partido recién comienza y China lo acaba de empatar. Para analizar las estrategias de cada contendiente, Página/12 entrevistó a Javier Blanco, doctor en Informática por la Universidad de Eindhoven en los Países Bajos, profesor titular en la Universidad Nacional de Córdoba y director de la Maestría en Tecnología, Política y Culturas. Se especializa en temas de filosofía de la computación y los vínculos entre tecnología y política.

--Usted sabe de programación. Diseccionemos a DeepSeek R1 desde esta perspectiva y comparemos con ChatGPT. Son programas muy sofisticados y la calidad de respuestas y búsquedas que ofrecen están a la misma altura, según mi experiencia. ¿Qué los emparenta?

--Si bien en un cierto sentido son programas sofisticados, desarrollados a partir de técnicas y procesos complejos y costosos, en un sentido conceptual son sorprendentemente simples. A diferencia de otras ramas de la informática, los programas de machine learning son en general clasificadores estadísticos, capaces de reconocer y de generar patrones complejos que satisfagan ciertos criterios implícitos obtenidos a partir de los datos. En el caso de los modelos de lenguaje, como DeepSeek o ChatGPT aprenden a reconocer frases correctas. El generador produce frases al azar que son aceptables para el clasificador. Algo similar pasa con las imágenes. Luego de un entrenamiento con fotos de elefantes, el programa aprende a reconocer si hay elefantes en una foto nueva. Como sistemas algorítmicos son bastante simples. La complejidad está en el proceso de desarrollo, en la matemática usada para obtenerlos y en la cantidad de datos procesados. Tanto DeepSeek como ChatGPT pertenecen al grupo de programas que ocupan la primera plana en los últimos tiempos, los Grandes Modelos de Lenguaje (LLM por sus siglas en inglés) y sus similitudes en el funcionamiento son ostensibles. A diferencia de la mayoría de los desarrollos de software, los LLM necesitan detrás grandes infraestructuras computacionales y acceso a enormes repositorios de datos (esta última es la complejidad, no tanto el software). Quizá sea esta una de las razones de las enormes inversiones, muchas veces deficitarias. Estas espaldas económicas tan anchas que se suelen necesitar para estos desarrollos de IA incrementan las ventajas de las grandes corporaciones para picar en punta --aún perdiendo plata-- y conformar monopolios u oligopolios.

--¿Qué los diferencia?

--Entre las diferencias que tiene y/o dice tener DeepSeek, está el hecho de que fue hecha en China. Esto no sólo es una importante diferencia cultural sino también de contexto de producción. La adopción de un modelo abierto de software es fundamental y creo que eso va a alentar una cultura colaborativa en la producción de machine learning, análoga a la ya consolidada del software libre. La mayoría de los LLM fueron desarrollados en EE.UU. por lo que se enmarcan en un contexto cultural determinado, lo cual introduce, a veces de manera implícita, sesgos particulares. Si consideramos que existen diferentes “cosmotécnicas” --formas de articular técnicamente una visión del mundo con formas normativas y prácticas-- es esencial una variedad amplia en la producción de programas como los LLM que son tan usados e influyen en el devenir de las culturas. También será necesario desarrollar modelos propios en el sur global, cuyas especificidades exceden ampliamente la “cultura occidental”.

--Es curioso que la mayor amenaza a la hegemonía de Silicon Valley no llegó de una de las big-techs chinas --Baidu, Alibaba, Tencent, Xiaomi y Huawei-- sino de una startup poco conocida. Esta empresa no pica en punta: sería lo que en EE.UU. llaman un copycat, una imitación. No inventaron la rueda pero la alivianaron y achicaron los costos. ¿Qué información maneja al respecto?

--Hasta donde se sabe, tanto el costo de procesamiento como el de horas de trabajo humano fue mucho menor que los desarrollados en EE.UU. Habrá que sopesar bien las causas y las posibilidades que se abren. Es difícil dimensionar la relevancia de este avance tecnológico en la disputa geopolítica por el liderazgo de la IA, pero demuestra empíricamente la posibilidad de modelos alternativos de desarrollo. El objetivo manifiesto del gerente de DeepSeek no es la valorización financiera de su empresa, sino sumarse al avance del conocimiento de vanguardia. Y al proponerlo con un modelo de código abierto, se incorpora a una cultura tecnológica rica y transformadora con una historia interesante y exitosa. Es de esperar, como lo expresa el gerente de la compañía, que el compromiso con el código abierto favorezca la evolución de un ecosistema productivo en China, o incluso en el resto del mundo.

--Se acusa a DeepSeek de haberle robado los programas algorítmicos a ChatGPT. ¿Es posible técnicamente eso? ¿Mediante topos? ¿Hackeos?

--Circulan hipótesis y supuestas declaraciones, pero hay que ver qué queda cuando se disipe el humo. No hacen falta topos ni hackeos, no hay grandes secretos por develar, quizá sólo cierto know-how y conocimiento tácito que podría servir para otros emprendimientos, pero no es algo que pueda robarse. Escuché que se acusa a DeepSeek de usar a ChatGPT como modelo para “destilación” en el entrenamiento del propio. Un LLM ya desarrollado puede usarse para acelerar el entrenamiento de uno nuevo, tomándolo como un “oráculo” para mejorar la clasificación de las respuestas del nuevo modelo. Incluso si se hubiera usado de esa manera, sería un buen uso de los recursos, aprovechando el tiempo y recursos empleados en el primer modelo, para construir otros nuevos de manera más eficiente. Creo que esto muestra una buena alternativa para formas de desarrollo abiertas por venir.

--EE.UU. somete a China a un bloqueo comercial de microchips. Eso afectó parte del desarrollo chino. Pareciera que aun con esta desventaja, DeepSeek ha logrado algo asombroso: como no podía competir por el lado del hardware --tenía menor tecnología-- avanzaron por el lado más difícil: sobresalir a través del software para alcanzar al adversario. De ser así, es algo impresionante: ¡los alcanzaron a puro cerebro! Y lo hizo una empresa creada en 2023 que puso a un grupo de genios matemáticos de la programación a pensar cómo resolver problemas muy complejos, de manera más sencilla. ¿Lo lograron?

--Obviamente el proceso de desarrollo fue virtuoso y consiguieron resultados muy por arriba de lo esperado, y que esto se haya conseguido pese al bloqueo tecnológico es algo auspicioso para China y el resto del mundo. Sin duda hay mucho talento involucrado en estos desarrollos, y no sólo matemático o informático. Hacen falta miradas interdisciplinarias y equipos de trabajo innovadores, pero sobre todo objetivos valiosos compartidos, que no es algo que abunde en las empresas tecnológicas.

--China eludió estas sanciones mejorando sus propios microchips. Aunque aún está lejos de Occidente y sus aliados de Corea del Sur y Taiwán (la isla tiene la mejor empresa de chips del mundo, TSMC). El desarrollo de punta por sustitución de importaciones habría beneficiado a China, que innovó gracias a sus limitaciones, y no a pesar de ellas. Y EE.UU. dañó a sus propias empresas. ¿DeepSeek demostraría que falló la estrategia de Washington?

--Creo que muestra que no es una estrategia infalible, pero seguimos lejos en todo el mundo de alcanzar una tecnodiversidad necesaria para un desarrollo multicultural y sustentable. Los resultados obtenidos en China alientan a buscar caminos alternativos a la clausura tecnológica y política que buscan imponer desde EE.UU. al resto del mundo –consolidando sus monopolios tecnológicos--, algo que se sintetiza en la foto de los líderes de las corporaciones informacionales en la asunción de Trump, quien apuesta a ellos para su consigna “hacer a América grande otra vez”. Es esperable que siga este tipo de batalla por el liderazgo en IA, que no es bueno para nadie. Esperemos que cambie en el mediano plazo y haya estrategias multipolares no antagónicas, para lo cual es necesario fortalecer la colaboración en proyectos cuyo objetivo principal no sea el lucro.

--Surge una nueva estrella entre los CEO tecnológicos: Liang Wenfeng, empresario de Guangdong con perfil opuesto a Elon Musk. Ha dicho que parte de su éxito se debe a que DeepSeek estaría centrada en la investigación y no el lucro: “Nuestro principio no es perder dinero, ni obtener enormes ganancias... nuestro punto de partida no es aprovechar la oportunidad de hacer una fortuna, sino estar a la vanguardia de la tecnología y promover el desarrollo de todo el ecosistema”. Si es cierto, detrás estaría el Estado chino, al estilo modelo tigreasiático.

--Ojalá esto sea el inicio de una nueva cultura del desarrollo de modelos de machine learning, donde la experiencia de otros sea un insumo para el desarrollo. Si bien este tipo de cultura fue importante en los inicios del machine learning --gracias a la disponibilidad de modelos y bases de datos para entrenamiento-- en el último tiempo las grandes corporaciones están “cerrando” sus sistemas y usando infraestructuras que no pueden ser replicadas por actores más chicos. El problema no es sólo el lucro como principio rector, sino que se busca la valorización bursátil de las empresas que en general, son deficitarias. Paradójicamente, dado el bajo costo de producción de DeepSeek, es de las pocas que pueden llegar a tener ganancia y recuperar el dinero invertido, y no meramente depender de subsidios y de los avatares de Wall Street. Es curioso que los defensores del libre mercado entren en pánico cuando aparece algún atisbo de competencia real.

--¿Por qué habríamos de creer que no hay un interés lucrativo? Hay un fondo de inversión detrás de DeepSeek y se llama High-Flyer que había ganado 13.790 millones de dólares usando modelos de IA para predecir las variaciones en el mercado de acciones. Y en 2023 decidieron cambiar de rumbo para enfocarse en el desarrollo de la IA de punta.

--No es que no haya un interés lucrativo, sino que puede no ser el único o el principal. Lo que ya demostró el movimiento de software libre es que es posible obtener ganancias económicas compartiendo los avances tecnológicos, produciendo servicios de calidad y distribuyendo los costos de producción en una red colaborativa. Es otro modelo de desarrollo y negocios, viable para muchos y contrario a los monopolios. Impulsar un modelo análogo para el desarrollo de machine learning puede ser beneficioso para muchas startups en términos económicos, pero sobre todo es también una buena idea para el desarrollo de software necesario para la transformación social.

--En 2021 Liang informó que había acumulado 10.000 microchips de Nvidia. Al año siguiente Joe Biden profundizó las limitaciones de venta de semiconductores a China: prohibió venderles el potente chip H100 de Nvidia. Esta empresa desarrolló en cambio el chip H800 para el mercado chino y DeepSeek dice que con estos entrenó a su modelo de IA. Acaso China tenía reservas secretas de microchips. ¿Está en cuestión la hegemonía de EE.UU. en IA?

--Creo que por ahora EE.UU. lleva la delantera por mucho. Y como muestra de manera descarada toda esta política, “hacen trampa” respecto de las supuestas leyes del mercado. No cabe duda de que la principal disputa económica del siglo XXI es por el conocimiento. Las leyes de propiedad intelectual y patentes funcionan como una de las principales herramientas para apropiarse del conocimiento. No es claro que las empresas de IA en Silicon Valley respeten esas leyes, pero desde que apareció el modelo V3 de DeepSeek, desde diversas usinas comunicacionales insistieron con el tema del copyright. Y reinstalaron la sospecha por el uso de los datos de los usuarios por parte de una empresa china.

--¿Estamos en un momento Sputnik? Es el efecto que produjo en EE.UU. el lanzamiento por parte de la URSS de su primer satélite orbital. Creo que ahora es al revés: el Sputnik 1 fue ChatGPT. La respuesta al Sputnik fue la creación de la NASA y el lanzamiento del satélite Explorer 1. La respuesta china fue DeepSeek.

--Más allá de las analogías, creo que este logro de una pequeña start-up china es un poco de aire fresco y un impulso a buscar caminos alternativos de desarrollo. A diferencia de la carrera espacial y de la energía nuclear, no es necesario hoy que el futuro se dirima en una nueva Guerra Fría entre dos estados o bloques de países. La IA y en general el software, tienen una forma de existencia más ubicua y pueden construirse alternativas desde diferentes organizaciones de la sociedad civil. Esperemos que la gran concentración tecnológica producida por la IA en la última década sea la excepción y se retome el camino del software como bien común, lo que habilita modelos de desarrollo virtuosos y sobre todo diversos, contrastando con la homogeneidad que parece tranquilizar a los brokers y a sus representantes en algunos gobiernos.

--Hablemos de geopolítica. ¿Xi Jinping 1 - Donald Trump 0? ¿O China empató el partido y están 1-1?

--Creo que DeepSeek cambió el juego e inició un nuevo partido, algo desigual aún pero hay que ver cómo evoluciona. En cualquier caso, la agenda de Trump va más hacia la concentración y trata de evitar que el resto del mundo se desarrolle: esto es todo lo que está mal para el mundo. Es indispensable que se agreguen otros actores que puedan contrapesar a los gigantes de Silicon Valley y a la lógica del capital financiero.

--Aquí juega el asunto de la programación con códigos de fuente abierta. DeepSeek ofrece eso a los usuarios, incluyendo la capacidad de modificar el algoritmo. ¿Es así? ¿Cuántas personas están en condiciones de hacerlo? Sería extraño que China lo permita: sus buscadores tienen sesgos políticos estrictos. La pregunté a DeepSeek por la Masacre de Tiananmén y dio la información completa. En minutos, la borró diciendo “mejor hablemos de otra cosa”.

--Esperemos que esto no quede sólo en las intenciones; recordemos que ChatGPT fue desarrollado por una empresa de sugestivo nombre: OpenAI. Pero en los últimos sistemas que lanzaron, lo único que quedó de “abierto” es el nombre. Los LLM tienen múltiples lugares donde se puede modificar su comportamiento. Por un lado, está el modelo estadístico mismo, el que se crea a partir de los datos por un proceso de entrenamiento. Esto no puede modificarse de manera sencilla, ni siquiera por parte de quienes lo programaron. La gran ventaja está en disponer de ese código para producir nuevos modelos de manera más eficiente, con una gran parte del procesamiento ya hecho. Por otro lado, todos los sistemas interactivos tienen modificaciones a posteriori que hacen que el “comportamiento” sea decente, que no diga barbaridades o sea ofensivo: es una especie de “super yo” computacional. En esta fase utilizan mucha mano de obra barata en países periféricos, miles de personas haciendo el monótono trabajo de enseñarle al algoritmo obviedades, por sí o por no, y a “portarse bien”. Todo clasificador (o generador) estadístico producido por machine learning tiene sesgos intrínsecos al modelo mismo. Además, se puede moderar (o incrementar) esos sesgos a través de modificaciones a posteriori. Siempre es más fácil ver los sesgos políticos o ideológicos en el otro. No existen, por definición, sistemas que no tengan sesgos. Por eso la diversidad es valiosa.

--Liang, quien tiene 40 años, ha dicho que su objetivo con DeepSeek es alcanzar la Inteligencia Artificial General (AGI) que cambiaría la historia de la humanidad, una super IA mucho más veloz e inteligente que cualquier humano, e incluso que la humanidad en su conjunto.

--En verdad no es claro lo qué significa esto, hay mucha discusión científica y filosófica. Sería una inteligencia que actúe con la misma versatilidad y al menos en los mismos registros que la humana. No sé si el machine learning es la mejor tecnología para eso, pero tampoco creo que buscar la AGI sea el mejor camino a seguir. Decía Dijkstra que “el esfuerzo de utilizar máquinas para imitar la mente humana siempre me ha parecido bastante tonto: las usaría para imitar algo mejor”. Creo que estamos frente a la oportunidad de orientar una coevolución de mentes y programas, no se trata de imitar las formas cognitivas humanas, sino de inventar e integrar formas cognitivas diversas. Y desarrollar nuevos ambientes técnicos donde esto sea posible, orientados por valores colectivos y colaborativos. Esto es condición necesaria para que haya algún futuro para el mundo.