OpenAI dice que el último ChatGPT puede “pensar” y yo tengo mis propias ideas | Tecnología

By John T. Park On Sep 24, 2024

Nos estamos acercando rápidamente a los dos años de la revolución de la IA generativa, desencadenada por el lanzamiento de ChatGPT en noviembre de 2022 por OpenAI. Hasta ahora, los resultados han sido dispares.

OpenAI anunció recientemente que había cruzó los 200 millones usuarios activos semanales: nada despreciable, pero consiguió sus primeros 100 millones a los dos meses de su lanzamiento. Un estudio reciente de YouGov descubrió que la inclusión de IA en un producto es tan probable que se apague un comprador potencial tanto como lograr que le entregue su dinero.

Sin embargo, el dinero sigue fluyendo al sector y los avances siguen llegando. OpenAI está buscando inversores para financiar el desarrollo futuro que permitiría a la empresa valorado en 150 mil millones de dólaresEso sería Ponlo a la par con Cisco, Shell y McDonalds. Y la semana pasada, presentó su último modelo, llamado o1, que ha promocionado como un cambio radical en el desarrollo de la IA generativa.

El modelo o1, anteriormente llamado Strawberry, está diseñado para razonar sobre las decisiones, de forma muy similar a como lo hacen los humanos. La última versión del modelo que sustenta ChatGPT es en realidad un paso atrás en lo que respecta a la velocidad de salida y al tamaño del modelo, que es más pequeño por el momento. Piense en él como GPT-4.5, en lugar de la próxima gran iteración que se rumorea, GPT-5, que al parecer todavía está en desarrollo.

Misión: ¿Imposible?

Si bien en el papel o1 es un fracaso, hace algo que Alex había destacado anteriormente en este boletín como un problema con los chatbots basados en LLM, y que él llamó el “problema de Tom Cruise”. El problema era que los investigadores podían hacer una pregunta a ChatGPT de una manera, pero cuando se le hacía una pregunta que se relacionaba directamente con la inicial (por ejemplo, ¿quién es la madre de Tom Cruise? (Respuesta: Mary Lee Pfeiffer) y luego se le preguntaba quién es el hijo de Mary Lee Pfeiffer (Respuesta: Tom Cruise), se resistía.

Si le haces ese par de preguntas a o1, la respuesta es excelente. Incluso proporciona pistas sobre cómo llega a la respuesta (algo que OpenAI ha hecho de manera astuta e imprecisa porque los modelos de IA no tienen cerebro), llamadas “pensamientos”. (Si quieres saber por qué la antropomorfización de los modelos de IA es un problema, consulta Esta historia (Escribí en febrero.) Cuando me hicieron la segunda pregunta, o1 “pensó” durante cuatro segundos, incluyendo rastrear las conexiones familiares y confirmar los detalles.

Hasta ahora, todo bien. OpenAI dice que o1 puede razonarMuchos no están tan seguros de una afirmación tan declarativa como esa, pero dejémosles que la tengan para fines de marketing. Eso significaría un cambio significativo en la forma en que se puede utilizar la IA generativa: en lugar de regurgitar hechos de sus datos de entrenamiento o producir respuestas que estadísticamente considera que tienen más probabilidades de complacer a los usuarios, podría considerar la información y responder.

Sin embargo, la palabra clave es “podría”. Todavía desconocemos en gran medida cómo funcionan estas cosas, y “nosotros” incluye a los desarrolladores de dichas herramientas. OpenAI ha dicho que esta capacidad de razonar es algo muy importante; la empresa incluso ha lanzado una afirmación cuestionable de que o1 es su modelo más peligroso hasta el momento (ver aquí (Porque a veces esto es más una estrategia de marketing que otra cosa). Quienes han intentado investigar los límites del modelo o1 parecen estar de acuerdo con su argumento sobre el razonamiento, pero no tanto con la parte del peligro.

¡No le prestes atención a ese hombre detrás de la cortina!

¿Pensamientos? … OpenAI cree que su IA puede pensar. Fotografía: Dado Ruvić/Reuters

Bueno, más o menos. Porque la investigación solo puede llegar hasta cierto punto. Para intentar comprender la cadena de procesos de pensamiento que sustenta o1, si quieres una buena introducción, Simon Willison es siempre confiable – Los usuarios que desean investigar más a fondo han intentado obtener un poco más de detalles sobre cuál es exactamente el proceso de “pensamiento” de o1. La información que se les muestra actualmente a los usuarios es un breve resumen de cada paso en la cadena de pensamiento.

Y por eso, le han estado preguntando al propio modelo cómo llega a sus respuestas, aunque… También he recibido correos electrónicos de OpenAI pidiéndoles que dejen de hacerlo, de lo contrario sus cuentas serán suspendidas.

Saltar la promoción del boletín informativo

Todo esto significa que nos quedamos un poco a oscuras. Esto parece un cambio radical en el mundo de la IA y algo que podría hacer que la herramienta pase de ser una herramienta cuyos resultados hay que mirar con recelo a una herramienta de uso obligatorio.

Lo que resulta particularmente interesante es que el dominio de OpenAI ha eliminado de manera efectiva la cobertura de todos y cada uno de los competidores en los últimos tiempos. Mistral, el competidor francés muy promocionado, lanzó su primer modelo multimodal la semana pasadaEl modelo Pixtral 12B añade reconocimiento de imágenes a la generación de texto. Debería haber recibido grandes elogios, pero OpenAI y o1 se llevaron todo el oxígeno.

De todos modos, todo esto significa que la IA sigue avanzando y está empezando a cumplir por fin sus promesas. Otra cuestión es si quienes probaron ChatGPT en sus inicios y les pareció deficiente podrán volver a probar los nuevos y fantásticos modelos.

El TechScape más amplio

El amor duele… ¿Las aplicaciones de citas han contribuido a la caída de la economía? Fotografía: Tero Vesalainen/Alamy

Fuente