Claude 3.5 sugiere que la inminente ubicuidad de la IA podría ser algo positivo | Tecnología

0 0

yoLa frontera de la IA acaba de avanzar un poco más. El viernes, Anthropic, el laboratorio de IA creado por un equipo de empleados descontentos de OpenAI, lanzó la última versión de su Claude LLM. De Bloomberg:

La compañía dijo el jueves que el nuevo modelo –la tecnología que sustenta su popular chatbot Claude– es dos veces más rápido que su versión anterior más poderosa. Anthropic dijo en sus evaluaciones que el modelo supera a los principales competidores como OpenAI en varias capacidades de inteligencia clave, como la codificación y el razonamiento basado en texto.

Anthropic lanzó la versión anterior de Claude, la 3.0, en marzo. Este último modelo se ha denominado 3.5 y actualmente solo existe en la versión mediana “Sonnet” de la compañía. Su versión “Haiku”, más rápida, barata y tonta, llegará en breve, según afirma la empresa, al igual que su versión “Opus”, más lenta, cara pero más capaz.

Pero incluso antes de que Opus llegue, Anthropic dice que tiene la mejor IA del mercado. En una serie de comparaciones directas publicadas en su blog, 3.5 Sonnet superó al último modelo de OpenAI, GPT-4o, en tareas que incluyen exámenes de matemáticas, comprensión de textos y conocimientos universitarios. No fue una victoria arrasadora, ya que GPT mantuvo el liderazgo en algunos puntos de referencia, pero fue suficiente para justificar la afirmación de la empresa de estar en la frontera de lo posible.

En términos más cualitativos, la IA también parece un paso adelante. Anthropic dice:

Muestra una marcada mejora en la comprensión de matices, humor e instrucciones complejas, y es excepcional en la redacción de contenido de alta calidad con un tono natural y relatable.

Están calificando sus propios deberes, pero la descripción coincide con los cambios que he notado. Independientemente de los puntos de referencia técnicos, una conversación con la última versión de Claude se siente más agradable que con cualquier otro sistema de IA que haya usado hasta ahora.

Sin embargo, la empresa no se limita a vender la actualización en cuanto a potencia. En cambio, en una medida que favorece a los competidores desfavorecidos en todas partes, Anthropic se centra tanto en el coste como en la capacidad. Claude 3.5 no sólo es más inteligente que el antiguo modelo de última generación, afirma la empresa, sino que también es más barato.

Para los consumidores, el mercado de chatbots se está convirtiendo en un modelo “freemium”: de forma gratuita, se puede acceder a un chatbot (a veces de segundo nivel) durante un tiempo limitado, mientras que una suscripción mensual le permite acceder a los mejores modelos y a un uso superior o ilimitado. Sin embargo, para las empresas, existe una estructura de precios más estricta basada tanto en preguntas como en respuestas, y Anthropic ha rebajado el coste de los insumos a OpenAI y lo ha igualado en los resultados. cinco veces más barato que su mejor modelo anterior.

Si no te gusta ver que los chatbots de IA aparecen cada vez en más lugares, entonces es posible que tengas malas noticias. Cada vez es más barato crear tu propio negocio sobre una empresa como Anthropic, y más empresas lo harán a medida que bajen los precios. La buena noticia es que cada actualización también mejora la capacidad de esas empresas.

El último año de avances en IA ha sido extraño, visto en retrospectiva. Después del salto en capacidades que supuso GPT-4 la primavera pasada, la frontera ha avanzado a trompicones: Claude 3 y 3.5, y GPT-4o, todos ellos representaron mejoras claras, pero ninguno de ellos supuso el gran salto que la comunidad de IA ha estado dando a entender que se producirá en breve.

Al mismo tiempo, la presencia de cualquier mejora debería ser alentadora. El hecho de que se puedan hacer cambios significativos más allá de simplemente gastar una cantidad desmesurada de dinero en nuevos entrenamientos sugiere que se está aclarando parte del misterio sobre cómo funcionan realmente estos sistemas, y que el desarrollo de la IA está pasando de ser un arte a una ciencia. Eso, a su vez, debería significar que los productos de los entrenamientos masivos (que sin duda están ocurriendo) se puedan convertir en herramientas útiles y seguras más pronto que tarde.

Seguridad, hecha en Gran Bretaña

Rishi Sunak habla en el segundo día de la Cumbre de Seguridad de Inteligencia Artificial (IA) del Reino Unido en Bletchley Park en noviembre. Fotografía: Toby Melville/AP

El lanzamiento de Claude 3.5 tiene un final: el gobierno del Reino Unido ha aprobado su seguridad. Anthropic dice:

Como parte de nuestro compromiso con la seguridad y la transparencia, hemos contratado a expertos externos para probar y perfeccionar los mecanismos de seguridad de este último modelo. Recientemente, proporcionamos Claude 3.5 Sonnet al Instituto de Seguridad de Inteligencia Artificial del Reino Unido (AISI del Reino Unido) para una evaluación de seguridad previa a la implementación. El AISI del Reino Unido completó las pruebas del 3.5 Sonnet y compartió sus resultados con el Instituto de Seguridad de Inteligencia Artificial de los Estados Unidos (AISI de los Estados Unidos) como parte de un Memorando de Entendimiento, que fue posible gracias a la asociación entre los AISI de los Estados Unidos y el Reino Unido. anunciado a principios de este año.

Al igual que en el caso de las cumbres de inteligencia artificial de Bletchley y Seúl, el gobierno del Reino Unido ha logrado convertir lo que podría haber sido una peculiaridad tecnófila de Rishi Sunak en algo aparentemente duradero y exitoso. El hecho de que el instituto de seguridad de la inteligencia artificial del sector público sea tan líder a nivel mundial que el gobierno de los EE. UU. esté externalizando su propio trabajo a nosotros es algo de lo que realmente podemos estar orgullosos.

La siguiente pregunta, por supuesto, es qué beneficios puede obtenerse de ello. Es fácil conseguir un modelo de IA para comprobar si la empresa implicada cree que va a aprobar con éxito; la pregunta será si AISI puede cambiar los laboratorios de IA, en lugar de limitarse a estimularlos y ver qué sucede.

Saltar la promoción del boletín informativo

La UE no puede despedirnos: dimitimos

Margrethe Vestager da una conferencia de prensa sobre el caso antimonopolio de la UE con la App Store de Apple en Bruselas, Bélgica, el 4 de marzo de 2024. Fotografía: Olivier Hoslet/EPA

La guerra de Apple con la UE se está volviendo más intensa. El viernes, la compañía confirmó que no enviará una serie de nuevas funciones a los usuarios de la UE, citando “incertidumbres regulatorias generadas por la Ley de Mercados Digitales (DMA)”. De su declaración:

No creemos que podamos ofrecer tres de estas funciones (duplicación de pantalla de iPhone, mejoras en el uso compartido de pantalla de SharePlay y Apple Intelligence) a nuestros usuarios de la UE este año.

En concreto, nos preocupa que los requisitos de interoperabilidad de la DMA puedan obligarnos a comprometer la integridad de nuestros productos de formas que pongan en riesgo la privacidad del usuario y la seguridad de los datos. Nos comprometemos a colaborar con la Comisión Europea en un intento de encontrar una solución que nos permita ofrecer estas características a nuestros clientes de la UE sin comprometer su seguridad.

Se trata de una afirmación que parece sacada de un test de Rorschach. Si crees que la normativa de la UE es autoritaria, proteccionista e incoherente, entonces Apple está tomando la única medida sensata: limitar el lanzamiento de sus productos a las características menos controvertidas para evitar una posible multa de miles de millones de euros.

Si, por el contrario, usted piensa que la respuesta de Apple a la UE ha sido de cumplimiento malicioso e indignación ante la idea de una autoridad más legítima que la suya, entonces esto es simplemente otro intento de disuadir a los gobiernos de seguir los pasos del bloque.

Al parecer, la UE no se deja intimidar. El lunes anunció sus planes de demandar a Apple por su incumplimiento:

En sus conclusiones preliminares, contra las cuales Apple puede apelar, la Comisión Europea dijo que creía que sus reglas de participación no cumplían con la Ley de Mercados Digitales (DMA) “ya que impiden a los desarrolladores de aplicaciones dirigir libremente a los consumidores a canales alternativos para ofertas y contenido”.

Además, la comisión ha abierto un nuevo procedimiento por incumplimiento contra Apple debido a que sus nuevos términos contractuales para desarrolladores de aplicaciones de terceros también no cumplen los requisitos de la DMA.

Para la UE, el principio es claro: si un cliente europeo quiere hacer negocios con una empresa europea, no debería estar en manos de un tercer país, empresa o persona impedir que ese mercado funcione. Es lo más cercano al ideal fundacional del bloque que se puede conseguir, en realidad.

Pero tampoco es exactamente lo que dice la DMA. De ahí el conflicto. Apple quiere seguir la letra de la ley y al mismo tiempo conservar el máximo control posible sobre sus plataformas; la UE quiere interpretar esa misma ley para dar la mayor libertad posible para un comercio fluido. No sé qué interpretación ganará esta vez, pero confío en mi predicción de que las apelaciones apenas han comenzado.

Fuente

Deja un comentario