Apple ha anunciado recientemente actualizaciones en los modelos de Inteligencia Artificial (IA) que impulsan su conjunto de funciones Apple Intelligence, presentes en iOS, macOS y otras plataformas. Sin embargo, la propia compañía ha revelado datos de rendimiento que sugieren que estas novedades no logran superar, e incluso se quedan por detrás, de modelos más antiguos de firmas tecnológicas competidoras como OpenAI.
Según un artículo publicado por Kyle Wiggers en TechCrunch el 10 de junio de 2025, los benchmarks internos de Apple pintan un panorama menos optimista de lo que se podría esperar del gigante tecnológico en la cada vez más competitiva carrera de la IA.
Decepción en las Pruebas de Rendimiento Textual
Apple detalló en una entrada de su blog de aprendizaje automático el lunes los resultados de sus evaluaciones. En ellas, el nuevo modelo "Apple On-Device", diseñado para funcionar sin conexión en dispositivos como el iPhone, fue sometido a pruebas con evaluadores humanos. Estos calificaron la calidad del texto generado por el modelo de Apple como "comparable" a la de modelos de tamaño similar de Google y Alibaba, pero no la consideraron superior.
Por otro lado, el modelo más potente de Apple, denominado "Apple Server" y destinado a operar en los centros de datos de la compañía, también fue evaluado. En este caso, los probadores humanos lo situaron por detrás del modelo GPT-4o de OpenAI, un modelo que ya cuenta con un año de antigüedad en el mercado. Este resultado es particularmente notable dada la rápida evolución y los avances constantes en el campo de los modelos de lenguaje grandes.
El Análisis de Imágenes También Presenta Desafíos
Las pruebas no se limitaron a la generación de texto. En una evaluación separada centrada en la capacidad de los modelos de Apple para analizar imágenes, los evaluadores humanos, según la propia Apple, prefirieron el modelo Llama 4 Scout de Meta sobre el "Apple Server". Este dato resulta "un tanto sorprendente", como señala TechCrunch, ya que, en varias pruebas, Llama 4 Scout no se posiciona como uno de los modelos líderes frente a las propuestas de laboratorios de IA como Google, Anthropic y OpenAI.
Estos hallazgos, provenientes directamente de Apple, añaden credibilidad a los informes que han estado circulando en la industria, sugiriendo que la división de investigación de IA de la empresa de Cupertino ha estado luchando por alcanzar el ritmo de sus competidores.
Un Patrón de Dificultades en la Carrera de la IA
No es la primera vez que las iniciativas de Apple en el campo de la inteligencia artificial generan dudas. En los últimos años, las capacidades de IA integradas en sus productos han resultado decepcionantes para algunos usuarios y analistas, como fue el caso de la pausa en los resúmenes de notificaciones por IA para noticias tras generar alertas falsas. Además, una muy esperada y prometida actualización de Siri, su asistente virtual, ha sido retrasada indefinidamente, lo que ha incrementado la percepción de un rezago en esta área.
La situación ha llegado incluso a instancias legales, con algunos clientes que han demandado a Apple, acusando a la firma de comercializar funciones de IA para sus productos que, según los demandantes, aún no han sido entregadas o no cumplen con lo prometido. Los resultados de estos últimos benchmarks internos no hacen sino reforzar estas preocupaciones sobre la competitividad de Apple en el sector de la IA.
Novedades y Mejoras Anunciadas por Apple
A pesar de los resultados comparativos en rendimiento, Apple sí ha destacado ciertas mejoras y características en sus nuevos modelos. El modelo "Apple On-Device", que cuenta con aproximadamente 3.000 millones de parámetros (una medida que se corresponde a grandes rasgos con la complejidad y capacidad de resolución de problemas del modelo; generalmente, más parámetros implican un mejor rendimiento), es el motor de funciones como la sumarización de textos y el análisis de contenido directamente en el dispositivo del usuario. Desde el pasado lunes, los desarrolladores de terceros pueden acceder a este modelo a través del framework Foundation Models de Apple, lo que podría abrir la puerta a nuevas integraciones y aplicaciones.
Según la compañía, tanto el modelo "Apple On-Device" como el "Apple Server" presumen de un mejor uso de herramientas y una mayor eficiencia en comparación con sus predecesores. Además, se afirma que son capaces de comprender alrededor de 15 idiomas. Estas mejoras se atribuyen, en parte, a un conjunto de datos de entrenamiento significativamente ampliado, que ahora incluye datos de imágenes, archivos PDF, documentos, manuscritos, infografías, tablas y gráficos, tal como se detalla en el mencionado post del blog de Apple.
La industria observará de cerca cómo estas capacidades se traducen en la experiencia del usuario final y si Apple logra acortar la distancia con los líderes actuales en el vertiginoso desarrollo de la inteligencia artificial. Por ahora, la transparencia de la compañía al publicar estos benchmarks, aunque revelen ciertas debilidades, es un paso que permite una evaluación más clara de su posición actual.