JetBrains, la compañía detrás de numerosas herramientas populares de desarrollo de aplicaciones, ha liberado su primer modelo de inteligencia artificial «abierto» enfocado en programación. Este miércoles, la empresa puso a disposición del público Mellum en la plataforma de desarrollo de IA Hugging Face, un modelo generador de código que previamente había sido incorporado en sus diferentes suites de desarrollo de software durante el año pasado.
Un asistente especializado en completar código
Mellum representa un importante avance para JetBrains en el campo de la inteligencia artificial aplicada a la programación. El modelo ha sido entrenado con más de 4 billones de tokens (unidades básicas de datos que procesa un modelo de IA) y cuenta con 4 mil millones de parámetros. Para poner esto en perspectiva, un millón de tokens equivale aproximadamente a 30.000 líneas de código.
A diferencia de modelos de IA más generalistas, Mellum ha sido diseñado específicamente para la completación de código, es decir, para sugerir y completar fragmentos de código basándose en el contexto circundante. Según explica JetBrains en su informe técnico publicado en Hugging Face, el modelo está «diseñado para integrarse en herramientas profesionales de desarrollo (como sugerencias inteligentes de código en entornos de desarrollo integrados), asistentes de programación impulsados por IA e investigación sobre comprensión y generación de código». Además, señalan que «también es adecuado para aplicaciones educativas y experimentos de fine-tuning».
Un entrenamiento basado en código abierto
El proceso de desarrollo de Mellum ha requerido recursos significativos. JetBrains indica que entrenó el modelo en una colección de conjuntos de datos que incluyen código con licencias permisivas de GitHub y artículos de Wikipedia en inglés. El entrenamiento completo tomó aproximadamente 20 días utilizando un clúster de 256 GPUs Nvidia H200.
Un aspecto destacable es que Mellum se distribuye bajo la licencia Apache 2.0, lo que permite a los desarrolladores utilizarlo con amplia libertad para sus proyectos. Esto se alinea con la tendencia creciente de modelos de IA «abiertos» que buscan democratizar el acceso a estas tecnologías.
Limitaciones y consideraciones prácticas
A pesar de sus capacidades, JetBrains ha sido transparente sobre las limitaciones de Mellum. El modelo base no puede utilizarse inmediatamente; requiere un proceso de «fine-tuning» o ajuste fino previo. Aunque la compañía ha proporcionado algunos modelos de Mellum ya ajustados para Python, advierte que estos están pensados para «estimar las capacidades potenciales» y no para implementarse directamente en entornos de producción.
La empresa también reconoce posibles problemas inherentes al modelo, señalando en su entrada de blog que Mellum puede «reflejar sesgos presentes en repositorios públicos de código» (como generar código similar en estilo a repositorios de código abierto), y que sus sugerencias no necesariamente serán «seguras o libres de vulnerabilidades».
El desafío de seguridad en el código generado por IA
La seguridad del código generado mediante inteligencia artificial representa un importante desafío en el sector. Según una encuesta realizada a finales de 2023 por la plataforma de seguridad para desarrolladores Synk, más del 50% de las organizaciones encuentran problemas de seguridad con el código producido por IA de forma ocasional o frecuente.
Este contexto hace que el enfoque prudente de JetBrains respecto a las capacidades y limitaciones de Mellum resulte especialmente relevante. La compañía parece estar buscando un equilibrio entre ofrecer una herramienta potente y mantener expectativas realistas sobre sus resultados.
El futuro de Mellum en el ecosistema de desarrollo
JetBrains se muestra optimista pero realista sobre el futuro de su modelo. «Esto es solo el comienzo», escribió la compañía en su blog. «No perseguimos la generalidad, sino la especialización. Si Mellum inspira aunque sea un experimento significativo, contribución o colaboración, lo consideraríamos un éxito».
Este enfoque refleja una tendencia creciente en el desarrollo de IA: en lugar de crear modelos extremadamente grandes y generalistas, algunas empresas están optando por soluciones más especializadas, diseñadas para tareas específicas como la programación.
Impacto en la comunidad de desarrollo
La disponibilidad de Mellum en Hugging Face representa una oportunidad para que investigadores y desarrolladores exploren y experimenten con un modelo especializado en programación. Al ser «abierto», permite mayor transparencia y colaboración, aspectos valorados en la comunidad de desarrollo de software.
Para los desarrolladores que utilizan las herramientas de JetBrains, este lanzamiento podría eventualmente traducirse en mejoras en las capacidades de asistencia de código en sus entornos de desarrollo integrados, aunque como la propia empresa señala, el camino desde el modelo base hasta aplicaciones prácticas requiere trabajo adicional.
En un momento en que la IA está transformando rápidamente las prácticas de desarrollo de software, iniciativas como Mellum contribuyen a ampliar el ecosistema de herramientas disponibles para los programadores, aunque siempre con la necesaria conciencia sobre sus limitaciones y desafíos pendientes.
Los interesados en explorar el modelo pueden acceder a él a través de la página de Mellum en Hugging Face, donde también encontrarán documentación detallada sobre sus características técnicas y recomendaciones de uso.