Microsoft lanza Phi-4-multimodal y Phi-4-mini: IA avanzada para desarrolladores

Microsoft ha anunciado el lanzamiento de Phi-4-multimodal y Phi-4-mini, dos nuevos modelos de lenguaje pequeños (SLM, por sus siglas en inglés) diseñados para ofrecer capacidades avanzadas de inteligencia artificial (IA) en texto, voz e imágenes. Estos modelos están orientados a desarrolladores y optimizados para escenarios con limitaciones de cómputo, permitiendo aplicaciones de IA en diversas industrias.

Phi-4-multimodal: IA integral para procesamiento de voz, imágenes y texto

El modelo Phi-4-multimodal cuenta con 5.600 millones de parámetros y se caracteriza por su capacidad para procesar simultáneamente imágenes, audio, gráficos, tablas y documentos dentro de una arquitectura unificada.

🔹 Características principales:

  • Procesamiento intermodal avanzado, permitiendo interacciones más naturales y sensibles al contexto.
  • Supera a modelos especializados como WhisperV3 y SeamlessM4T-v2-Large en tareas de reconocimiento automático de voz y traducción.
  • Baja latencia y alta eficiencia, optimizando la ejecución en dispositivos con menor carga computacional.
  • Capacidad de resumen de voz, alcanzando niveles de rendimiento comparables a GPT-4o.

A pesar de su rendimiento sobresaliente, Microsoft reconoce que todavía hay margen de mejora en respuesta a preguntas, en comparación con modelos como Gemini-2.0-Flash.

Phi-4-mini: Modelo compacto y eficiente para tareas basadas en texto

El Phi-4-mini es un modelo más liviano, con 3.800 millones de parámetros, diseñado para ofrecer alta velocidad y eficiencia en tareas de texto.

🔹 Características clave:

  • Capacidad de responder consultas agrupadas, con un vocabulario de 200.000 palabras.
  • Optimizado para tareas de texto, superando a modelos más grandes en razonamiento, matemáticas, seguimiento de instrucciones y codificación.
  • Soporta secuencias de hasta 128.000 tokens, garantizando alta precisión y escalabilidad en aplicaciones avanzadas de IA.
  • Integración en interfaces de programación estructuradas, facilitando su implementación en diversas plataformas.

Disponibilidad y acceso

Microsoft ha confirmado que ambos modelos ya están disponibles en Azure AI Foundry, Hugging Face y Nvidia API Catalog, ofreciendo a los desarrolladores una experiencia multimodal completa para potenciar sus proyectos de IA.

Inserta este artículo con este código HTML:

<a href="https://www.redimin.cl/microsoft-phi-4-multimodal-mini-inteligencia-artificial/">Microsoft lanza Phi-4-multimodal y Phi-4-mini: IA avanzada para desarrolladores</a>

Lectura relacionada
Juan Ricardo Ramos es asesor para diferentes rubros desde hace más de 15 años. Sin embargo, en el último tiempo, parte de su trabajo se ha enfocado en los trabajadores mineros de nuestro país.

¡Descubre la última edición de REDIMIN!

Explora los temas más recientes en minería y tecnología en nuestra nueva edición. Haz clic en el enlace para leerla ahora.

Leer la Última Edición

¿Quieres que tu empresa tenga presencia en REDIMIN?

En REDIMIN, conectamos a tu marca con una audiencia especializada en el sector minero y contamos con más de 1 millón de usuarios activos al mes. Genera oportunidades para destacar tu empresa en un mercado clave y aprovecha nuestro alcance para maximizar tu visibilidad.

Ver Opciones de Publicidad
Compartir este Artículo
Salir de la versión móvil