Google presenta TurboQuant para comprimir la memoria de IA y sacude a las acciones del sector

Google Research presentó TurboQuant, un sistema de compresión orientado a modelos de inteligencia artificial y motores de búsqueda vectorial que apunta a reducir de forma drástica el uso de memoria en tareas de inferencia. Tras el anuncio, acciones ligadas a memorias y almacenamiento operaron con caídas, aunque no de forma uniforme ni generalizada en 8%.

Qué hace TurboQuant y por qué apunta a la caché de los modelos

En una publicación oficial de Google Research, la firma explicó que TurboQuant es un conjunto de algoritmos de cuantización diseñado para comprimir vectores de alta dimensión, una pieza central en el funcionamiento de grandes modelos de lenguaje y sistemas de búsqueda. La compañía afirmó que la tecnología busca aliviar el cuello de botella de la key-value cache, la memoria de alta velocidad que estos sistemas usan para conservar información reciente y responder con mayor rapidez.

Google detalló que el método se apoya en dos componentes: PolarQuant, encargado de la compresión principal de los vectores, y QJL o Quantized Johnson-Lindenstrauss, que corrige el residuo de cuantización con una capa adicional de muy bajo costo. En el paper técnico del proyecto, firmado por Amir Zandieh, Majid Daliri, Majid Hadian y Vahab Mirrokni, los autores sostienen que en pruebas de cuantización de caché KV lograron neutralidad de calidad con 3,5 bits por canal y degradación marginal con 2,5 bits por canal.

Te puede interesar

La reacción del mercado golpea a firmas de memoria, pero no valida una caída plana de 8%

El movimiento tuvo eco inmediato en bolsa porque una mejora de eficiencia de este tipo podría reducir la presión sobre la memoria requerida por cargas de IA de contexto largo. Sin embargo, los antecedentes públicos disponibles no respaldan la idea de una caída homogénea de 8% para “empresas de RAM”. De acuerdo con un reporte de MarketWatch, Micron retrocedía 3,3% este miércoles, SanDisk 3,2%, mientras Seagate y Western Digital bajaban cerca de 1%.

La misma cobertura advirtió además que el retroceso no puede atribuirse solo a TurboQuant, ya que el mercado también venía evaluando la sostenibilidad de los precios de memoria y los planes de expansión de capacidad en la industria. Bajo ese cuadro, el anuncio de Google sí abrió un nuevo frente de preocupación para los inversionistas, pero la reacción observada hasta ahora se concentra en descensos relevantes aunque dispares entre compañías expuestas al negocio de memoria y almacenamiento.

ETIQUETADO:
Compartir este artículo
Salir de la versión móvil