Xiaomi sorprende al sector IA: su nuevo modelo supera los 1.000 tokens por segundo usando GPUs convencionales
Xiaomi presentó una nueva versión de su modelo MiMo, capaz de generar más de 1.000 tokens por segundo utilizando hardware estándar basado en GPUs. El avance desafía algunas de las principales tesis detrás de empresas especializadas en aceleración de IA y podría ampliar significativamente el acceso a inferencia de alta velocidad para desarrolladores y empresas.