OhMyCalc

Calculadora de latencia de inferencia

Estime la latencia de inferencia para modelos de aprendizaje automático mediante el análisis de componentes vinculados a la computación y a la memoria.

Cómo utilizar la calculadora de latencia de inferencia

  1. Ingrese el tamaño del modelo en millones de parámetros.
  2. Establecer el tamaño del lote y la longitud de la secuencia.
  3. Especifique TFLOPS de GPU y ancho de banda de memoria.
  4. Haga clic en Calcular para realizar un análisis de latencia.

Casos de Uso

Fórmula

Latencia = max(Computación, Memoria);

Preguntas Frecuentes

¿Qué precisión tiene esta calculadora?
Los resultados se basan en fórmulas estándar de la industria y son adecuados para estimaciones preliminares.
¿Qué unidades se utilizan?
Se utilizan unidades de TI estándar (solicitudes/seg, ms, %, USD) a menos que se indique lo contrario.
¿Es gratis?
Sí, todas las calculadoras son completamente gratuitas.