OhMyCalc

Calculateur de latence d'inférence

Estimez la latence d'inférence pour les modèles ML en analysant les composants liés au calcul et à la mémoire.

Comment utiliser le calculateur de latence d'inférence

  1. Entrez la taille du modèle en millions de paramètres.
  2. Définissez la taille du lot et la longueur de la séquence.
  3. Spécifiez les TFLOPS du GPU et la bande passante mémoire.
  4. Cliquez sur Calculer pour une analyse de latence.

Cas d'utilisation

Formule

Latence = max (calcul, mémoire) ;

Questions fréquemment posées

Quelle est la précision de cette calculatrice ?
Les résultats sont basés sur des formules standard de l'industrie et conviennent aux estimations préliminaires.
Quelles unités sont utilisées ?
Les unités informatiques standard (requêtes/sec, ms, %, USD) sont utilisées, sauf indication contraire.
Est-ce gratuit ?
Oui, toutes les calculatrices sont entièrement gratuites.