OhMyCalc

推論レイテンシ計算機

コンピューティング依存性およびメモリ依存性のコンポーネントを分析することにより、ML モデルの推論レイテンシーを推定します。

推論レイテンシ計算ツールの使用方法

  1. モデル サイズを数百万のパラメーターで入力します。
  2. バッチ サイズとシーケンスの長さを設定します。
  3. GPU TFLOPS とメモリ帯域幅を指定します。
  4. レイテンシ分析の [計算] をクリックします。

使用例

計算式

レイテンシ = 最大(コンピューティング、メモリ);

よくある質問

この計算機はどれくらい正確ですか?
結果は業界の標準的な計算式に基づいており、予備的な見積もりに適しています。
どのような単位が使用されますか?
特に指定のない限り、標準の IT 単位 (リクエスト/秒、ミリ秒、%、USD) が使用されます。
無料ですか?
はい、すべての電卓は完全に無料です。