モデルサイズカリキュレーター

パラメーターの数と数値精度に基づいて、機械学習モデルのメモリフットプリントを計算します。

パラメータ (百万)

精度

モデルサイズ計算ツールの使用方法

モデルサイズ (MB) = パラメーター × bytes_per_param / 1,048,576。

FP16 対 INT8 とは何ですか?

FP16 はパラメーターごとに 2 バイトを使用します (半精度)。

推論メモリがモデルサイズより大きいのはなぜですか?

フォワードパス中のアクティベーションテンソルには追加のメモリが必要で、通常は 30 ～ 50% のオーバーヘッドが必要です。

GPT-2 にはパラメーターがいくつありますか?

GPT-2 ラージには 7 億 7,400 万個のパラメーターがあり、FP16 では約 1.5 GB が必要です。