Calculadora de tamanho do modelo

Calcule o consumo de memória de um modelo de aprendizado de máquina com base no número de parâmetros e na precisão numérica.

Parâmetros (milhões)

Precisão

Como usar a calculadora de tamanho do modelo

Tamanho do modelo (MB) = Parâmetros × bytes_per_param / 1.048.576.

O que é FP16 versus INT8?

FP16 usa 2 bytes por parâmetro (meia precisão);

Por que a memória de inferência é maior que o tamanho do modelo?

Os tensores de ativação durante a passagem direta requerem memória adicional, normalmente 30–50% de sobrecarga.

Quantos parâmetros o GPT-2 possui?

GPT-2 grande tem 774 milhões de parâmetros, exigindo cerca de 1,5 GB no FP16.