Calculadora de tamanho do modelo
Calcule o consumo de memória de um modelo de aprendizado de máquina com base no número de parâmetros e na precisão numérica.
Como usar a calculadora de tamanho do modelo
- Insira o número de parâmetros do modelo em milhões.
- Selecione a precisão numérica (FP32, FP16 ou INT8).
- Clique em Calcular para obter o tamanho do modelo e a memória de inferência.
Casos de Uso
- •Planejando requisitos de GPU para implantação de modelo.
- •Comparando tamanhos de modelos antes de comprar hardware.
- •Avaliando os benefícios da quantização para implantação de borda.
- •Estimativa de custos para serviço de modelo baseado em nuvem.
Fórmula
Tamanho do modelo (MB) = Parâmetros × bytes_per_param / 1.048.576.
Perguntas Frequentes
O que é FP16 versus INT8?
FP16 usa 2 bytes por parâmetro (meia precisão);
Por que a memória de inferência é maior que o tamanho do modelo?
Os tensores de ativação durante a passagem direta requerem memória adicional, normalmente 30–50% de sobrecarga.
Quantos parâmetros o GPT-2 possui?
GPT-2 grande tem 774 milhões de parâmetros, exigindo cerca de 1,5 GB no FP16.