Калькулятор размера модели

Рассчитайте объём памяти ML-модели по количеству параметров и числовой точности. Планируйте требования к памяти GPU для вывода.

Параметры (миллионы)

Точность

Как использовать калькулятор размера модели

Размер модели (МБ) = Параметры × байт/параметр / 1 048 576. Память для вывода ≈ размер × 1,5.

Что такое FP16 и INT8?

FP16 использует 2 байта на параметр (полуточность); INT8 — 1 байт (квантование). Оба меньше FP32 (4 байта).

Почему память для вывода больше размера модели?

Тензоры активаций при прямом проходе требуют дополнительной памяти — обычно 30–50% накладных расходов.

Сколько параметров у GPT-2?

GPT-2 Large имеет 774 млн параметров, требуя около 1,5 ГБ в FP16.