OpenAI выпустила свою первую открытую модель за 5 лет
OpenAI представила gpt-oss, свою первую модель с открытыми весами с момента выпуска GPT-2 в 2019 году.
Релиз включает 2 версии: gpt-oss-120b (120 млрд параметров) и gpt-oss-20b (20 млрд параметров).
Причем, модель со 120млрд помещается на 1 видеокарту NVIDIA H100 при квантизации mxfp4. Это круто, так как обычно модели такого размера требуют несколько мощных GPU.
Архитектура у модели - Mixture of Experts с 128 экспертами. Это
модель рассуждений, сопоставимая по возможностям с o4-mini.
Поддерживает локальный запуск на ноутбуке.
В медицинских задачах gpt-oss-120b показывает результаты, близкие к o3.
Затраты на обучение:
-2.1 млн часов H100 (~$2 млн)
- Обучена с нуля, а не адаптирована из существующих моделей
Cdn.
_______
Источник | #blockchainRF
@F_S_C_P
Комментариев нет:
Отправить комментарий