среда, 6 августа 2025 г.

OpenAI выпустила свою первую открытую модель за 5 лет

 OpenAI выпустила свою первую открытую модель за 5 лет


OpenAI представила gpt-oss, свою первую модель с открытыми весами с момента выпуска GPT-2 в 2019 году.

Релиз включает 2 версии: gpt-oss-120b (120 млрд параметров) и gpt-oss-20b (20 млрд параметров).

Причем,  модель со 120млрд помещается на 1 видеокарту NVIDIA H100 при квантизации mxfp4. Это круто, так как обычно модели такого размера требуют несколько мощных GPU.

Архитектура у модели - Mixture of Experts с 128 экспертами. Это
модель рассуждений, сопоставимая по возможностям с o4-mini.

Поддерживает локальный запуск на ноутбуке.

В медицинских задачах gpt-oss-120b показывает результаты, близкие к o3.

Затраты на обучение:
-
2.1 млн часов H100 (~$2 млн)
- Обучена с нуля, а не адаптирована из существующих моделей

Cdn.

_______
Источник | #blockchainRF
@F_S_C_P

Комментариев нет:

Отправить комментарий