Китай выпускает новую ИИ-модель, которая лучше #DeepSeek и GPT-4.5
Hunyuan-T1 — это новая ИИ-модель от Tencent, она основана на архитектуре Hunyuan TurboS и разработана с акцентом на скорость, точность и эффективность. https://t.me/alwebbci/3127
У этой модели:
1. Гибридная архитектура Mamba-Transformer MoE.
Hunyuan-T1 — первая модель такого масштаба, использующая комбинацию Mamba и Transformer в рамках подхода Mixture of Experts (MoE).
2. Сильная логика и лаконичность. Модель способна точно следовать сложным инструкциям и выдавать четкие, логически выверенные ответы. Это делает её отличным инструментом для задач, где важна структура и ясность.
3. Минимальные галлюцинации.
4. Высокая скорость. Первое слово появляется менее чем за секунду, а скорость генерации текста достигает 60–80 токенов в секунду. Это отличный показатель для модели, работающей с такими сложными задачами.
Превосходство:
- Над DeepSeek: Hunyuan-T1 быстрее (60–80 токенов/с против "медленного" R1), возможно, лучше в лаконичности и обработке длинных текстов. DeepSeek выигрывает в открытости и цене.
- Над GPT-4.5: Hunyuan-T1 может опережать в скорости, логике и стоимости, а также в обработке сверхдлинных контекстов. GPT-4.5, вероятно, лучше в естественности общения и эмоциональном интеллекте.
Также команда выпустила исследование Insight-V, которое является шагом к тому, чтобы мультимодальные модели могли не просто видеть и говорить, а логически рассуждать на основе визуальных данных, как это делает человек.
Это одна из первых попыток создать систему, вдохновленную подходом OpenAI o1, но с акцентом на обработку визуальной информации в сочетании с текстовыми данными.
Code.
_______
Источник | #blockchainRF
@F_S_C_P
Комментариев нет:
Отправить комментарий