суббота, 22 марта 2025 г.

Китай выпускает новую ИИ-модель, которая лучше #DeepSeek и GPT-4.5

 Китай выпускает новую ИИ-модель, которая лучше #DeepSeek и GPT-4.5


Hunyuan-T1 — это новая ИИ-модель от Tencent, она основана на архитектуре Hunyuan TurboS и разработана с акцентом на скорость, точность и эффективность. https://t.me/alwebbci/3127

У этой модели:

1. Гибридная архитектура Mamba-Transformer MoE.

Hunyuan-T1 — первая модель такого масштаба, использующая комбинацию Mamba и Transformer в рамках подхода Mixture of Experts (MoE).

2. Сильная логика и лаконичность. Модель способна точно следовать сложным инструкциям и выдавать четкие, логически выверенные ответы. Это делает её отличным инструментом для задач, где важна структура и ясность.

3. Минимальные галлюцинации.

4. Высокая скорость. Первое слово появляется менее чем за секунду, а скорость генерации текста достигает 60–80 токенов в секунду. Это отличный показатель для модели, работающей с такими сложными задачами.

Превосходство:
  - Над DeepSeek: Hunyuan-T1 быстрее (60–80 токенов/с против "медленного" R1), возможно, лучше в лаконичности и обработке длинных текстов. DeepSeek выигрывает в открытости и цене.

  - Над GPT-4.5: Hunyuan-T1 может опережать в скорости, логике и стоимости, а также в обработке сверхдлинных контекстов. GPT-4.5, вероятно, лучше в естественности общения и эмоциональном интеллекте.

Также команда выпустила исследование Insight-V, которое является шагом к тому, чтобы мультимодальные модели могли не просто видеть и говорить, а логически рассуждать на основе визуальных данных, как это делает человек.

Это одна из первых попыток создать систему, вдохновленную подходом OpenAI o1, но с акцентом на обработку визуальной информации в сочетании с текстовыми данными.

Code.

_______
Источник | #blockchainRF
@F_S_C_P

Комментариев нет:

ad