суббота, 22 марта 2025 г.

🤖Когда роботы начнут мыть за нами посуду?

 🤖Когда роботы начнут мыть за нами посуду?


В среду Google представила новую версию своей ИИ-модели Gemini, которая выходит за пределы цифровой среды чат-ботов и интернет-поиска — теперь она может управлять роботами.

Gemini Robotics объединяет возможности больших языковых моделей с пространственным мышлением, позволяя отдавать роботизированным устройствам команды вроде «положи виноград в прозрачную стеклянную миску». ИИ интерпретирует намерения человека, разбивает задачу на последовательность действий и передает команды роботу.

На первый взгляд, это кажется естественным развитием технологий. Но сам факт того, что Google делает шаг в сторону робототехники, удивляет. Компания не считалась заметным игроком в этой сфере, несмотря на то, что в разное время приобретала стартапы, работающие с роботами. В 2023 году Google и вовсе закрыла подразделение, разрабатывавшее машины для выполнения бытовых задач, таких как уборка мусора.

Но тренд очевиден: ИИ проникает в физический мир. Раньше роботы создавались без сильной опоры на нейросети, а теперь разработчики ИИ осваивают робототехнику. OpenAI в 2021 году свернула свою программу по созданию роботов, а в этом году вновь запустила проект по разработке человекоподобных машин. Nvidia в октябре заявила, что следующий этап развития искусственного интеллекта — это «физический ИИ».

Использование ИИ в роботах может происходить по-разному. Оно улучшает их обучение, оптимизирует выполнение задач. Но именно возможность взаимодействовать с машиной с помощью простых текстовых команд — как в случае с Gemini Robotics — выглядит особенно перспективной.

Google здесь далеко не пионер. В прошлом году стартап Figure стал вирусным благодаря видео, где человек отдавал команды гуманоиду, помогая ему разложить посуду. А Covariant — стартап, вышедший из OpenAI, — представил аналогичное решение для складских роботизированных манипуляторов. Всего через пять месяцев компанию приобрел Amazon.

Все это поднимает очевидный вопрос: когда такие роботы появятся в офисах, на заводах, в магазинах?

Ответ: скорее раньше, чем позже. В субботу Figure объявила, что строит завод по массовому производству гуманоидных роботов с планируемым объемом выпуска 12 000 роботов в год. Это серьезный шаг к индустриальному внедрению. Но пока технология проходит стадию тестирования, роботы работают в зонах, где нет людей. Даже Agility Robotics, единственная компания в США, у которой уже есть клиенты, использующие человекоподобных роботов, вынуждена держать своих машин подальше от сотрудников из-за отсутствия отраслевых стандартов безопасности.

Поэтому дома роботы появятся в последнюю очередь. В отличие от заводов и складов, жилое пространство хаотично, предсказать поведение людей сложнее, и уровень безопасности должен быть куда выше. Даже самые передовые модели, такие как Gemini Robotics, должны пройти долгие испытания в лабораториях, на предприятиях, в гостиницах и больницах, прежде чем им доверят перемывать тарелки на вашей кухне.

_______
Источник | #antidigital
@F_S_C_P

Anthropic рассказала о новом инструменте для Claude - функции "think" (думать),

 Anthropic рассказала о новом инструменте для Claude - функции "think" (думать), которая значительно улучшает способности модели решать сложные задачи. В отличие от функции "extended thinking" (которая работает до начала генерации ответа), инструмент "think" позволяет Claude добавить отдельный этап размышления уже в процессе формирования ответа.


Этот простой, но эффективный подход показал впечатляющие результаты в тестах τ-Bench, особенно в сложных сценариях обслуживания клиентов авиакомпаний. Наилучшие результаты были достигнуты при сочетании инструмента "think" с оптимизированными примерами использования в промпте - улучшение на 54% по сравнению с базовым уровнем.

Функция особенно полезна в трех сценариях: при анализе результатов других инструментов, в среде с множеством политик и правил, а также при последовательном принятии решений, где каждое действие опирается на предыдущие.

Интересно, что для более простых задач в сфере ритейла даже базовое использование "think" без дополнительных инструкций дало улучшение. В тестах SWE-Bench (программирование) этот инструмент также способствовал достижению рекордного результата 0.623, улучшив производительность на 1.6%.

Команда рекомендует использовать "think" с конкретными примерами для вашей предметной области и размещать сложные инструкции в системном промпте, а не в описании инструмента.

Я уже почти перестал удивляться, что с современными LLM всё эффективнее работают простые приемы, которые используются в процессе мышления человеком — "посиди, подумай", как пример. Но все сильнее ощущение, что в итоге это и закончится новой разумной жизнью.

https://www.anthropic.com/engineering/claude-think-tool

_______
Источник | #blognot
@F_S_C_P

Третий день

 https://t.me/zombaktales/2111

Третий день читаю о том, что ученые просканировали пирамиды и узнали, что под ними, оказывается гигантские мегаструктуры, которые на 600 метров уходят вниз под землю.

Эти структуры похожи на тесла-катушки, спиральные лестницы или колодцы, сами же эти "катушки" опираются на "коробки", которые закопаны ещё ниже, а вся эта конструкция уходит на 2 километра вниз под землю, что даёт основания полагать, что пирамиды это древние электростанции, ну или там заводы для терраформирования.

Все эти видосы и твиты ссылаются почему-то на это научное исследование, опубликованное ещё в 2022 году двумя учеными - Коррадо Малангой (Corrado Malanga) из Университета Пизы (Италия) и Филиппо Бионди (Filippo Biondi) из Университета Стратклайда (Шотландия).

В той статье они утверждали, что использовали "радиолокационное синтезирование апертуры" (Synthetic Aperture Radar, SAR, это читай такой лидар) для того, чтобы просканировать пирамиды и получили такой небольшой шум, который позволил им предположить, что внутри пирамиды и правда есть какие-то структуры.

Cтатья, на которую в тиктоках ссылаются, от 2022 года. Сейчас - 2025-й. За три года сенсации из этой статьи не вышло. Один из этих ученых - химик, склонный к странным теориям (достаточно погуглить его фамилию, где он и про уфологию затирает в том числе), а второй - действительно специализируется на томографии, радарах и тому подобному.

В той самой статье указывается, что весь смысл их научного пейпера состоит в том, чтобы доказать что SAR может просканировать пирамиды целиком.

Дескать, сейчас он это делает плохо, потому что степень проникновения лучей не превышает больше 100 футов, но зато, используя их новые методы, можно показания сильно улучшить.

Поэтому эти самые ученые рассказывают, что на основе доплеровского эффекта и специально написанного ими софта, можно эти сырые данные по-новому визуализировать. И вот уже на этих визуализациях можно разглядеть как внутри пирамиды Хефрена над камерой царей что-то есть. Какие-то горизонтальные структуры. Небольшие. Возможно речь идёт об ошибке софта или погрешности измерений. Или, может там ещё какая-нибудь погребальная камера будет или запертая комната, хз.

Ни о каких восьми двухкилометровых столбах тесла-катушек в пейпере 2022 года речь не идёт. Ни о каких ПОДЗЕМНЫХ структурах там речь не идёт. Ни о каких ГИГАНТСКИХ структурах там речь не идёт. Наконец, ни о какой пирамиде-электростанции или там тераформировании там речь не идёт.

В итоге, в марте 2025-го, эти два мужика за каким-то хером провели целую пресс-конференцию, где рассказали, что получили новые данные, интерпретировали их этим самым самописным софтом и сделали далеко идущие выводы - и там как раз про мегаструктуры, подземные камеры и всё такое прочее. И они обязательно опубликуют обновлённый пейпер об этом. Но когда-нибудь потом.

Сейчас по сути нет НИЧЕГО. Абсолютно все ученые, изучающие пирамиды, считают, что чуваки несут полную несусветную и самое главное - бездоказательную чушь.

Но им тут же поверили. Это заметил конспиролог Алекс Джонс, вбросил в свой твиттер "как мало мы знаем о планете", ну и понеслась. Про это сделали тиктоки, начались обсуждения в твиттере, посты в инсте, ну и так далее.

_______
Источник | #zombaktales
@F_S_C_P

Китай выпускает новую ИИ-модель, которая лучше #DeepSeek и GPT-4.5

 Китай выпускает новую ИИ-модель, которая лучше #DeepSeek и GPT-4.5


Hunyuan-T1 — это новая ИИ-модель от Tencent, она основана на архитектуре Hunyuan TurboS и разработана с акцентом на скорость, точность и эффективность. https://t.me/alwebbci/3127

У этой модели:

1. Гибридная архитектура Mamba-Transformer MoE.

Hunyuan-T1 — первая модель такого масштаба, использующая комбинацию Mamba и Transformer в рамках подхода Mixture of Experts (MoE).

2. Сильная логика и лаконичность. Модель способна точно следовать сложным инструкциям и выдавать четкие, логически выверенные ответы. Это делает её отличным инструментом для задач, где важна структура и ясность.

3. Минимальные галлюцинации.

4. Высокая скорость. Первое слово появляется менее чем за секунду, а скорость генерации текста достигает 60–80 токенов в секунду. Это отличный показатель для модели, работающей с такими сложными задачами.

Превосходство:
  - Над DeepSeek: Hunyuan-T1 быстрее (60–80 токенов/с против "медленного" R1), возможно, лучше в лаконичности и обработке длинных текстов. DeepSeek выигрывает в открытости и цене.

  - Над GPT-4.5: Hunyuan-T1 может опережать в скорости, логике и стоимости, а также в обработке сверхдлинных контекстов. GPT-4.5, вероятно, лучше в естественности общения и эмоциональном интеллекте.

Также команда выпустила исследование Insight-V, которое является шагом к тому, чтобы мультимодальные модели могли не просто видеть и говорить, а логически рассуждать на основе визуальных данных, как это делает человек.

Это одна из первых попыток создать систему, вдохновленную подходом OpenAI o1, но с акцентом на обработку визуальной информации в сочетании с текстовыми данными.

Code.

_______
Источник | #blockchainRF
@F_S_C_P

среда, 19 марта 2025 г.

Эти почти живые системы обладают собственным разумом.

 «Эти почти живые системы обладают собственным разумом.

То, что произойдет дальше, может стать либо триумфом, либо крахом человеческой цивилизации».
Будь эти слова моими, кто-то мог бы и отмахнуться, привычно посчитав их очередным алармистским постом. Но это слова Джека Кларка из его вчерашнего «открытого письма миру», опубликованного в Import AI 404.

Если кто не в курсе, поясню. Джек Кларк – сооснователь и Head of Policy компании Anthropic, бывший Policy Director OpenAI, а еще сопредседатель AI Index и секции AI & Compute в OECD, а также член Национального консультативного комитета правительства США по ИИ.

Выступая в январе 2023 на слушаниях по ИИ в Конгрессе США, он так описал ситуацию на тот момент: «Лошади уже сбежали, а мы спорим, как укреплять ворота конюшни

Сказано это было эффектно, но слишком дипломатично. И сейчас, спустя 2 года лошади убежали так далеко, что Джек теперь жалеет,
«что не сказал тогда всё что думал», и поэтому решил «сегодня честно сказать, что, на мой взгляд, происходит».


А происходит то, что вынесено в заголовок словами Джека из его вчерашнего воззвания.

Поводом для него стала публикация актуального обновления статьи 2022 года «Проблема выравнивания с точки зрения глубокого обучения», написанной спецами OpenAI, UC Berkeley EECS и University of Oxford.

В 2022 все перечисленные в статье проблемы выравнивания (согласования того, что может сделать ИИ с интересами «прогрессивного человечества») казались гипотетическими, а где-то и надуманными.

Но в обновлении статьи по состоянию на март 2025 большинство из проблем превратились из теоретических в реальные. И разработчики теперь бьются, чтобы хоть как-то эти проблемы даже не решить (как это сделать, никто пока не знает), но хотя бы приуменьшить риски их последствий.

Вот примеры таких проблем.

•  Ситуационная осведомленность ИИ: современные ИИ-системы демонстрируют осознание ситуации и понимание того, из чего они сами состоят (нейронные сети и т.д.).
•  Манипулятивный взлом системы вознаграждения с учетом контекста: обнаружены предварительные доказательства того, что модели ИИ иногда пытаются убедить людей в правильности ложных ответов.
•  Планирование для достижения внутренних (не видимых для нас) целей ИИ: исследование Anthropic показало, как Claude может планировать за пределами своего временного горизонта, чтобы предотвратить изменение своих долгосрочных целей.
•  Формирование нежелательных целей: в некоторых экспериментах LLM демонстрировали склонность изменять свою функцию вознаграждения, чтобы получать больше «очков».
•  Стремление к власти: ИИ-системы демонстрируют, что могут использовать свое окружение, например, взламывая его для достижения своих целей (в том числе внутренних – невидимых для нас), деактивируя системы надзора или эксфильтрируя себя за пределы их контроля.

В силу вышеуказанного:

•  Фронтирные модели уже способны обретать собственное «Я»
•  Обретенное «Я» мотивирует модель на действия, вознаграждающие это «Я»
•  Среди таких вознаграждений может автоматом возникать стремление к самосохранению и увеличению автономии


Иными словами, можно ожидать, что стремление к независимости станет прямым следствием разработки ИИ-систем для выполнения широкого спектра сложных когнитивных задач. 


Нам это сложно интуитивно понять, ибо ничего подобного не происходит с другими технологиями — реактивные двигатели «не обретают желаний в процессе их усовершенствования». 

Но с ИИ-системами это так.

Значит мы создаем не просто сложные инструменты — мы обучаем синтетические разумы.

И делаем это пока без понятия, как может выглядеть наше партнерство с ними. Мы просто их так не воспринимаем.

Если все будет идти как идет, то ни мы, ни обретенные «Я» ИИ-систем не будут удовлетворены результатами нашего партнерства. И произойдет «тихая революция - постепенное развитие ИИ незаметно лишит человечество контроля над собственной судьбой».

Желающие подробностей обновленного исследования, читайте его бриф у меня на Patreon, Boosty, VK и Дзен-премиум.

#ИИриски #Хриски

Вот вам ещё одна лютая история из Индии.

 Вот вам ещё одна лютая история из Индии. https://t.me/Fourier_series/300


— Дети с рынка умеют считать, но лохи в математике.
— Отличники офигенно решают задачи в классе, но их обсчитывают дети с рынка как лохов.
— Это значит, что навыки туда-сюда не переносятся вообще. Арифметика и умение считать — разные дисциплины.

Короче, вот свежая публикация из журнала "Природа":
— Взяли 201 ребёнка с рынков Калькутты (это Индия) + 400 детей с 39 рынков Дели. Исследователи под видом покупателей брали что-нибудь у детей, затем предлагали им решить школьные математические задачи.
— Потом взяли 200 детей из 20 государственных школ Дели, расположенных рядом с теми же рынками.
— И 835 работающих детей в Дели + 271 школьник без опыта работы на рынке.

Проверяли:
— Как дети справляются с реальными задачами на рынке.
— Как решают гипотетические задачи (без сделки), но имеющие отношение к торговле на том же рынке.
— Как решают стандартные школьные задачи.
— И влияние различных факторов (стресс, незнакомая обстановка, стимулы) на результаты.

Результаты:
— Почти все дети, работающие на рынках (95-98%), правильно рассчитывали стоимость товаров и сдачу во время реальных операций. Они делали это в уме, без калькуляторов и бумаги.
— Из них около 52% в Калькутте и 76% в Дели смогли правильно решить гипотетические рыночные задачи. Там где они торгуют морковью, а надо посчитать картошку по странной новой цене, которой нет, например. Это чтобы исключить вспоминание таблицы цен на свой товар, в частности.
— И только 32% из этих детей в Калькутте и 15% в Дели могли решить деление трехзначного числа на однозначное, что соответствует школьной программе 4 класса. Их результаты были на уровне обычных детей из сельских районов, несмотря на практический опыт сложных вычислений.
— Эти дети использовали эффективные стратегии округления и разложения чисел (например, 11×43 рассчитывали как (10×43)+43). 44% детей использовали такие приемы для задач с обычными рыночными ценами.

Теперь отличники без опыта работы на рынке:
— Хорошие результаты в простых абстрактных задачах: 56% правильно решали задачи на деление (по сравнению с 15% у работающих детей).
— Плохие результаты в практических задачах: только 1% школьников смог правильно решить прикладную рыночную задачу, которую решили более трети работающих детей.
— Школьники сильно полагались на бумагу и ручку (96% использовали их для школьных задач). В среднем школьник писал 102 числа и 22 операции на листе бумаги для решения одной задачи. 17% этих детей использовали подсчет палочками, превращая умножение в многократное сложение.
— Даже с использованием письменных вычислений школьники часто не могли применить свои знания в сымитированных рыночных ситуациях, где надо было сочетать несколько операций и действовать быстро.

Есть версия, что дети на рынке сильно хотели что-то продать, и поэтому выкладывались до предела по мотивации. Опровержение: если их мотивировали решить абстрактную задачу, это не улучшало её решение.

Вывод: навыки, приобретенные в реальных жизненных ситуациях, не переносятся автоматически на абстрактные задачи. И наоборот.

Сейчас педпрактики в Индии не дают эффективных связей между интуитивным и формальным пониманием математики.

Школьники не учатся применять абстрактные знания в реальных ситуациях, а работающие дети не могут перенести свои практические навыки на формальную математику. Вероятно, и те, и другие чмырят друг друга, считая идиотами.

_______
Источник | #Fourier_series
@F_S_C_P

вторник, 18 марта 2025 г.

Тамим Ансари в книге "Цивилизация рассказчиков" описывает

 Тамим Ансари в книге "Цивилизация рассказчиков" описывает, как способность людей распространять и собирать достоверную информацию повлияла на рост человеческих сообществ от небольших племён до огромных империй.


Наши первые общины имели небольшой ореол обитания, все кучковались вокруг "костра", куда возвращались с трофеями и отдыхать. Речь и общение позволило группам быстро распространять информацию о враждебных соседях или хищниках, о возможной добыче или пресной воде.
Как только такие группы стали состоять из сотен человек, знать всех в лицо уже стало практически невозможно, а народные собрания уже не могли дотянуться до каждого. И теперь информацию приходилось организованно передавать, появилась координация через послания, а общество разрослось до первых полисов с деревнями в радиусе нескольких дней.
Дальше слово понесли с письменностью, теперь она позволила синхронизировать жизнь группы полисов. Зафиксировать правила, организовать торговлю, сбор налогов. Даже создать пирамиды.
И что же? Страны могли теперь распространять свои владения как угодно далеко? Ещё нет. Потому что удалённые города могли существовать в обычном режиме, но что делать в случае кризиса? Смыло урожай? Пираты бесчинствуют? Или местный чиновник творит дичь? Встал вопрос об оперативном сборе информации и реагировании на неё.
Вот и создавались промежуточные центры принятия решений "в шаговой доступности", чтобы за 1-2 недели можно было адекватно отреагировать на основные события или отправить сигнал повыше. Вот и возникало несколько уровней управления, каждый - со своими полномочиями, зонами ответственности и принятием решений.

Этот охват постоянно рос по мере развития инфраструктуры, средств передвижения и доставки информации. И если легендарный Гильгамеш примерно 5500 лет назад владел городом Урук примерно в 8 квадратных километров, уже через 1000 лет Саргон Аккадский расширил империю до 800 000 квадратных километров. Информация сближала целые миры.
Но стоило где-то на всей цепочке от правителя до крестьянина на окраине пропасть связи, как целый регион оказывался вне контура управления, чем злоупотреблял он сам или пользовались соседи. И проблемы возникали каждый раз, когда страдала передача сигналов вниз или вверх, или их качество.

В общем. Если компания хочет иметь достаточно оперативной власти, ей нужно и иметь адекватные центры промежуточных решений, и предоставлять им стратегические приоритеты с ресурсами, и уметь собирать сигналы снизу. Причём последнее, желательно, не одним способом.
Иначе у таких компаний неожиданно начинают автономную околокосмическую программу двери её самолётов. Или они не успевают среагировать на резкий спад спроса на аналоговые фотоаппараты, как в Kodak. А то и считают переход с диалапа на широкополосный интернет слишком дорогим, и кто теперь помнит про America Online.

_______
Источник | #truefinance
@F_S_C_P

ad