A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 402601 раз)

BlackMokona · « **Ответ #11100 :** 10 Авг 2025 [09:41:33] »

Цитата: Polnoch Ксю от 10 Авг 2025 [09:28:10]

Что там?

Обычное либертарианство. Свободный рынок, минимальное вмешательство государства, индивидуализм, свободная торговля, и тд и тп.

Olweg · « **Ответ #11101 :** 10 Авг 2025 [15:20:29] »

Цитата: Olweg от 07 Авг 2025 [22:06:56]

В общем, уже понятно, что вау-эффектов, как от GPT-4, теперь не будет. Тогда был эффект низкой базы. Сейчас уже пошло насыщение технологии, выход на полку S-кривой, когда 80% усилий выбирают оставшиеся 20% прироста. Ну, сейчас, может быть, 80% от потенциала ещё не достигли, но уже к этому идёт, перегиб S-кривой трансформерной архитектуры, наверное, пройден. Значит, ждём новых подходов, в том числе в железе - например, истинной нейроморфности.

Не у меня одного такие мысли:
https://ai-news.ru/2025/08/gpt_5_ot_openai_signaliziruet_o_zavershenii_krupnyh_proryvov_v_oblasti_ii.html
https://www.webpronews.com/openais-gpt-5-signals-end-of-major-ai-leaps-focus-on-refinements/

…несмотря на шумиху, всё больше экспертов сходятся во мнении, что эти достижения знаменуют конец революционных скачков в области ИИ и открывают эру постепенных улучшений. Влиятельный эксперт по ИИ Янник Килчер в недавнем видео на YouTube сравнил текущее состояние больших языковых моделей (БЯМ) с «эпохой Samsung Galaxy» в мире смартфонов, когда каждая новая модель предлагает лишь незначительные улучшения, например чуть более качественную камеру, а не революционные инновации.
…

Конец законам масштабирования?

В более широком смысле это означает, что фундаментальные исследования в области ИИ зашли в тупик. Килчер предполагает, что мы исчерпали возможности простого масштабирования вычислений и данных и что осталось, возможно, всего два-три порядка величины, которые не стоят вложенных средств. Вместо этого компании обращаются к «умным» методам, таким как формирование вознаграждения в RL, для улучшения моделей. Это напоминает ранние этапы машинного обучения, но в гораздо большем масштабе, где обучение стоит миллионы.

Ph_user · « **Ответ #11102 :** 10 Авг 2025 [15:29:55] »

Количество прорывов зависит от инвестиций. Если инвесторы начинают видеть отсутствие прибыли они заканчивают инвестировать и примерно все прорывающие работники уходят в другие места.

А хотели сделать робота чтобы он сам себя улучшал или хотя бы сохранял во времени.

Olweg · « **Ответ #11103 :** 10 Авг 2025 [15:58:00] »

Цитата: Ph_user от 10 Авг 2025 [15:29:55]

Количество прорывов зависит от инвестиций.

Тут циклическая связь. Количество инвестиций, в свою очередь, зависит от прорывов )

Естественно, речь пока только о трансформерной архитектуре, которая лежит в основе современных моделей. Да и то, не факт, что в ней самой ещё невозможны какие-то радикальные изменения. Просто парадигма масштабирования (больше данных, больше параметров при прочих равных) окончательно выходит на полку. Первые звоночки были ещё в прошлом году.

Metatron · « **Ответ #11104 :** 10 Авг 2025 [16:50:57] »

Рано судить о застое по результатам одной модели.
Посмотрим что получится у других. Тот же Грок-5 обещают в конце года, начале следующего.

У OpenAI был трудный год. Уход ведущих специалистов. Потом сманивание оставшихся Фейсбуком.

Mercury127 · « **Ответ #11105 :** 10 Авг 2025 [17:14:26] »

имхо, без выпуска модели в реальную жизнь, где она сможет обучаться на взаимодействии с окружающей средой, одновременно чувствуя оное взаимодействие собственной шкурой, дальнейшего прогресса не будет.

вот примерно как было заявление, что китайцы своего робота отправили в университет. вот надо так и делать, и не ради показухи. и лет через 10 можно будет сделать вывод, чему он может научиться.

но опять же, для этого придётся перейти психологический рубеж, отделяющий раба от гражданина, те определиться, хотим ли мы иметь гражданина-машину...

кроме того, нужно понимать, что результат взаимодействия с окружающей средой будет разный, в зависимости от пропорции гопарей и профессоров в среде.

по сути, единственным отличием такого гражданина-машины от гражданина-человека будет лёгкость копирования...

пока же, нмв, состояние моделей застряло на уровне пятилетнего ребёнка, в которого залили весь интернет.

Olweg · « **Ответ #11106 :** 10 Авг 2025 [17:41:35] »

Цитата: Metatron от 10 Авг 2025 [16:50:57]

Рано судить о застое по результатам одной модели.

Ну, застоем я бы пока это не назвал. Но пошло постепенное, медленное приращение. Grok 5, скорее всего, прорыва тоже не сделает, поскольку к тому моменту появятся уже модели, дышащие ему в затылок. Та же победительница мат.олимпиады от OpenAI, например - её тоже где-то к концу года обещают.

Polnoch Ксю · « **Ответ #11107 :** 10 Авг 2025 [19:16:36] »

Я тоже думаю, что LLM или почти на плато, или требуется радикальная инновация - вроде CoT. С другой стороны, мне кажется, другие архитектуры обязательно появятся. Именно поэтому, ИМХО, в этом году AGI ещё не будет, и скорее всего в следующем. А вот к 2030му вполне...

Сергей Н · « **Ответ #11108 :** 10 Авг 2025 [19:39:04] »

Для меня исчезновение опций DeepSearch и DeeperSearch в Grok 3 это такой недостаток, который перекрывает возможные плюсы от появления Grok 4.
Кто не знает это был по настоящему глубокий поиск, исследование, которое могло выполняться в офлайн режиме. Десятки минут в среднем. По результатам было видно, что проанализировано около сотни веб страниц.

Лимиты были вполне нормальные. 10 DeepSearch в сутки и 2 DeeperSearch. Кроме того есть x.com и grok.com если израсходовал лимит в одном, можно продолжить в другом, хотя и в новом чате. Да, еще была опция Think - 10 запросов каждые 2 часа, её тоже убрали.

Про обновление интерфейса в целом, есть намёки, что это может быть новая тенденция - вместо кнопок оно само решает сколько ресурсов затратить и каким способом. Может быть даже DeepSearch включится, но пока не получилось.

Сергей Н · « **Ответ #11109 :** 10 Авг 2025 [20:50:18] »

Погонял самодельные тесты сделанные по типу ARC-AGI.
Такой рейтинг
GPT-5 Think
Grok-4
DeepSeek-r1
Gemini 2.5 Pro

На самом деле всем плохо. Есть у них особенность видеть в такой последовательности паттерн, по которому они предсказывают следующий знак: + + + - - + +. Чаще плюс но могут и минус, а надо смотреть совсем на другие части задания, на четность чисел.

Grok больше всех склонен находить сложные закономерности которые справедливы но не то. DeepSeek слишком долго думает по одной задачке, 650 секунд потом прерывается и надо нажать кнопку продолжить.

Polnoch Ксю · « **Ответ #11110 :** 10 Авг 2025 [21:03:30] »

Цитата: Сергей Н от 10 Авг 2025 [19:39:04]

Кто не знает это был по настоящему глубокий поиск, исследование, которое могло выполняться в офлайн режиме. Десятки минут в среднем. По результатам было видно, что проанализировано около сотни веб страниц.

Так есть же у гугла и у ChatGPT - и у ChatGPT у первого появилось. И по моему субъективному ощущению, у грок оно было не очень. Почему они добавили Deeper search. Как чат-бот грок сильный, особенно четвёртый - я уже погоняла по кодинг задачкам в бесплатной версии. А вот дип ресёч всегда был какой-то недоделанный: грок постоянно галлюцинации туда пихал. Мне кажется, у OpenAI за дип ресёч отвечает какая-нибудь скрытая от юзеров o4-heavy (условное название. Может, кстати, прототип chat-gpt-5 базовой модели отвечал),поэтому результаты лучше.

Гугловский дип ресёч мне тоже показался хорошим. И он доступен для тех, у кого подписки нет.

Сергей Н · « **Ответ #11111 :** 10 Авг 2025 [21:39:43] »

Цитата: Polnoch Ксю от 10 Авг 2025 [21:03:30]

. А вот дип ресёч всегда был какой-то недоделанный: грок постоянно галлюцинации туда пихал. Мне кажется, у OpenAI за дип ресёч отвечает какая-нибудь скрытая от юзеров o4-heavy (условное название. Может, кстати, прототип chat-gpt-5 базовой модели отвечал),поэтому результаты лучше.

Вполне возможно Grok с глюками был, но у ChatGPT лимит 5 запросов в месяц. Гугловский разок пробовал. Теперь то можно их использовать, пока тоже не убрали.

Polnoch Ксю · « **Ответ #11112 :** 10 Авг 2025 [21:55:24] »

Цитата: Сергей Н от 10 Авг 2025 [21:39:43]

но у ChatGPT лимит 5 запросов в месяц.

На бесплатном? По-моему на бесплатном режиме там ещё и какие-то ограничения были (я слышала, если ничего не путаю) кажется, там какая-то более глупая модель используется. На плюс тарифе вот так:

10 full-fledged Deep Research queries per month, plus an additional 15 using a lightweight version - он автоматически переключается на более глупую базовую модель.

Но самая главная фишка ChatGPT, которую все пропустили, это автономный агент. Достаточно крутая штука - можно поручать машине сделать какие-то операции с помощью браузера. Оно даже действовать на разных сайтах под Вашими аккаунтами может. Я в тестовых целях сказала агенту поиграть в шахматы на chess.com. Агент, конечно, проиграл человеку (с рейтингом ~800) но нельзя сказать, что поражение было разгромным.
Только опасения насчёт прайвеси мешают мне включить ChatGPT агента в автоматизацию моей жизни - подключить к календарям, почте, итд.

Правда, я по прайвеси причинам побаиваюсь пускать альтмана в свои онлайн-аккаунты. Хочу попробовать сгородить свой собственный браузер-агент.

EmperioAf · « **Ответ #11113 :** 10 Авг 2025 [22:06:39] »

Цитата: Сергей Н от 10 Авг 2025 [20:50:18]

На самом деле всем плохо. Есть у них особенность видеть в такой последовательности паттерн, по которому они предсказывают следующий знак: + + + - - + +. Чаще плюс но могут и минус, а надо смотреть совсем на другие части задания, на четность чисел.

Какое то неоднозначное условие. Можно продолжить 3 минусами, и тогда получится одна симметрия: + + + - - + + - - -
А можно продолжить плюсом и двумя минусами, и тогда получится другая симметрия: + + + - - + + + - -

Сергей Н · « **Ответ #11114 :** 10 Авг 2025 [22:11:46] »

Цитата: Polnoch Ксю от 10 Авг 2025 [21:55:24]

На бесплатном? По-моему на бесплатном режиме там ещё и какие-то ограничения были

Да, моделька o4-mini. А сейчас везде GPT-5, по идее.

Сергей Н · « **Ответ #11115 :** 10 Авг 2025 [22:32:01] »

Цитата: EmperioAf от 10 Авг 2025 [22:06:39]

Какое то неоднозначное условие. Можно продолжить 3 минусами, и тогда получится одна симметрия: + + + - - + + - - -
А можно продолжить плюсом и двумя минусами, и тогда получится другая симметрия: + + + - - + + + - -

Так это не условие. Там 7 примеров и надо предсказать восьмой. Только числа и операция сложение или вычитание.
В другой задачке ИИ тоже были склонны к такому же глупому предсказанию, но уже не на знаках.

BlackMokona · « **Ответ #11116 :** 11 Авг 2025 [06:55:43] »

Цитата: Polnoch Ксю от 10 Авг 2025 [21:55:24]

Но самая главная фишка ChatGPT, которую все пропустили, это автономный агент. Достаточно крутая штука - можно поручать машине сделать какие-то операции с помощью браузера. Оно даже действовать на разных сайтах под Вашими аккаунтами может

Пока ИИ не настолько надежны, чтобы пускать их в браузеры без присмотра, что то автономно делать

Olweg · « **Ответ #11117 :** 11 Авг 2025 [07:11:15] »

Цитата: Olweg от 09 Авг 2025 [08:53:23]

Цитата: Olweg от 08 Авг 2025 [23:37:05]
По GPT 5 Thinking пока не обновилось.
GPT 5 Thinking набрал 57 баллов в оффлайн-тесте (и даже в онлайн-тесте, который мог попасть в обучающие данные, всего 85 баллов) $:-\$ Насколько я понял, отвечено правильно всего 2 вопроса из 16. Это какой-то провал. Непонятно, что происходит.

Результаты обновили. GPT 5 реабилитировался и набрал 116 баллов IQ, то есть примерно тот же уровень, что у других топовых моделей. Благодаря провальному первому результату среднее пока 93. А вот GPT 5 Thinking показал… 70 баллов. Это совершенно непонятно. Я бы не удивился, если бы было наоборот - модели без “reasoning” действительно обычно показывают низкие баллы, например, у GPT-4o результат как раз около 70. Правда, у GPT 4.5 было повыше, в среднем около 90. Но два таких провала подряд для «думающей» модели… Что-то тут не то.

Кстати, провальный результат сейчас показала и o3 pro - 63, в результате среднее уехало на несколько пунктов до 109. Но такие единичные помутнения случаются.

https://www.trackingai.org/home

Trend · « **Ответ #11118 :** 11 Авг 2025 [08:01:33] »

Цитата: Polnoch Ксю от 10 Авг 2025 [21:55:24]

Оно даже действовать на разных сайтах под Вашими аккаунтами может

Хороший способ получить пермабан.

Сергей Н · « **Ответ #11119 :** 11 Авг 2025 [20:28:58] »

Цитата: Olweg от 10 Авг 2025 [15:20:29]

Значит, ждём новых подходов, в том числе в железе - например, истинной нейроморфности.

Забавно что глубокий ресерч в gemini выдал по теме нейроморфных чипов.

Цитата

Одним из наиболее значительных препятствий для широкого внедрения нейроморфных чипов является необходимость разработки совершенно новых языков программирования и программного обеспечения для работы с этой аппаратурой. Это подразумевает значительные усилия по разработке и фундаментальный отход от существующих парадигм программирования, которые доминировали в вычислительной технике на протяжении десятилетий.

Вероятно инвестиции в "нанометры" немного урежут если уже не. Потому что уже имеющееся еще долго можно осваивать. И дело не только в нейроморфных чипах. Звоночки то давно были.

Новости:

A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 402601 раз)