A A A A Автор Тема: Пределы автоматизации и внедрения роботов  (Прочитано 402601 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Онлайн BlackMokona

  • *****
  • Сообщений: 21 101
  • Благодарностей: 638
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Что там?
Обычное либертарианство. Свободный рынок, минимальное вмешательство государства, индивидуализм, свободная торговля, и тд и тп.

Оффлайн Olweg

  • *****
  • Сообщений: 16 867
  • Благодарностей: 448
    • Сообщения от Olweg
В общем, уже понятно, что вау-эффектов, как от GPT-4, теперь не будет. Тогда был эффект низкой базы. Сейчас уже пошло насыщение технологии, выход на полку S-кривой, когда 80% усилий выбирают оставшиеся 20% прироста. Ну, сейчас, может быть, 80% от потенциала ещё не достигли, но уже к этому идёт, перегиб S-кривой трансформерной архитектуры, наверное, пройден. Значит, ждём новых подходов, в том числе в железе - например, истинной нейроморфности.
Не у меня одного такие мысли:
https://ai-news.ru/2025/08/gpt_5_ot_openai_signaliziruet_o_zavershenii_krupnyh_proryvov_v_oblasti_ii.html
https://www.webpronews.com/openais-gpt-5-signals-end-of-major-ai-leaps-focus-on-refinements/

…несмотря на шумиху, всё больше экспертов сходятся во мнении, что эти достижения знаменуют конец революционных скачков в области ИИ и открывают эру постепенных улучшений. Влиятельный эксперт по ИИ Янник Килчер в недавнем видео на YouTube сравнил текущее состояние больших языковых моделей (БЯМ) с «эпохой Samsung Galaxy» в мире смартфонов, когда каждая новая модель предлагает лишь незначительные улучшения, например чуть более качественную камеру, а не революционные инновации.


Конец законам масштабирования?

В более широком смысле это означает, что фундаментальные исследования в области ИИ зашли в тупик. Килчер предполагает, что мы исчерпали возможности простого масштабирования вычислений и данных и что осталось, возможно, всего два-три порядка величины, которые не стоят вложенных средств. Вместо этого компании обращаются к «умным» методам, таким как формирование вознаграждения в RL, для улучшения моделей. Это напоминает ранние этапы машинного обучения, но в гораздо большем масштабе, где обучение стоит миллионы.
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Оффлайн Ph_user

  • *****
  • Сообщений: 2 345
  • Благодарностей: 63
    • Сообщения от Ph_user
Количество прорывов зависит от инвестиций. Если инвесторы начинают видеть отсутствие прибыли они заканчивают инвестировать и примерно все прорывающие работники уходят в другие места.

А хотели сделать робота чтобы он сам себя улучшал или хотя бы сохранял во времени.
« Последнее редактирование: 10 Авг 2025 [15:36:38] от Ph_user »

Оффлайн Olweg

  • *****
  • Сообщений: 16 867
  • Благодарностей: 448
    • Сообщения от Olweg
Количество прорывов зависит от инвестиций.
Тут циклическая связь. Количество инвестиций, в свою очередь, зависит от прорывов )

Естественно, речь пока только о трансформерной архитектуре, которая лежит в основе современных моделей. Да и то, не факт, что в ней самой ещё невозможны какие-то радикальные изменения. Просто парадигма масштабирования (больше данных, больше параметров при прочих равных) окончательно выходит на полку. Первые звоночки были ещё в прошлом году.
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Оффлайн Metatron

  • ****
  • Сообщений: 287
  • Благодарностей: 12
  • Мне нравится этот форум!
    • Сообщения от Metatron
Рано судить о застое по результатам одной модели.
Посмотрим что получится у других. Тот же Грок-5 обещают в конце года, начале следующего.

У OpenAI был трудный год. Уход ведущих специалистов. Потом сманивание оставшихся Фейсбуком.

Оффлайн Mercury127

  • *****
  • Сообщений: 7 352
  • Благодарностей: 411
  • Мне нравятся местные идиоты. Весёлые. :D
    • Сообщения от Mercury127
имхо, без выпуска модели в реальную жизнь, где она сможет обучаться на взаимодействии с окружающей средой, одновременно чувствуя оное взаимодействие собственной шкурой, дальнейшего прогресса не будет.

вот примерно как было заявление, что китайцы своего робота отправили в университет. вот надо так и делать, и не ради показухи. и лет через 10 можно будет сделать вывод, чему он может научиться.

но опять же, для этого придётся перейти психологический рубеж, отделяющий раба от гражданина, те определиться, хотим ли мы иметь гражданина-машину...

кроме того, нужно понимать, что результат взаимодействия с окружающей средой будет разный, в зависимости от пропорции гопарей и профессоров в среде.

по сути, единственным отличием такого гражданина-машины от гражданина-человека будет лёгкость копирования...

пока же, нмв, состояние моделей застряло на уровне пятилетнего ребёнка, в которого залили весь интернет.
« Последнее редактирование: 10 Авг 2025 [17:24:25] от Mercury127 »
ОАО Ордена Трудового Красного Знамени.
Бронежилет — лучше для мужчины нет!

Оффлайн Olweg

  • *****
  • Сообщений: 16 867
  • Благодарностей: 448
    • Сообщения от Olweg
Рано судить о застое по результатам одной модели.
Ну, застоем я бы пока это не назвал. Но пошло постепенное, медленное приращение. Grok 5, скорее всего, прорыва тоже не сделает, поскольку к тому моменту появятся уже модели, дышащие ему в затылок. Та же победительница мат.олимпиады от OpenAI, например - её тоже где-то к концу года обещают.
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 075
  • Благодарностей: 411
    • Сообщения от Polnoch Ксю
Я тоже думаю, что LLM или почти на плато, или требуется радикальная инновация - вроде CoT. С другой стороны, мне кажется, другие архитектуры обязательно появятся. Именно поэтому, ИМХО, в этом году AGI ещё не будет, и скорее всего в следующем. А вот к 2030му вполне...
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн Сергей Н

  • ***
  • Сообщений: 242
  • Благодарностей: 10
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
Для меня исчезновение опций DeepSearch и DeeperSearch в Grok 3 это такой недостаток, который перекрывает возможные плюсы от появления Grok 4.
Кто не знает это был по настоящему глубокий поиск, исследование, которое могло выполняться в офлайн режиме. Десятки минут в среднем. По результатам было видно, что проанализировано около сотни веб страниц.

Лимиты были вполне нормальные. 10 DeepSearch в сутки и 2 DeeperSearch. Кроме того есть x.com и grok.com если израсходовал лимит в одном, можно продолжить в другом, хотя и в новом чате. Да, еще была опция Think - 10 запросов каждые 2 часа, её тоже убрали.

Про обновление интерфейса в целом, есть намёки, что это может быть новая тенденция - вместо кнопок оно само решает сколько ресурсов затратить и каким способом. Может быть даже DeepSearch включится, но пока не получилось.

Оффлайн Сергей Н

  • ***
  • Сообщений: 242
  • Благодарностей: 10
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
Погонял самодельные тесты сделанные по типу ARC-AGI.
Такой рейтинг
GPT-5 Think
Grok-4
DeepSeek-r1
Gemini 2.5 Pro

На самом деле всем плохо. Есть у них особенность видеть в такой последовательности паттерн, по которому они предсказывают следующий знак: + + + - - + +. Чаще плюс но могут и минус, а надо смотреть совсем на другие части задания, на четность чисел.

Grok больше всех склонен находить сложные закономерности которые справедливы но не то. DeepSeek слишком долго думает по одной задачке, 650 секунд потом прерывается и надо нажать кнопку продолжить.

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 075
  • Благодарностей: 411
    • Сообщения от Polnoch Ксю
Кто не знает это был по настоящему глубокий поиск, исследование, которое могло выполняться в офлайн режиме. Десятки минут в среднем. По результатам было видно, что проанализировано около сотни веб страниц.
Так есть же у гугла и у ChatGPT - и у ChatGPT у первого появилось. И по моему субъективному ощущению, у грок оно было не очень. Почему они добавили Deeper search. Как чат-бот грок сильный, особенно четвёртый - я уже погоняла по кодинг задачкам в бесплатной версии. А вот дип ресёч всегда был какой-то недоделанный: грок постоянно галлюцинации туда пихал. Мне кажется, у OpenAI за дип ресёч отвечает какая-нибудь скрытая от юзеров o4-heavy (условное название. Может, кстати, прототип chat-gpt-5 базовой модели отвечал),поэтому результаты лучше.

Гугловский дип ресёч мне тоже показался хорошим. И он доступен для тех, у кого подписки нет.
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн Сергей Н

  • ***
  • Сообщений: 242
  • Благодарностей: 10
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
. А вот дип ресёч всегда был какой-то недоделанный: грок постоянно галлюцинации туда пихал. Мне кажется, у OpenAI за дип ресёч отвечает какая-нибудь скрытая от юзеров o4-heavy (условное название. Может, кстати, прототип chat-gpt-5 базовой модели отвечал),поэтому результаты лучше.

Вполне возможно Grok с глюками был, но у ChatGPT лимит 5 запросов в месяц. Гугловский разок пробовал. Теперь то можно их использовать, пока тоже не убрали.

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 075
  • Благодарностей: 411
    • Сообщения от Polnoch Ксю
но у ChatGPT лимит 5 запросов в месяц.
На бесплатном? По-моему на бесплатном режиме там ещё и какие-то ограничения были (я слышала, если ничего не путаю) кажется, там какая-то более глупая модель используется. На плюс тарифе вот так:

10 full-fledged Deep Research queries per month, plus an additional 15 using a lightweight version  - он автоматически переключается на более глупую базовую модель.

Но самая главная фишка ChatGPT, которую все пропустили, это автономный агент. Достаточно крутая штука - можно поручать машине сделать какие-то операции с помощью браузера. Оно даже действовать на разных сайтах под Вашими аккаунтами может. Я в тестовых целях сказала агенту поиграть в шахматы на chess.com. Агент, конечно, проиграл человеку (с рейтингом ~800) но нельзя сказать, что поражение было разгромным.
Только опасения насчёт прайвеси мешают мне включить ChatGPT агента в автоматизацию моей жизни - подключить к календарям, почте, итд.


 Правда, я по прайвеси причинам побаиваюсь пускать альтмана в свои онлайн-аккаунты. Хочу попробовать сгородить свой собственный браузер-агент.
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн EmperioAf

  • *****
  • Сообщений: 1 912
  • Благодарностей: 81
  • Mr. Лень
    • Сообщения от EmperioAf
На самом деле всем плохо. Есть у них особенность видеть в такой последовательности паттерн, по которому они предсказывают следующий знак: + + + - - + +. Чаще плюс но могут и минус, а надо смотреть совсем на другие части задания, на четность чисел.
Какое то неоднозначное условие. Можно продолжить 3 минусами, и тогда получится одна симметрия:  + + + - - + + - - -
А можно продолжить плюсом и двумя минусами, и тогда получится другая симметрия: + + + - - + + + - -
"все вышеуказанные модели, начиная с квазистационарных систем, их аттракторов, траекторий, в фазовом пространстве всех комбинаторно возможных состояний, автокаталитических циклов с конформационной памятью метаболических путей, конкуренций и отбором метаболических циклов и т.д. пытаются.."(с)(Patsak)

Оффлайн Сергей Н

  • ***
  • Сообщений: 242
  • Благодарностей: 10
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
На бесплатном? По-моему на бесплатном режиме там ещё и какие-то ограничения были
Да, моделька o4-mini. А сейчас везде GPT-5, по идее.


Оффлайн Сергей Н

  • ***
  • Сообщений: 242
  • Благодарностей: 10
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
Какое то неоднозначное условие. Можно продолжить 3 минусами, и тогда получится одна симметрия:  + + + - - + + - - -
А можно продолжить плюсом и двумя минусами, и тогда получится другая симметрия: + + + - - + + + - -

Так это не условие. Там 7 примеров и надо предсказать восьмой. Только числа и операция сложение или вычитание.
В другой задачке ИИ тоже были склонны к такому же глупому предсказанию, но уже не на знаках.

Онлайн BlackMokona

  • *****
  • Сообщений: 21 101
  • Благодарностей: 638
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Но самая главная фишка ChatGPT, которую все пропустили, это автономный агент. Достаточно крутая штука - можно поручать машине сделать какие-то операции с помощью браузера. Оно даже действовать на разных сайтах под Вашими аккаунтами может
Пока ИИ не настолько надежны, чтобы пускать их в браузеры без присмотра, что то автономно делать

Оффлайн Olweg

  • *****
  • Сообщений: 16 867
  • Благодарностей: 448
    • Сообщения от Olweg
По GPT 5 Thinking пока не обновилось.
GPT 5 Thinking набрал 57 баллов в оффлайн-тесте (и даже в онлайн-тесте, который мог попасть в обучающие данные, всего 85 баллов) :-\ Насколько я понял, отвечено правильно всего 2 вопроса из 16. Это какой-то провал. Непонятно, что происходит.
Результаты обновили. GPT 5 реабилитировался и набрал 116 баллов IQ, то есть примерно тот же уровень, что у других топовых моделей. Благодаря провальному первому результату среднее пока 93. А вот GPT 5 Thinking показал… 70 баллов. Это совершенно непонятно. Я бы не удивился, если бы было наоборот - модели без “reasoning” действительно обычно показывают низкие баллы, например, у GPT-4o результат как раз около 70. Правда, у GPT 4.5 было повыше, в среднем около 90. Но два таких провала подряд для «думающей» модели… Что-то тут не то.

Кстати, провальный результат сейчас показала и o3 pro - 63, в результате среднее уехало на несколько пунктов до 109. Но такие единичные помутнения случаются.

https://www.trackingai.org/home
« Последнее редактирование: 11 Авг 2025 [07:16:24] от Olweg »
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Оффлайн Trend

  • *****
  • Сообщений: 535
  • Благодарностей: 26
    • Сообщения от Trend
Оно даже действовать на разных сайтах под Вашими аккаунтами может
Хороший способ получить пермабан.

Оффлайн Сергей Н

  • ***
  • Сообщений: 242
  • Благодарностей: 10
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
Значит, ждём новых подходов, в том числе в железе - например, истинной нейроморфности.

Забавно что глубокий ресерч в gemini выдал по теме нейроморфных чипов.
Цитата
Одним из наиболее значительных препятствий для широкого внедрения нейроморфных чипов является необходимость разработки совершенно новых языков программирования и программного обеспечения для работы с этой аппаратурой. Это подразумевает значительные усилия по разработке и фундаментальный отход от существующих парадигм программирования, которые доминировали в вычислительной технике на протяжении десятилетий.

Вероятно инвестиции в "нанометры" немного урежут если уже не. Потому что уже имеющееся еще долго можно осваивать. И дело не только в нейроморфных чипах. Звоночки то давно были.