A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 402604 раз)

Albireo7 · « **Ответ #11020 :** 07 Авг 2025 [07:26:04] »

Я вот примерно про это писал. «Железный конь идёт на смену крестьянской лошадке» — цитата из романа И. Ильфа и Е. Петрова.

Удивляет то, как вот так прямо, быстро, планомерно и без всякой бюрократии Китай строит коммунизм в своей стране. Скоро ведь пенсионный возраст начнут снижать, хулиганы!

https://dzen.ru/a/aItmrFcJhkQF3r7u

BlackMokona · « **Ответ #11021 :** 07 Авг 2025 [08:06:56] »

Цитата: Albireo7 от 07 Авг 2025 [07:26:04]

Я вот примерно про это писал. «Железный конь идёт на смену крестьянской лошадке» — цитата из романа И. Ильфа и Е. Петрова. Удивляет то, как вот так прямо, быстро, планомерно и без всякой бюрократии Китай строит коммунизм в своей стране. Скоро ведь пенсионный возраст начнут снижать, хулиганы!

Так беспилотные тракторы уже пол века служат
Вот например фотка из статьи 2016 года

Polnoch Ксю · « **Ответ #11022 :** 07 Авг 2025 [08:37:09] »

Цитата: BlackMokona от 07 Авг 2025 [05:49:56]

Только зачем мучаться, когда есть десятки опен сорс моделей лучше?

В чём мучение? Запуск ванильной модели, или ablitirated, или ещё как-то файн-тюнд примерно одной сложности для пользователя инференса. Если же речь про мучения разработчиков, так они это делают по фану. Проблема тут в том, что если модель изначально тупа, ничего не сделаешь. А именно цензура у любой опенсурс/опенвейт модели снимается куда проще.
В общем, для опенсурс моделей цензура вообще не является проблемой. У дипсика давно оторвали нежелание говорить про события на площади Тяньаньмэнь - подозреваю, что уже через неделю после релиза ещё первой версии

Цензура проблема только для облачных LLM и их пользователей.

Albireo7 · « **Ответ #11023 :** 07 Авг 2025 [08:41:44] »

Цитата: BlackMokona от 07 Авг 2025 [08:06:56]

Цитата: Albireo7 от 07 Авг 2025 [07:26:04]
Я вот примерно про это писал. «Железный конь идёт на смену крестьянской лошадке»
Так беспилотные тракторы уже пол века служат
Вот например фотка из статьи 2016 года

Так одно дело беспилотный трактор, который управляется оператором через дистанционное управление наподобие БПЛА. То есть, фактически тот же самый тракторист, только сидит в кабинете. И совсем другое - аналогичный трактор, который работает полностью автономно под руководством ии. Где оператор вообще не нужен. Он может работать круглосуточно без выходных. Производительность труда в пересчёте вырастает в разы.

BlackMokona · « **Ответ #11024 :** 07 Авг 2025 [10:23:36] »

Цитата: Albireo7 от 07 Авг 2025 [08:41:44]

Так одно дело беспилотный трактор, который управляется оператором через дистанционное управление наподобие БПЛА. То есть, фактически тот же самый тракторист, только сидит в кабинете. И совсем другое - аналогичный трактор, который работает полностью автономно под руководством ии. Где оператор вообще не нужен. Он может работать круглосуточно без выходных. Производительность труда в пересчёте вырастает в разы.

Системы для полного автопилота, сейчас продаются и можно установить на любой трактор вообще

BlackMokona · « **Ответ #11025 :** 07 Авг 2025 [10:23:49] »

Цитата: Polnoch Ксю от 07 Авг 2025 [08:37:09]

В чём мучение?

Ну зачем когда есть куча моделей получше?

Сергей Н · « **Ответ #11026 :** 07 Авг 2025 [11:52:36] »

Что такое ARC-AGI и Maze-30x30

(кликните для показа/скрытия)

Цитата

Результаты и значимость:

Люди решают 98% задач ARC-AGI-1 и 100% ARC-AGI-2, тогда как лучшие ИИ (например, OpenAI o3) достигают лишь 75.7% на первой версии и <4% на второй.

Провал современных LLM (GPT-4, Claude 3) на ARC-AGI-2 доказывает их неспособность к символическому и композиционному мышлению.

Цитата

Maze 30×30 — задача из ARC-AGI-2, специально разработанная для проверки многоэтапного планирования.

Её провал современными LLM — доказательство их ограниченности в символическом мышлении, что стимулирует создание гибридных архитектур (нейро-символические системы, рекуррентные машины).

Как же выглядит Maze 30x30:

Olweg · « **Ответ #11027 :** 07 Авг 2025 [12:07:10] »

Самое интересное в этих тестах то, что их, насколько я понимаю, скармливают моделям в символьном виде! То есть вот такие картинки они воспринимают как набор построчной развёртки:

Сергей Н · « **Ответ #11028 :** 07 Авг 2025 [13:27:21] »

Случайно обнаружил что ИИ с поиском могут находить то что не находит гугл.

Причина по которой поиск не находит нужное, в данном случае была из области соблюдения авторских прав. Сайт на котором расположен нужный текст размещает его незаконно.
И похоже что gemini включил цензуру походу действия. То-есть первый же запрос был удачный, но потом в течении дня я не смог повторить это с первого раза (с нового чата), приходилось обновлять запрос. Со 2-3 раза все же давал правильный ответ. Через три дня уже и с пятой попытки не дает правильный ответ. Больше я не пробовал.

Но вот Perplexity всегда дает правильный ответ с ppl-sonar-reasoning-pro-high и ppl-sonar-pro-high.
Остальные ИИ с LMArena и ИИ-чаты официальные не давали правильный ответ никогда.

BlackMokona · « **Ответ #11029 :** 07 Авг 2025 [15:45:00] »

Грок 4 против Дженеми 2.5 Про в шахматах
https://www.youtube.com/watch?v=-m33dn_3sNQ

Olweg · « **Ответ #11030 :** 07 Авг 2025 [16:18:45] »

Цитата: Olweg от 07 Авг 2025 [07:24:56]

Судя по всему, анонс GPT-5 сегодня в 22:00 по московскому.

Всё-таки в 20:00 (10:00 AM PDT, разница 10 часов).

Polnoch Ксю · « **Ответ #11031 :** 07 Авг 2025 [16:31:26] »

Цитата: BlackMokona от 07 Авг 2025 [10:23:49]

Ну зачем когда есть куча моделей получше?

Точно ли они лучше? Повторюсь, я пока не ставила эту модель против реальных задач, но то, что я вижу - пока очень впечатляет. Особенно баланс скорости генерации токенов и их качества.
Я думаю, через несколько дней, может, пару-тройку недель появятся версии без цензуры, или с хаками в систем шеле, которые её отключают, и тогда можно будет попробовать.

BlackMokona · « **Ответ #11032 :** 07 Авг 2025 [18:29:18] »

Цитата: Polnoch Ксю от 07 Авг 2025 [16:31:26]

Цитата: BlackMokona от 07 Авг 2025 [10:23:49]
Ну зачем когда есть куча моделей получше?
Точно ли они лучше? Повторюсь, я пока не ставила эту модель против реальных задач, но то, что я вижу - пока очень впечатляет. Особенно баланс скорости генерации токенов и их качества.
Я думаю, через несколько дней, может, пару-тройку недель появятся версии без цензуры, или с хаками в систем шеле, которые её отключают, и тогда можно будет попробовать.

Народ наоборот сильно жалуется на медлительность. Потому как в генерации они 90% токенов тратят на цензуру

BlackMokona · « **Ответ #11033 :** 07 Авг 2025 [20:37:08] »

Вышел ГПТ-5. Занял топ 1 рейтинга. Хоть отрыв небольшой. Графики сбрасывать не будут из презентации. Подожду пока их кто-то переделает хоть в какой то нормальный вид без маркетинговой лапши

BlackMokona · « **Ответ #11034 :** 07 Авг 2025 [20:38:22] »

Хоть общий рейтинг моделей закину

Olweg · « **Ответ #11035 :** 07 Авг 2025 [20:51:10] »

Наверное, самое важное новшество - очень низкий уровень галлюцинаций.

BlackMokona · « **Ответ #11036 :** 07 Авг 2025 [20:58:05] »

Цитата: Olweg от 07 Авг 2025 [20:51:10]

Наверное, самое важное новшество - очень низкий уровень галлюцинаций.

Только зачем то они для этого новые критерии придумали. Поэтому хотелось бы увидеть сравнения с конкурентами

BlackMokona · « **Ответ #11037 :** 07 Авг 2025 [21:00:54] »

Тем более диаграммы намекают, что ОпенАИ могли сильно подмашанить отчёты.
Посмотрите на это чудо мысли.

BlackMokona · « **Ответ #11038 :** 07 Авг 2025 [21:05:04] »

Или ещё топчика.

Olweg · « **Ответ #11039 :** 07 Авг 2025 [21:08:41] »

Да, видел

Практикантам поручили.

Новости:

A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 402604 раз)