A A A A Автор Тема: Пределы автоматизации и внедрения роботов  (Прочитано 606543 раз)

EmperioAf, bigcat88 и 3 Гостей просматривают эту тему.

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
У людей тоже есть ограничение контекстного окна и галлюцинаций более чем достаточно.
Есть, но пока на порядки меньшие ограничения, чем у LLM, которые можно запустить на своём железе дома или использовать по подписке. И эта разница настолько большая количественно, что становится качественной. Я думаю, это главная причина (вместе с галлюцинациями) почему у миддл инженеров и у самой опытной когорты джунов ещё есть работа на рынке(состоявшегося джуна уже не нужно учить азам, и он не поплывёт, если в него ткнуть 10 миллионами токенов монолита - он даже вопросы сможет задать про этот код сеньёру. А модель не может).

Я видела предсказания в прошлом(и сама их повторяла лол), что модели будут писать на чистом машинном коде и лучше GCC и шланга, что ООП всякое не нужно итд, а в реальности это просто не работает: из-за узколобости моделей и реального контекста у лучших моделей ну 32к-40к токенов (без серьезного ухудшения качества ответов) моделям такие оптимизации как модульность архитектуры, микросервисы, ООП и высокоуровневые, лаконичные по токенам языки нужны ещё больше чем людям(на питоне и js нужно меньше строк кода, чтобы написать, не знаю, приложение вызова такси, чем на байткоде или тем более ASM, машинном коде). Кто бы мог подумать, что задача распилить жирный монолит будет для нашего недо-аджиай образца ноября 2025го просто невыполнимой? И даже не из-за галлюцинаций, а именно из-за малого контекста.

С галлюцинациями ещё можно более-менее бороться покрывая всё тщательно автотестами, и поручая их написание другому автономному агенту, и тщательно ревьювя каждую строчку - автотесты часто занимают в разы больше места, чем сам код - это именно из-за проблем у моделей с галлюцинациями.

Это кстати важный совет всем: никогда не давайте инстансу автономномого агенту, который пишет приложение, писать автотесты :)) Он будет мухлевать, я видела это и у codex и у claude code - пишите отдельный промт для автотестов в отдельном табе.

Изменится ли ситуация в ближайшее время? Да, наверное. Я думаю, тут TPU помогут моделям и архитектурные оптимизации. Но пока мы ещё не тут, чтобы восторженные челы с r/singularity не говорили.
Я бы предположила, что до AGI примерно 3 года, и не меньше полугода. Может, чуть больше чем три - вряд ли больше 4.

Отдельный вопрос, как быстро мы получим ASI систему после AGI? Если через несколько часов(и проблему элайнмента мы к тому моменту ещё не решим), нам всем конец, имхо. Если через десять лет - тогда у человечества есть шансы на то, чтобы не оказаться в аду. Какой будет take off к сингулярности? Hard или soft?

Если у нас будет софт тейкофф, то может у человечества хватит здравомыслия не тратить все ресурсы на разработку автономного оружия и ASI, а потратить большую часть ресурсов автономных ML-ресёчеров на разработку элайнмента, и на математическое его доказывание (чтобы люди могли его проверить)?
Ладно, о чём я? Конечно же не хватит  :-\
« Последнее редактирование: 22 Ноя 2025 [06:32:27] от Polnoch Ксю »
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
Дарио Амадей сказал, что технически может включить окно объёмом 100 млн слов
Такие высказывания снижают уровень доверия Антропику. Я много раз хвалила claude за то, что они не пытаются вот так делать - обманывать людей контекстом в миллионы токенов. В chain-of-thoughts у claude прекрасно видно, что модель не сама смотрит в загруженные в неё файлы с кодом (или текстом художественным и нет), а использует внешнюю утилиту для поиска в проекте. Внутри утилиты, видимо, сверхоптимизированная LLM с большим контекстом - например, 150к  и скрипты, бьющие текст на чанки. А настоящая умная модель как была с контекстом, скажем, 32к токенов, так и остаётся.

Другие модели скрывают этот процесс от пользователя(я думаю, он так же примерно сделан везде), и это снижает к ним доверие.
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Re: Автоматизация нотариата
« Ответ #11822 : 22 Ноя 2025 [06:57:57] »
Вы говорите приоритет авторства часто не проблема? Но весь ваш длинный список судебных тяжб как раз и показывает, что это гигантская проблема.
Знаете, у меня в творческой биографии был эпизод, когда первым оказался как раз не я. Правда мы с "конкурирующим" автором очень быстро и беспроблемно решили, что произведения все-таки разные, хоть и на удивление похожие. Но спорить о датах, подозревая мухлёж, нам с нею даже в голову не приходило.
И в вышеприведенных мною примерах ТОЖЕ не оспаривались даты/приоритеты первопубликаций (чего Вы почему-то упорно отказываетесь замечать): и Емец признавал вторичность своей Тани по отношению к Гарри, и студия (скажем, ХХ Cent. Fox от Расходникова) не отрицала получение чернового сценария РАНЬШЕ, чем другой, но подозрительно похожий, был ею взят в работу.

Уж не знаю, насколько этот список можно назвать длинным, только проблема, иллюстрируемая мной с его помощью, всяко не в сложности выяснения, кто был первым, а кто вторым. Она именно в трактовке: позволительно ли обошелся второй с произведением первого. Или, может, не обходился никак, а креативил самостоятельно, независимо, но... так совпало.

(кликните для показа/скрытия)

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Дарио Амадей сказал, что технически может включить окно объёмом 100 млн слов
Такие высказывания снижают уровень доверия Антропику. Я много раз хвалила claude за то, что они не пытаются вот так делать - обманывать людей контекстом в миллионы токенов. В chain-of-thoughts у claude прекрасно видно, что модель не сама смотрит в загруженные в неё файлы с кодом (или текстом художественным и нет), а использует внешнюю утилиту для поиска в проекте. Внутри утилиты, видимо, сверхоптимизированная LLM с большим контекстом - например, 150к  и скрипты, бьющие текст на чанки. А настоящая умная модель как была с контекстом, скажем, 32к токенов, так и остаётся.

Другие модели скрывают этот процесс от пользователя(я думаю, он так же примерно сделан везде), и это снижает к ним доверие.

Ксю, не только Антропик говорит о 100М контекста

https://www.communeify.com/en/blog/magic-100m-token-context-windows

https://lablab.ai/tech/ltm-2-mini

https://magic.dev/blog/100m-token-context-windows

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
Ксю, не только Антропик говорит о 100М контекста

https://www.communeify.com/en/blog/magic-100m-token-context-windows

https://lablab.ai/tech/ltm-2-mini

https://magic.dev/blog/100m-token-context-windows
Хочу увидеть технологию с хотя бы 250к настоящим контекстом(при сохранении возможностей модели хотя бы на уровне o3-mini-high/sonnet-3.7 начала 2025го). Если это вдруг будет пол-миллиона, ну тем более отлично.


Чем писать победные реляции, они бы стрим запилили, где бы автономный агент, управляющей такой моделью, распилил бы большой монолит со спагетти-кодом, и потом это приложение смогло бы запустится, и чтобы в нём хоть что-то работало бы (можно, конечно, дать модели несколько десятков часов на фиксинг в цикле)

Или чтобы книжку написал художественную - пусть посредственную, вторичную - где бы модель не перепутала через пару глав персонажей и не забыла бы уже написанные детали сюжета: тоже отличный тест на реальное контекстное окно.
С контекстным окном в 250к в модель бы поместился синопсис романа среднего размера, и карточки персонажей (и осталось бы чуть-чуть, чтобы писать сам текст главы).

Аналогично и с распиливанием монолита - с 250к реальным окном (повторюсь, оно не растёт от хитрых хаков, которыми можно хоть десять, хоть сто миллионов сделать - основная модель не сама смотрит в текст, а это за неё делают более глупые) что-то иногда даже бы получалось
« Последнее редактирование: 22 Ноя 2025 [08:07:16] от Polnoch Ксю »
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d


Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
https://generative-engine.org/llama-s-90-cost-advantage-and-10m-token-windows-why-october--1760828634841



Так я же говорю, сделали бы стрим на твиче, ютьюбе и в экс с тем, как модель пилит монолит на микросервисы, используя их технологию. В идеале нужно чтобы не они сами выбрали монолит который будет пилить агент, а аудитория голосованием.

Это какой-то пресс-релиз, даже не пейпер в пир ревьювд журнале
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн BlackMokona

  • *****
  • Сообщений: 22 187
  • Благодарностей: 657
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Есть, но пока на порядки меньшие ограничения, чем у LLM, которые можно запустить на своём железе дома или использовать по подписке
С учётом быстрого развития ИИ, думаю процент галлюцинации будет активно падать просто из-за снижения случаев когда ИИ не знает точного ответа или не может его получить

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Ксю, мы вообще о разном говорим.
Я говорю, верней Амадей говорит - о потенциале архитектур.

Кроме того уже сегодня существуют модели Hyena, Mamba, RWKV и т.п., которые математически и алгоритмически способны поддержать хоть 100 млн токенов, потому что их вычисление растёт линейно, а не квадратично.

То есть возможность есть, потенциально! но это как возможность построить мегамост через Атлантику - инженеры знают, как его спроектировать, но не могут пока себе позволить такой бюджет.

А вы говорите о фактически существующих продакшн-моделях, которые прямо сейчас в inference на реальном железе при реальном качестве могут держать 250k–1M нативного окна.

И при этом вы говорите - они все врут)) как так?

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
Кроме того уже сегодня существуют модели Hyena, Mamba, RWKV и т.п., которые математически и алгоритмически способны поддержать хоть 100 млн токенов, потому что их вычисление растёт линейно, а не квадратично.
Где можно скачать модель с возможностями sonnet-3.7(февраль 2025) и реальным контекстным окном в 250к токенов? Я такого никогда на huggingface не находила. Повторюсь, я говорю не о хитрых хаках, когда маленькая тупая модель, оптимизированная под большое окно роется в токенизированном тексте, пилит его на чанки и размечает для большой модели - а более честный подход, где бы основная модель видела текст целиком.

Я думаю, что нет, мы ещё не тут. И что настоящим окном в 250к обладают только модели уровня моделей из прошлой эпохи (что-нибудь уровня 4o, gpt-4.1)

Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн BlackMokona

  • *****
  • Сообщений: 22 187
  • Благодарностей: 657
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Повторюсь, я говорю не о хитрых хаках, когда маленькая тупая модель, оптимизированная под большое окно роется в токенизированном тексте, пилит его на чанки и размечает для большой модели - а более честный подход, где бы основная модель видела текст целиком
Там не хаки,там архитектуры другие. Им нормально жрать сколько угодно контекста. Но архитектуры ещё не развитые, поэтому по интелекту не дотягивают до топовых моделей

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Повторюсь, я говорю не о хитрых хаках, когда маленькая тупая модель, оптимизированная под большое окно роется в токенизированном тексте, пилит его на чанки и размечает для большой модели - а более честный подход, где бы основная модель видела текст целиком
Там не хаки,там архитектуры другие. Им нормально жрать сколько угодно контекста. Но архитектуры ещё не развитые, поэтому по интелекту не дотягивают до топовых моделей

Да-да, вот правильно.

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
Но архитектуры ещё не развитые, поэтому по интелекту не дотягивают до топовых моделей
о чём я и говорила. Я согласна, что много интересных архитектурных идей. Но мы пока ещё не тут. Нет пока никакого AGI. Уже почти, да. Но пока ещё нет...

А все эти рассказы о контекстном окне в 10млн токенов у Маска, Антропика итд вызывают только раздражение и недоумение
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Но архитектуры ещё не развитые, поэтому по интелекту не дотягивают до топовых моделей
о чём я и говорила. Я согласна, что много интересных архитектурных идей. Но мы пока ещё не тут. Нет пока никакого AGI. Уже почти, да. Но пока ещё нет...

А все эти рассказы о контекстном окне в 10млн токенов у Маска, Антропика итд вызывают только раздражение и недоумение

Так он и говорит - мощности не хватает для новых архитектур. Дата-центры на 500 МВт для чего строят по вашему?))

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Здесь есть мнения, Что это пузырь)) и гоняют бабло сами себе, например - отличное объяснение))
Никто ничего не делает, просто бабки гоняют по кругу и заказывают друг у друга карты, а те дают что-то ещё - а те назад возвращают и просто воруют деньги инвесторов.
Очень! Очень глубокий анализ!

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
Так он и говорит - мощности не хватает для новых архитектур. Дата-центры на 500 МВт для чего строят по вашему))
Вот пусть покажут модель с настоящим окном 250к. Эти рекламные миллионы токенов - просто обман. и напоминает гонку мегапикселей в смартфонах: тоже абсолютно бесполезная характеристика (потому, что маленькая ПЗС матрица очень шумна)

Мне кажется, в нашем мире постправды очень важно быть честными, это могло бы быть способом зарабатывания репутации: не мухлевать в спеках. Скажем, вместо бредней про миллионы токенов контекста сказать, "смотрите, у нас теперь не 32к контекстное окно реальное, а аж 35к у основной модели! Мы выросли аж +9% к прошлому поколению! А так же модель может рыться и искать в тексте объёмом до 10млн токенов с помощью утилиты для поиска!"
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Т.е. когда инженер рассказывает про новые технологии, которые нас ждут в будущем - его корректно прервать, обвинить во лжи и указать - нет, вы сначала покажите! А уж потом будете вот это всё рассказывать! Вынь, да положъ!
Правильно?))

Оффлайн Polnoch Ксю

  • *****
  • Сообщений: 10 423
  • Благодарностей: 414
    • Сообщения от Polnoch Ксю
Т.е. когда инженер рассказывает про новые технологии, которые нас ждут в будущем - его корректно прервать, обвинить во лжи и указать - нет, вы сначала покажите! А уж потом будете вот это всё рассказывать! Вынь, да положъ!
это не инженер рассказывает в пир ревьювд пейпере, а какие-то пресс-службы в пресс-релизах.

Мой поинт в том, что меня раздражают очень упоминания о миллионах токенов контекста - и тем сильнее, чем больше миллионов там указано. Если речь о новой технологии, так дали бы её потестить или хотя бы почитать подробности в пейпере как сделали.
Meade LightBridge12"
RC8¨и МАК5"Альтер М500 на AZ4, Celestron SLT, Ioptron ZEQ25
БГШ 2.3x40 и Steiner Marine 7x50
ES82°:4.7mm,30mm
ES100°:9mm,14mm,20mm
ES68°:40mm
Meade Plossl 56mm; Vixen NLV 6mm
2" Lumicon, 1,25" DeepSky: UHC and OIII
---
qhy5
Ioptron SkyTracker
Canon50d

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Т.е. когда инженер рассказывает про новые технологии, которые нас ждут в будущем - его корректно прервать, обвинить во лжи и указать - нет, вы сначала покажите! А уж потом будете вот это всё рассказывать! Вынь, да положъ!
это не инженер рассказывает в пир ревьювд пейпере, а какие-то пресс-службы в пресс-релизах.

Мой поинт в том, что меня раздражают очень упоминания о миллионах токенов контекста - и тем сильнее, чем больше миллионов там указано. Если речь о новой технологии, так дали бы её потестить или хотя бы почитать подробности в пейпере как сделали.

Я лично слушал лекцию Дарио Амадея и выкладывал её на форуме))

Оффлайн BlackMokona

  • *****
  • Сообщений: 22 187
  • Благодарностей: 657
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Мой поинт в том, что меня раздражают очень упоминания о миллионах токенов контекста - и тем сильнее, чем больше миллионов там указано. Если речь о новой технологии, так дали бы её потестить или хотя бы почитать подробности в пейпере как сделали.
Это всегда было. Вспомните дутые мегагерцы у интел, где просто каждый третий герц был пустым и ответ в виде П рейтинга у АМД