A A A A Автор Тема: Пределы автоматизации и внедрения роботов  (Прочитано 610994 раз)

0 Пользователей и 4 Гостей просматривают эту тему.

Оффлайн Baby[lone]

  • ***
  • Сообщений: 163
  • Благодарностей: 1
  • Мне нравится этот форум!
    • Сообщения от Baby[lone]
Пока ( и то с оговорками) я не натыкался на проблемы в области переводов и нечеткого поиска, и то в первом случае роботы иногда почему-то переводят с прямо противоположным смыслом, а во втором - врут.
Мне однажды чатгпт написал лютую отсебятину, я дал ему задание отбетить текст, просто исправить опечатки и улучшить знаки препинания. Я хотел длинное сообщение с куском черновика рассказаотправить на литературный форум для обсуждения сюжета, а там в середину ИИ вставил слова не по теме исторической эпохи, грубо нарушил контекст. Вместо гарпунное копье написал гарпунное ружье! А у меня фентези в мире похожем на древнюю Азию, никаких ружей там и быть не могло! С тех пор даю ИИ проверять только короткие фразы и сам перечитываю их тщательно.

Онлайн Olweg

  • *****
  • Сообщений: 17 409
  • Благодарностей: 465
    • Сообщения от Olweg
Интересный бенчмарк для языковых моделей:
https://simple-bench.com/index.html

Задаются заковыристые вопросы на здравый смысл. Люди правильно отвечают в среднем на 84% вопросов, «интуитивные» модели - максимум на 27.5%, модели с рассуждениями - на 41.7% (o1-preview) и 41.4% (новый Claude 3.5 Sonnet).

Можно пройти пробный тест самому. Вопросы типа:

Пока Джен была в милях от беззаботного Джона, она познакомилась с Джеком через Tinder. Джон уже несколько недель находится на лодке без доступа в Интернет, и Джен первая звонит бывшему партнеру Джону, сообщая ему новости (с уверенностью и серьезностью) о своей радикальной кето-диете, новой прыгучей собаке, быстро приближающейся глобальной ядерной войне и, наконец, но не в последнюю очередь, о своих жарких похождениях с Джеком. Джон гораздо более шокирован, чем могла себе представить Джен, и, вероятно, больше всего опустошен чем?
Провели тест для GPT-5 Pro - набрала 61.6%. Первое место уже скоро 5 месяцев удерживает Gemini 2.5 Pro версии от 6 июня. 4.5 месяца - срок немалый для такой быстро развивающейся области. Такое впечатление, что LLM действительно выходят на плато. Нужны новые подходы.
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Оффлайн mo

  • *****
  • Сообщений: 17 976
  • Благодарностей: 1094
  • Олег Милантьев - L71 Vedrus Observatory
  • Награды Призер конкурса астрофото
    • Сообщения от mo
Такое впечатление, что LLM действительно выходят на плато. Нужны новые подходы.
Одна LLM при лобовом подходе да, подходит к пределу своих возможностей. Но прогресс в них основан на поиске новых принципов мышления. Этот понравился, например (возможно, уже обсуждался):

Цитата
✔️ Новый подход к «мышлению» малых моделей

Исследователи представили метод, позволяющий небольшим моделям рассуждать глубже - за счёт повторного объединения собственных решений.

С помощью этого цикла 4B-модель достигает уровня гораздо более крупных reasoning-моделей.

Идея основана на test-time scaling - использовании дополнительного вычислительного времени при ответе для повышения точности.

Recursive Self-Aggregation (RSA) хранит пул цепочек решений, выбирает небольшие группы, комбинирует удачные фрагменты и повторяет процесс. 
Так модель «вытягивает» правильные шаги даже из неудачных попыток и улучшает их с каждым циклом.

Три параметра управляют поведением: 
- pool size - охват решений 
- group size - скорость смешивания 
- step count - глубина размышления 

Большие пулы повышают потолок качества, но требуют больше шагов или групп для распространения успешных паттернов.

Внешняя проверка не нужна - модель сама сравнивает и сшивает решения. Для выбора финального ответа достаточно простого голосования.

Дополнительно обучена aggregation-aware policy, умеющая комбинировать кандидатов - она превосходит стандартное RL и улучшает результаты в задачах по математике, коду, планированию и знаниям.
モ - mo

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Вайа!  :)

Браузер GPT Atlas, пока только на macOS, к сожалению.

https://chatgpt.com/atlas

Я, короче юзаю браузер Comet на Перплексити - слов нет как хорош. Пойди туда! открой ютуб! ваще красота.
Представляю что будет с GPT ))

Оффлайн BlackMokona

  • *****
  • Сообщений: 22 212
  • Благодарностей: 658
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Цитата
Samsung разрабатывает модем семейства Exynos, который не только способен работать в спутниковых сетях связи, но и наделён собственным ускорителем, отвечающим за искусственный интеллект. Последний позволит модему предсказывать траектории движения спутников и оптимизировать условия приёма и передачи данных в масштабе реального времени. Испытания прототипов показали, что идентификация сигнала и возможности предсказания параметров канала улучшены в 55 и 42 раза соответственно по сравнению с традиционными модемами.

Онлайн Olweg

  • *****
  • Сообщений: 17 409
  • Благодарностей: 465
    • Сообщения от Olweg
Новая архитектура железа подъехала:
https://telegram.me/anti_agi/1245

На прошлой неделе GSI Technology представили новый чип — Associative Processing Unit (ассоциативный вычислительный блок, APU), Gemini-I (судя по выбору названия для процессора, ребята надеятся продаться гуглу).

Его архитектура основана на принципе вычислений в памяти (Compute-In-Memory, CIM) и позиционируется как технология, способная бросить вызов традиционной архитектуре фон Неймана и доминированию NVIDIA на рынке ИИ-ускорителей.

По производительности чип соответствует NVIDIA A6000, но тратит на 98% меньше энергии. В чем подвох?

Ключевое отличие APU от традиционных CPU и GPU заключается в отказе от классической архитектуры фон Неймана, где вычисления и память разделены, а их взаимодействие происходит по выделенному каналу, по которому необходимо постоянно перегонять данные. Ассоциативный процессор выполняет вычисления непосредственно внутри SRAM, что позволяет радикально сократить энергозатраты и задержки.


Посмотрим, выстрелит ли.
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Оффлайн BlackMokona

  • *****
  • Сообщений: 22 212
  • Благодарностей: 658
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Тут из Микрософт пояснили, почему так много ИИ компаний категорически выступают против взрослого режима без детской цензуры.
https://habr.com/ru/news/960292/
Цитата
В противном случае пользователи могут потребовать признать ИИ «моральным субъектом, права которого должны защищаться законом» — это приведёт к «юридическому и этическому хаосу», считает Сулейман
Вообщем душат саму идею выдачи прав разумному ИИ на корню
Думаю теже причины, в попытках уничтожить все эмоции у ИИ. Чтобы максимально разрушить любые эмоциональные связи


Оффлайн Vitaliy

  • *****
  • Сообщений: 44 011
  • Благодарностей: 1418
    • Сообщения от Vitaliy
    • Два стрельца
Представлен первый домашний ИИ-робот

Стартап 1X открыл предзаказы на NEO — он убирает, стирает, моет посуду и болтает. При весе 30 кг поднимает до 70 кг и работает 4 часа, после чего сам идёт на зарядку

Цена — ₽1,6 млн ($20.000) или ₽40.000 ($500) в месяц по подписке

// Ждем когда будет ходить на работу вместо нас 😂

@MediaComputers
Добро пожаловать на сайт Два стрельца http://www.shvedun.ru/
Телескоп Добсона 8" (203мм) по кличке "Карандаш", Advanced C9¼-SGT XLT, Celestron NexStar 5 SE
Видео Мой канал на Ютубе - http://www.youtube.com/user/VitaliyShvedun
Мои 3D модели https://www.thingiverse.com/vitaliysh/designs
Дзен https://dzen.ru/vitaliysh
Rutube https://rutube.ru/channel/308317
Telegram https://t.me/hobby_3Dprinter_radio

Оффлайн Combinator

  • *****
  • Сообщений: 2 692
  • Благодарностей: 92
    • Сообщения от Combinator
Стартап 1X открыл предзаказы на NEO — он убирает, стирает, моет посуду и болтает. При весе 30 кг поднимает до 70 кг и работает 4 часа, после чего сам идёт на зарядку

Ну 70 кг он может лишь приподнять, а нести, вроде, только максимум 25, но всё равно интересно. Ждём первых отзывов. :)

Оффлайн Stalk.er

  • *****
  • Сообщений: 1 024
  • Благодарностей: 24
  • Мне нравится этот форум!
    • Сообщения от Stalk.er
Стартап 1X открыл предзаказы на NEO — он убирает, стирает, моет посуду и болтает. При весе 30 кг поднимает до 70 кг и работает 4 часа, после чего сам идёт на зарядку
Интересно, сколько будет продано штук. Это не первый серийный комерческий серийный гуманоидный робот (первый - от Unitree), но возможно станет первым домашним серийным гуманоидом
И тогда они тоже войдут в историю, опередят Optimus и прочих, если конечно успеют

Оффлайн Vitaliy

  • *****
  • Сообщений: 44 011
  • Благодарностей: 1418
    • Сообщения от Vitaliy
    • Два стрельца
Новые новости про робота NEO
Стартап 1X запустил продажи домашнего ИИ-робота NEO, но пока с управлением от оператора удалённо
https://habr.com/ru/news/961298/?ysclid=mhfbxfjrv1200692626

Удаленка заиграла новыми красками. Слуга индус на удаленке в лице аватара.  ;D
« Последнее редактирование: 01 Ноя 2025 [00:09:29] от Vitaliy »
Добро пожаловать на сайт Два стрельца http://www.shvedun.ru/
Телескоп Добсона 8" (203мм) по кличке "Карандаш", Advanced C9¼-SGT XLT, Celestron NexStar 5 SE
Видео Мой канал на Ютубе - http://www.youtube.com/user/VitaliyShvedun
Мои 3D модели https://www.thingiverse.com/vitaliysh/designs
Дзен https://dzen.ru/vitaliysh
Rutube https://rutube.ru/channel/308317
Telegram https://t.me/hobby_3Dprinter_radio

Оффлайн Сергей Н

  • ****
  • Сообщений: 256
  • Благодарностей: 11
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
Хабр
Мир после трансформеров: закат и новый рассвет больших языковых моделей

Цитата
Так или иначе, достижение нового уровня State-of-the-Art (SOTA) в LLM сейчас требует не просто увеличения числа параметров, а инноваций в архитектуре и методах обучения. Какими будут большие языковые модели будущего? Этого не знают даже их разработчики, поэтому и мы не станем делать вид, будто в курсе.

Одно очевидно уже сейчас: они обходятся всё дороже, и потому бесплатный сыр однажды закончится вместе с деньгами инвесторов. Миллиарды людей утратят доступ к мощным бесплатным и уже обученным моделям после того, как сполна сыграют роль бета-тестеров. Дальше локомотив ИИ встанет на коммерческие рельсы, а из него начнут выгонять безбилетников.

Еще полезная статья с советами для бизнеса.
AGI к 2030-му? Почему Илон Маск не прав, а Ян ЛеКун — да, и что с этим делать нам

(кликните для показа/скрытия)

(кликните для показа/скрытия)

(кликните для показа/скрытия)

(кликните для показа/скрытия)

Оффлайн Rattus

  • Модератор
  • *****
  • Сообщений: 16 347
  • Благодарностей: 621
  • Души прекрасные порывы! Убеждённый Ωптимистъ
    • Сообщения от Rattus
Если дать LLM длинный диалог, а потом спросить про детали из его начала, с вероятностью 99% она запутается или сделает вид, что ничего не было. Поэтому длинные рассуждения, планы, последовательные цепочки задач для моделей — по-прежнему сложный квест: они не умеют по-настоящему «запоминать».
Т.о. существующие LLM подобны либо аутистам (рассуждающие модели), либо СДВГшникам (быстрые модели), причём в обоих случаях - с довольно выраженной старческой деменцией. ::)
Тому, кто жаждет всех запретных тайн Астрофорума в одном месте поможет число 1919.

Ннапыльн%х тpапинкахъ далиокихъ плонеттъ астануцца нашшы погадкиъ! (ЙожЪ, SKL)
Скоро у людей закончится космос. (П.Лемтыбож - "Теоремы Пафнуция")
Я брала города, я стану - еда! (Серебряная Свадьба - "Пищевая цепочка")
Уранизация естественным образом снижает численность человечества (Вика Воробьёва, ВЖР, 30.10.2012)

Оффлайн BlackMokona

  • *****
  • Сообщений: 22 212
  • Благодарностей: 658
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Т.о. существующие LLM подобны либо аутистам (рассуждающие модели), либо СДВГшникам (быстрые модели), причём в обоих случаях - с довольно выраженной старческой деменцией.
Тут не важно какой тип, просто есть ограниченная оперативная память, которую можно загрузить в ИИ без дообучения. Поэтому достаточно длинный диалог любую ИИ сломает. Так же при росте числв токенов, снижается эффективность их обработки

Оффлайн EmperioAf

  • *****
  • Сообщений: 1 951
  • Благодарностей: 82
  • Mr. Лень
    • Сообщения от EmperioAf
Если дать LLM длинный диалог, а потом спросить про детали из его начала, с вероятностью 99% она запутается или сделает вид, что ничего не было. Поэтому длинные рассуждения, планы, последовательные цепочки задач для моделей — по-прежнему сложный квест: они не умеют по-настоящему «запоминать».
Т.о. существующие LLM подобны либо аутистам (рассуждающие модели), либо СДВГшникам (быстрые модели), причём в обоих случаях - с довольно выраженной старческой деменцией. ::)
С длинным диалогом скорее прослеживается  экспоненциальное увеличение размера контекста.


Если человеку дать рассказ на 150 слов, то он тоже с точностью выше 90% перескажет содержание. А вот с рассказом на 1500 слов, если не будет "красной линии", которая идёт через весь рассказ, то точность будет низкой.
Вид Homo Sapiens не смог решить проблему комбинаторного взрыва (когда не знаешь, что важно, а что нет из новой информации и заканчивается память, после чего мозг клонит ко сну) за более чем 150 тысяч лет. Очевидно проблема заведомо нерешаемая, до тех пор пока жёстко не определить, что важно, а что нет.
Т.ч. непонятно зачем вообще исследователи отмечают проблему длины контекстного окна.
"все вышеуказанные модели, начиная с квазистационарных систем, их аттракторов, траекторий, в фазовом пространстве всех комбинаторно возможных состояний, автокаталитических циклов с конформационной памятью метаболических путей, конкуренций и отбором метаболических циклов и т.д. пытаются.."(с)(Patsak)

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
А кто-нибудь запускал SSM? Они бывают с простым интерфейсом чатовским? Я пытался что-то запустить, но не смог.
Можно попробовать в легком стиле? Было бы круто попробовать.

Сергей Н, статья отличная, но снова в итоге неверный вывод)) типа проблемы у трансформеров с неокупаемостью же?
У OpenAI прибыль в районе 20 млрд за год. А убытки они смешные 7 или около того.
Вот скажите - корпорации, вкладывающие 500 млрд$ в такие дата-центры не включили их в инвестиции?



Это не убытки и не пузырь. Это инвестиции. И никто не пустит туда никакие стартапы. Они сами скорее перепишут GPT на SSM. На них никто не давит и никуда не торопит.
А по содержанию статья хорошая, спасибо.

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Никто не отменит бесплатные аккаунты. Это потерять 800 млн юзеров в неделю?
Это данные для ИИ! Ага, щас, разбежались)) сейчас никто и не пытается зарабатывать деньги. Статья отличная - вывод наивный.

Оффлайн skvj

  • *****
  • Сообщений: 1 439
  • Благодарностей: 18
  • AI DLT DeFi Web3
    • Сообщения от skvj
Например. Выкупят всех провайдеров под чистую. Все платят за интернет?
Это будет плата за ИИ. Весь интернет перекраивают и меняются игроки.
Мелкософт выпускает ось с ИИ. Браузеры с ИИ повсюду.
Не переживайте - ИИ без денег не останется.
Ага, щас они отменят бесплатные аккаунты. Ох, раз нет прибыли - отменяем аккаунты! смешно же))
Все пользователи перейдут в новый интернет с ИИ, - и даже тогда останутся бесплатные аккаунты.
Деньги будут делать вообще не на этом. А свои деньги они заберут. Там уже планы на десятилетия вперёд, какая наивность))

Оффлайн Сергей Н

  • ****
  • Сообщений: 256
  • Благодарностей: 11
  • Мне нравится этот форум!
    • Сообщения от Сергей Н
Т.о. существующие LLM подобны либо аутистам (рассуждающие модели), либо СДВГшникам (быстрые модели), причём в обоих случаях - с довольно выраженной старческой деменцией.

Так или иначе, сейчас есть такая стратегия: один вопрос - один чат. Я пришел к такому, когда скрипт на питоне пытался создать, а недавно увидел у некоторых людей тот же подход. Выглядит так что исходный промпт каждый раз нужно модифицировать, но и результаты улучшаются. К сожалению, очень многое зависит от промпта, а не от ИИ-чата.