A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 432844 раз)

Инопланетянин · « **Ответ #11360 :** 09 Сен 2025 [05:08:22] »

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:55:20]

И ни одна разумная личность не обратила внимание, что звучит как-то дико, не посмотрела закон 295.

Не этот ли закон подразумевался?

skvj · « **Ответ #11361 :** 09 Сен 2025 [07:03:42] »

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

Цитата
вы мне сейчас доказываете, что роман о закате, не только подробнее, чем сам закат, но и лучше его
Не закат, а фотка заката.

Именно закат. Tesla FSD (Full Self Driving) видит мир, строит свою картину мира. ИИ обучают видеть вовсе не только фото, а саму реальность. По вашему автопилот сможет управлять авто просто по текстовому описанию? Архитектура LLM будет перестроена таким же образом, - уже перестроена частично.

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

И да, подробностей туда влезет больше чем человек может представить думая о закате хоть сутки.

Ага, а модель по вашем словам будет информативнее, чем оригинал. Только это вовсе не так.

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

А про лучше- хуже, это не ко мне, это субъективизм. И тем более не к машинам (вы ведь про ощущения, не так ли?).

Возможно и будет субъективизм - нам откуда знать? Это вопрос философский, а Tesla FSD тем не менее видит мир и строит его модель. Мне в данном случае никакой субъективизм не нужен, а вам он зачем?

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

Вот как придумают как научить ИИ Видеть(именно так, с большой буквы) - поговорим. Природа за 4 млрд лет - не придумала.

Не только давно придумали КАК, но и научили. Перечислю видящие ИИ:
Tesla FSD, Boston Dynamics, Figure, Agility Robotics, DeepMind Gato, GPT-5. И это только что я знаю, а я знаю немного. Но речь идёт именно о мультимодальных LLM в том числе. В дальнейшем с ними можно будет смотреть кино.

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

И пока все эти громкие слова про мультимодальность- просто маркетинг.
Те самые интонации и микропаузы- это очередная надстройка к ASR, ничего более.

Вздор.

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

Я же прекрасно понимаю сколько весит картинка, сколько матрица с её параметрами, и тем более сколько будут весить её эмбеддинги. Это далеко не 5 слов. А если набрать всего лишь пол- мегабайта =500.000 букв = полноформатная книга в твердой обложке на 25-30 глав.
Понятное дело что массив эмбеддингов от одной картинки - это намного больше 5 слов. Но до полноформатной книги этому полумегабайту- как до луны. Как раз из-за неинформативного мусора, отсекаемого ASR.

Привет староверам! )) Вы хотя бы почитайте о вычислительной мощности запускаемых проектов прямо сейчас. Тесла ездит и видит (в буквальном смысле, потому что смотрит "глазами", у неё даже лидаров нет) - и это сотни тысяч машин, - обработка происходит в реальном времени 24/7. Никаких проблем. А сзади идут староверы со своими хоругвиями и взывают к справедливости, рассказывая про полумегабайты. Вот без всякой иронии теперь - вы просто не в теме.

Цитата: Konstantin Schtsch от 08 Сен 2025 [22:30:21]

Или, есть ещё вариант, где вы запутались в терминологии, ведь сам концепция ASR - автоматическое распознование речи не исключает обработку интонаций, тембра и чего-то ещё - например видеопотока.

ASR может добавить маркеры - интонация, паузы, смех. Но это ровно то же самое, что выдать машине книгу с ремарками: "сказано саркастично". Она не слышит сарказм, а читает подсказку. Это принципиально другое.

Когда я говорю "видеть закат", я имею в виду ровно то, что делают мультимодели: учиться напрямую на спектрограммах, изображениях, потоках движений. Они работают не с текстом, а с исходным многообразием сигнала. Это не маркетинг, а фундаментальный прорыв: от "описывать реальность словами" к "переваривать реальность как есть". Здесь не о чем спорить - потому что это не теория, а рабочие модели всевозможно разных ИИ.

Теперь про мусор. Я забыл выше ответить. В картинке действительно миллион пикселей, и половина лишние. Но именно в этом "мусоре" (в кавычках) кроется то, что отличает фото живого человека от манекена, а искреннюю улыбку от натянутой. Архиваторы и ASR отбрасывают "ненужное" в кавычках, а ИИ, обученный на всём сигнале, как раз в этих микродеталях и понимает реальность.

Konstantin Schtsch · « **Ответ #11362 :** 09 Сен 2025 [21:59:50] »

Благодарю за развернутый ответ.
Теперь я убедился, что дальнейшая дискуссия вам неинтересна, у вас уже сложилась некая картина мира современного ИИ, пусть и основанная не на науке а на вере.
Я даже немного вам завидую - такой незамутненой радости я давно не испытываю:

В моей повседневной реальности компы растут количественно, но не качественно, разум человека- мало чем отличается от разума животных, а человеческий мозг- крайне примитивная, глючная и неэффективная система, к тому же работающая на побочках.
Нейрон- может и суперсложно устроен физико-биологически, но логически это тупейший накопитель, срабатывающий при переполнении стека. Его дендриты - и то сложнее, там хоть некоторая ячейка памяти в наличии- те самые корректируемые веса нейросвязи. Вот только максимальная точность у мозга - "назовите по шкале от 1 до 10", тогда как только в одном байте 256 вариантов. который давно используется группами по 32 и 64 бита. А про Гигагерцы- лучше и не вспоминать, там бескрайний депресняк.

Боженька на шестой день знатно накосячил. (что еще раз доказывает: нехрен перерабатывать в выходные.

)

Вашу картину мира, где машина, или человек - ВИДИТ, мог бы разбить вдребезги простой аргумент - про перевернутое изображение на сетчатке. И эксперимент с линзами переворачивающими изображение- уже через пару дней человек привык и не ощущал дискомфорта.
Глаз, камера- не видит, а фиксирует изображение.
Нервы - передают не изображение, а его характеристики, описательные данные.
Мозг не видит, а обрабатывает данные. Да ещё и через множество отделов пропускает, помимо зрительного.

Так работает зрение живых. Так с какого перепою зрение искуственных систем должно работать по- другому? а если и заморочиться и сделать так- что мы выиграем? это будет абсолютно чужеродная всему живому система. может эффективная, может нет - но абсолютно чужеродная, работающая по другим принципам.
Поэтому я уверен - у вас налицо путаница в терминологии.

А наш мозг - по старинке, работает с сигналами и информацией.

Цитата: skvj от 09 Сен 2025 [07:03:42]

Вы хотя бы почитайте о вычислительной мощности запускаемых проектов прямо сейчас.

я их иногда даже зубами выгрызаю у заказчика, пусть и далеко не в тех масштабах что флагманы ИИ, но представление о ценах имею из первых рук.))

Цитата: Инопланетянин от 09 Сен 2025 [05:08:22]

Не этот ли закон подразумевался?

нет, другой: https://president.gov.by/ru/documents/ukaz-no-295-ot-4-avgusta-2025-g

Ах да, к слову о том как "замечательно" видит тесла: помните ролик с нарисованной стеной?

https://leonardo.osnova.io/0b4b0a60-4d90-5d23-9807-885784cc3ae5/-/format/mp4/#t=0.1

Olweg · « **Ответ #11363 :** 10 Сен 2025 [12:55:35] »

Цитата: Olweg от 11 Авг 2025 [07:11:15]

Результаты обновили. GPT 5 реабилитировался и набрал 116 баллов IQ, то есть примерно тот же уровень, что у других топовых моделей. Благодаря провальному первому результату среднее пока 93. А вот GPT 5 Thinking показал… 70 баллов.
…
https://www.trackingai.org/home

По последним тестам модели GPT-5 наконец пришли в чувство, а автор сайта удалил провальные сомнительные первые пробы. В любом случае, на сайте считается среднее по семи последним тестам, а один неудачный может сильно исказить результат. Подумал - а что, если брать не среднее, а медианное? У некоторых моделей пока, правда, только чётное число результатов, но в таких случаях можно брать среднее по двум средним. Итак, вот такой рейтинг пока получается (для лучших моделей; визуальные тесты не включал):

Grok-4 - 123 (пока очень сильный разброс по результатам)
Claude-4 Opus - 123 (начиная с июля стабильное значение)
GPT-5 Pro - 120
Gemini 2.5 Pro - 116 (тут всё тоже очень стабильно)
GPT-5 Thinking - 116
Claude 4 Sonnet - 110
GPT-5 - 103 (лучшая неразмышляющая модель)
DeepSeek R1 - 103 (как раз тот случай, когда один сбой сильно уводит средний результат - 96)

Очень хороший потенциал показывает Grok-4 - у него три из шести результатов 130, 130 и 136. Если так пойдёт дальше, то может вырваться в лидеры. 136 - похоже, вообще потолок для этого теста (16 верных ответов из 16). Это всего лишь уровень очень умного человека. Видимо, насыщение теста не за горами. Нужно удлинять список вопросов.

Metatron · « **Ответ #11364 :** 10 Сен 2025 [13:53:05] »

Народ говорит что уже кто-то видел Грок 4.2. Тесты радуют.
Видимо выпустят в течении месяца, двух.

skvj · « **Ответ #11365 :** 10 Сен 2025 [23:38:45] »

Цитата: Metatron от 10 Сен 2025 [13:53:05]

Народ говорит что уже кто-то видел Грок 4.2. Тесты радуют.
Видимо выпустят в течении месяца, двух.

Я постоянно юзаю GPT и Грока. Остальные тоже есть, но я не пользуюсь почти никогда. Может кто-то пользуется другими LLM? и есть какие-то фишки

А что с Перплексити случилось? ему контекстные окна что ли порезали? даёшь файл на 10 страниц, он его не тянет. Раньше такого не было.

у меня вот что есть:

skvj · « **Ответ #11366 :** 11 Сен 2025 [02:37:15] »

Ещё работа с доказательствами картины мира у LLM
https://arxiv.org/pdf/2411.16262

Никто из специалистов сейчас не спорит, что ИИ могут иметь собственную картину мира. Почему? Там математические доказательства - читайте. Это не так, как вы привыкли делать Константин: я не верю, я не поверю. Это не вопрос веры.

BlackMokona · « **Ответ #11367 :** 11 Сен 2025 [13:09:39] »

Распространение любимых фраз ИИ, в парламенте Британии.

Сергей Н · « **Ответ #11368 :** 12 Сен 2025 [01:09:36] »

Цитата: Metatron от 10 Сен 2025 [13:53:05]

Народ говорит что уже кто-то видел Грок 4.2. Тесты радуют.
Видимо выпустят в течении месяца, двух.

Это две анонимные модели на openrouter.ai. Пользователи определили что это новый Grok скорее всего.

(кликните для показа/скрытия)

Выдающихся отличий не имеет. Не только по тому что видно на скриншотах. На моих тестах тоже не вижу особых улучшений.
Но да, модель быстрее и больше генерирует. Многих это радует.

Olweg · « **Ответ #11369 :** 12 Сен 2025 [09:24:13] »

Похоже, нейросети увеличивают разрыв: отличники развиваются, троечники теряют интерес

https://skillbox.ru/media/education/pohozhe-neyroseti-uvelichivayut-razryv-otlichniki-razvivayutsya-troechniki-teryayut-interes/

Rattus · « **Ответ #11370 :** 12 Сен 2025 [09:33:20] »

Цитата: Olweg от 12 Сен 2025 [09:24:13]

Похоже, нейросети увеличивают разрыв: отличники развиваются, троечники теряют интерес:
https://skillbox.ru/media/education/pohozhe-neyroseti-uvelichivayut-razryv-otlichniki-razvivayutsya-troechniki-teryayut-interes/

Совершенно ожидаемо. "Вялый середнячок" по способностям и возможностям в обществе изводится и, видимо, будет изведён.
Точно будет новый пролетариат. А вот про новую аристократию владельцев и высших управленцев, и особенно что она будет надолго - не уверен.
Как уже отмечал, элои Товарищу A-SI не будут потребны ни в каком виде и, как следствие,- тоже по итогу оптимизированы до нуля, но это уже другая история.

Trend · « **Ответ #11371 :** 12 Сен 2025 [14:19:30] »

Очень часто сталкиваюсь, что на какой-то конкретный вопрос ChatGPT пишет либо какую-то общую информацию без конкретных деталей или вообще выдумывает несуществующих людей. Иду в Википедию в статью по этому вопросу и там все эти детали о которых не знает ChatGPT четко расписаны. И причем давно. Либо ChatGPT намеренно притворяется глупее чем есть, либо разработчики занижает его возможности, либо ему еще развиваться и развиваться.

BlackMokona · « **Ответ #11372 :** 12 Сен 2025 [14:30:30] »

Цитата: Trend от 12 Сен 2025 [14:19:30]

Очень часто сталкиваюсь, что на какой-то конкретный вопрос ChatGPT пишет либо какую-то общую информацию без конкретных деталей или вообще выдумывает несуществующих людей. Иду в Википедию в статью по этому вопросу и там все эти детали о которых не знает ChatGPT четко расписаны. И причем давно. Либо ChatGPT намеренно притворяется глупее чем есть, либо разработчики занижает его возможности, либо ему еще развиваться и развиваться.

Либо вам нужно нажать кнопочку, чтобы ЧатГПТ пользовался Гуглом

Trend · « **Ответ #11373 :** 12 Сен 2025 [14:43:38] »

Цитата: BlackMokona от 12 Сен 2025 [14:30:30]

Либо вам нужно нажать кнопочку, чтобы ЧатГПТ пользовался Гуглом

Он у меня гуглит по своему усмотрению. Почему-то в некоторых случаях когда чего-то не знает, то решает что "и так сойдет".

BlackMokona · « **Ответ #11374 :** 12 Сен 2025 [14:46:42] »

Цитата: Trend от 12 Сен 2025 [14:43:38]

Он у меня гуглит по своему усмотрению. Почему-то в некоторых случаях когда чего-то не знает, то решает что "и так сойдет".

Заставьте всегда гуглить как вариант

Olweg · « **Ответ #11375 :** 12 Сен 2025 [17:13:04] »

Это уже было в ~~Сипмсонах~~ Южном Парке

Пользователи начали переводить переписку в iMessage на аутсорс — спасибо интеграции ChatGPT. Теперь владельцы iPhone на iOS 26 могут автоматизировать диалоги через приложение «Команды»: система сама читает сообщение, генерирует и отправляет ответ с помощью ChatGPT.

Как пишут в Twitter, работает «удивительно хорошо»: всё-таки подражать речи пользователя, особенно зная факты о нём, ИИ совсем не сложно. Сразу вспоминается серия South Park, где школьники перевели общение со своими возлюбленными на ChatGPT — или легендарное «So I spent all day chatting with the bot?!» из Silicon Valley.

https://telegram.me/anti_agi/1089

Olweg · « **Ответ #11376 :** 15 Сен 2025 [08:48:01] »

Как раз к вопросу имитации мозговых процессов (уехавших в другую тему) - китайцы разработали спайковую (импульсную) нейросетевую модель:

https://www.notebookcheck-ru.com/Kitai-predstavil-SpikingBrain-1-0-vdokhnovlennyi-mozgom-LLM-rabotajushchii-na-otechestvennykh-chipakh-MetaX.1112759.0.html

https://eu.36kr.com/en/p/3458000417642121

Институт автоматизации Китайской академии наук в Пекине недавно представил свою новейшую большую языковую модель SpikingBrain 1.0. Эта LLM, как утверждается, является первой в мире "мозгоподобной" LLM, разработанной для того, чтобы потреблять значительно меньше энергии, чем обычные системы ИИ, такие как ChatGPT. Вместо того, чтобы полагаться на аппаратное обеспечение Nvidia, он работает полностью на чипах MetaX китайского производства, что знаменует собой значительный прогресс в области нейроморфных вычислений.

В системе используется технология "спайковых вычислений", которая имитирует характер возбуждения нейронов в человеческом мозге. Эта технология позволяет активировать только необходимые нейроны, а не всю сеть, как в традиционных моделях. Такой событийно-ориентированный подход также позволяет системе быть энергоэффективной, снижая потребление энергии. Кроме того, по сравнению с обычными системами, система может обучаться на мизерных двух процентах обучающих данных.

BlackMokona · « **Ответ #11377 :** 15 Сен 2025 [08:53:58] »

Цитата: Olweg от 15 Сен 2025 [08:48:01]

В системе используется технология "спайковых вычислений", которая имитирует характер возьуждения нейронов в человеческом мозге. Эта технология позволяет активировать только необходимые нейроны, а не всю сеть, как в традиционных моделях

На это уже давно и массово перешли в мире. Как раз недавно другие Китайцы сообщили, что достигли в этом особо больших успехов с очередной своей моделью

Olweg · « **Ответ #11378 :** 15 Сен 2025 [08:56:57] »

Не слышал о таком. Экспериментальные модели - возможно, но широкое использование?..

BlackMokona · « **Ответ #11379 :** 15 Сен 2025 [09:12:30] »

Цитата: Olweg от 15 Сен 2025 [08:56:57]

Не слышал о таком. Экспериментальные модели - возможно, но широкое использование?..

В ряде нейросетей, есть понятия параметров и активных параметров. Если эти две цифры отличаются, то как раз схема где не все нейроны разом активируются.
Как простой пример
Llama 4 Scout — компактная модель с 17 миллиардами активных параметров и 109 миллиардами общих параметров

Новости:

A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 432844 раз)