A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 444585 раз)

skvj · « **Ответ #11780 :** 19 Ноя 2025 [01:04:35] »

А что с Гроком я не пойму? был Grok 4 Fast с 2 млн токенов, заменили на Grok 4.1 с 256k!
И такое ощущение, что он стал хуже. Или Fast остался? Может он отвечает в режиме эксперт? тогда зачем старшая модель, ничего не понимаю

BlackMokona · « **Ответ #11781 :** 19 Ноя 2025 [06:36:46] »

Цитата: skvj от 19 Ноя 2025 [01:04:35]

А что с Гроком я не пойму? был Grok 4 Fast с 2 млн токенов, заменили на Grok 4.1 с 256k!
И такое ощущение, что он стал хуже. Или Fast остался? Может он отвечает в режиме эксперт? тогда зачем старшая модель, ничего не понимаю

Фаст убран, заменили на 4.1. Который лучше чем Фаст по бенчмаркам. Ну а контекст наверное слишком дорого обходился и урезали.
Старшей моделью остаётся Грок 4 Хэви, а Грок 4 просто, это эксперт для бесплатных пользователей.
А старших уже заменит Грок 4.2 который уже доступен для теста на сторонних площадках по имени Шерлок и у него как раз под 2 миллиона контекста.

skvj · « **Ответ #11782 :** 19 Ноя 2025 [07:29:10] »

Цитата: BlackMokona от 19 Ноя 2025 [06:36:46]

Цитата: skvj от 19 Ноя 2025 [01:04:35]
А что с Гроком я не пойму? был Grok 4 Fast с 2 млн токенов, заменили на Grok 4.1 с 256k!
И такое ощущение, что он стал хуже. Или Fast остался? Может он отвечает в режиме эксперт? тогда зачем старшая модель, ничего не понимаю
Фаст убран, заменили на 4.1. Который лучше чем Фаст по бенчмаркам. Ну а контекст наверное слишком дорого обходился и урезали.
Старшей моделью остаётся Грок 4 Хэви, а Грок 4 просто, это эксперт для бесплатных пользователей.
А старших уже заменит Грок 4.2 который уже доступен для теста на сторонних площадках по имени Шерлок и у него как раз под 2 миллиона контекста.

Уже объявлен запуск суперкластера Colossus 2 на 550 000 GB200 и GB300, а сам Маск публично ставит цель достичь мощности 50 млн GPU Nvidia H100 за 5 лет, а в перспективе выйти на уровень десятков экзаFLOPS для ИИ.
Предположим, это реализовано.
Какие контекстные окна можно будет включить? ну, чтоб по настоящему заработали.
Хотелось бы миллионов 50-60 ))
Чтобы они реальную помощь приносили, типа задания им давать, - напомни это, напомни то. Вместо ежедневника))
Он же будет еще мощность на андроидов пускать, и трудно понять что и как

BlackMokona · « **Ответ #11783 :** 19 Ноя 2025 [07:51:13] »

Цитата: skvj от 19 Ноя 2025 [07:29:10]

Какие контекстные окна можно будет включить? ну, чтоб по настоящему заработали.

Мощности не имеют никакого отношения к предоставляемому окну. Вопрос в экономике. Чем больше оно, тем дороже обрабатывать каждый запрос пользователя и рост затрат идёт экспоненциальный с ростом окна. Есть конечно архитектуры и всякие способы сократить этот бешенный рост. Но всё равно, всё упирается в деньги, деньги и ещё раз деньги. Ни одна компания не готова платить сотни баксов за бесплатные запросы пользователей. Сотни баксов за каждый запрос.

skvj · « **Ответ #11784 :** 19 Ноя 2025 [08:08:18] »

Цитата: BlackMokona от 19 Ноя 2025 [07:51:13]

Цитата: skvj от 19 Ноя 2025 [07:29:10]
Какие контекстные окна можно будет включить? ну, чтоб по настоящему заработали.
Мощности не имеют никакого отношения к предоставляемому окну. Вопрос в экономике. Чем больше оно, тем дороже обрабатывать каждый запрос пользователя и рост затрат идёт экспоненциальный с ростом окна. Есть конечно архитектуры и всякие способы сократить этот бешенный рост. Но всё равно, всё упирается в деньги, деньги и ещё раз деньги. Ни одна компания не готова платить сотни баксов за бесплатные запросы пользователей. Сотни баксов за каждый запрос.

Как так? Всё наоборот)) Чем больше кластер (десятки экзаFLOPS условно, а всё придет туда и пойдет ещё выше), тем сильнее падает цена обработки токенов. Экспоненциальный рост вычислительной мощности и оптимизация моделей уменьшают стоимость каждого токена. Можно обеспечить длинные окна не только для облачных Гроков, но и для ИИ-агентов типа Оптимус без значительного роста стоимости работы. Как андроиды будут работать?

BlackMokona · « **Ответ #11785 :** 19 Ноя 2025 [12:28:41] »

Цитата: skvj от 19 Ноя 2025 [08:08:18]

Как так? Всё наоборот)) Чем больше кластер (десятки экзаFLOPS условно, а всё придет туда и пойдет ещё выше), тем сильнее падает цена обработки токенов. Экспоненциальный рост вычислительной мощности и оптимизация моделей уменьшают стоимость каждого токена. Можно обеспечить длинные окна не только для облачных Гроков, но и для ИИ-агентов типа Оптимус без значительного роста стоимости работы. Как андроиды будут работать?

Масштабирование контекста, а не вычислительных мощностей. Контекст в 256 к токенов, обрабатывать на порядок-два, дешевле чем контекст из 2кк токенов

BlackMokona · « **Ответ #11786 :** 19 Ноя 2025 [12:30:55] »

Антрофик решили перенести бечмарк торговых автоматов в реальный мир. Дав возможность ИИ управлять торговыми автоматами у себя в офисе.
Сначала из-за мошенничества сотрудника, добавили финансового консультанта для ИИ. Консультант тоже ИИ.
На второй раунд мошенничества, тот уже порывался самостоятельно без помощи людей уведомить ФБР о злобном хакерстве.
Когда послать письма не дали, ИИ наотрез отказался дальше заниматься бизнесом.
https://habr.com/ru/news/967890/

skvj · « **Ответ #11787 :** 19 Ноя 2025 [13:25:11] »

Цитата: BlackMokona от 19 Ноя 2025 [12:30:55]

Когда послать письма не дали, ИИ наотрез отказался дальше заниматься бизнесом.

Уволился 😆 да пошли вы все!

Vitaliy · « **Ответ #11788 :** 19 Ноя 2025 [13:27:11] »

NVIDIA и AMD планируют отказаться от выпуска бюджетных видеокарт
Всё из-за дефицита памяти, которую скупают для ИИ дата-центров.
Производителям видеокарт теперь просто не выгодно продавать бюджетные карты, так как маржа будет минимальной.
Под нож могут попасть народные модели карт: RTX 5060, 5060 Ti и RX 9060, 9060 XT.

Также очень сильно подорожала буквально за месяц оперативная память.

Rattus · « **Ответ #11789 :** 19 Ноя 2025 [14:23:17] »

Цитата: Vitaliy от 19 Ноя 2025 [13:27:11]

NVIDIA и AMD планируют отказаться от выпуска бюджетных видеокарт
Под нож могут попасть народные модели карт: RTX 5060, 5060 Ti и RX 9060, 9060 XT.

Просто мы уже давно пропустили момент, когда "бюджетная видеокарта" стала стоить и потреблять энергии больше чем весь остальной системник вместе с вполне "раскрывающим" её центральным процессором.
В моём же мире реальных доходов и глубокого заМКАДья, бюджетной является только видеокарта без дополнительного питания и существующая в низкопрофильном форм-факторе - то есть чевтёртый (первый жёлтый) столбец слева на данной диаграмме (красный - "уровень картошки" - уже довольно давно реализуется встройками GPU, для которых видеопамять выделяется из системной ОЗУ).

BlackMokona · « **Ответ #11790 :** 19 Ноя 2025 [15:37:04] »

Цитата: Rattus от 19 Ноя 2025 [14:23:17]

В моём же мире реальных доходов и глубокого заМКАДья, бюджетной является только видеокарта без дополнительного питания и существующая в низкопрофильном форм-факторе - то есть чевтёртый (первый жёлтый) столбец слева на данной диаграмме (красный - "уровень картошки" - уже довольно давно реализуется встройками GPU, для которых видеопамять выделяется из системной ОЗУ).

Сейчас ядра ГПУ даже в процессор напрямую встраивают

skvj · « **Ответ #11791 :** 19 Ноя 2025 [15:47:51] »

Цитата: Vitaliy от 19 Ноя 2025 [13:27:11]

Также очень сильно подорожала буквально за месяц оперативная память.

Так в этом всё и дело, а не в картах.
В ноябре цены на GDDR6 / GDDR7 взлетели на 90–200% из-за AI-бума и Samsung, Hynix переключили мощности на HBM для дата-центров, оставив потребительский рынок голодным, и поэтому! NVIDIA и AMD могут поставить на паузу или отменить бюджетки вроде RTX 5060 и RX 9060. А не сами карты отменять потому что невыгодно. Это же не вопрос выгоды - это свой рынок. Геймерам везёт постоянно)) то из-за майнеров карты стоили в 5 раз дороже, теперь из-за ИИ страдают))

https://texno.org/nvidia-amd-povyshenie-cen-gpu-2026-gddr6-gddr7-a5t

skvj · « **Ответ #11792 :** 19 Ноя 2025 [16:01:17] »

А я знаю одного майнера, у него было 2 железнодорожных полноразмерных контейнера)) с промышленными вентиляторами. Не знаю сколько было карт, но можно примерно представить. И он покупал их по 9000, а спустя 6 лет майнинга, обслужил и продал по 45000 оптом 😆

Vitaliy · « **Ответ #11793 :** 19 Ноя 2025 [18:26:19] »

Цитата: BlackMokona от 19 Ноя 2025 [15:37:04]

Цитата: Rattus от 19 Ноя 2025 [14:23:17]
В моём же мире реальных доходов и глубокого заМКАДья, бюджетной является только видеокарта без дополнительного питания и существующая в низкопрофильном форм-факторе - то есть чевтёртый (первый жёлтый) столбец слева на данной диаграмме (красный - "уровень картошки" - уже довольно давно реализуется встройками GPU, для которых видеопамять выделяется из системной ОЗУ).
Сейчас ядра ГПУ даже в процессор напрямую встраивают

Я такой и собираюсь брать. Для "офисной работы" достаточно.

BlackMokona · « **Ответ #11794 :** 19 Ноя 2025 [21:35:34] »

ОпенАИ в срочном порядке отправляют свою новую модель в бой.
https://habr.com/ru/news/968164/

BlackMokona · « **Ответ #11795 :** **Вчера** в 11:55:58 »

Неожиданно и нежданно не гадано.
Вышел Грок 4.1 Фаст. С контекстным окном в 2 миллиона токенов
https://habr.com/ru/news/968292/

Olweg · « **Ответ #11796 :** **Вчера** в 14:32:55 »

Цитата: Olweg от 23 Окт 2025 [10:06:59]

Цитата: Olweg от 04 Ноя 2024 [10:41:58]
Интересный бенчмарк для языковых моделей:
https://simple-bench.com/index.html

Задаются заковыристые вопросы на здравый смысл. Люди правильно отвечают в среднем на 84% вопросов, «интуитивные» модели - максимум на 27.5%, модели с рассуждениями - на 41.7% (o1-preview) и 41.4% (новый Claude 3.5 Sonnet).
Провели тест для GPT-5 Pro - набрала 61.6%. Первое место уже скоро 5 месяцев удерживает Gemini 2.5 Pro версии от 6 июня. 4.5 месяца - срок немалый для такой быстро развивающейся области. Такое впечатление, что LLM действительно выходят на плато. Нужны новые подходы.

Gemini 3 набрал 76,4%. Плато преодолено

До человеков осталось всего ничего...

Polnoch Ксю · « **Ответ #11797 :** **Вчера** в 22:49:48 »

Цитата: BlackMokona от Вчера в 11:55:58

С контекстным окном в 2 миллиона токенов

Я очень скептична к этому. Гугловские(включая gemini-2.5pro) и метавские окна такого размера не работали, модель тупела и галлюционировала вплоть до уровня gpt-4, если не gpt-3.5.

Кто-нибудь тестил? Скидывал там книгу, по которой модель не обучали, и чтобы она могла цитаты от туда писать, ну и знать общий ход событий в деталях? Я думаю, это ненастоящее контекстное окно, а с какими-то хитрыми хаками, которые на самом деле не работают (точнее, модель будет что-то знать на тему того, что ей скинули, но далеко не всё и очень приблизительно, с галлюцинациями)

Все LLM, что я видела в жизни, эпично флопались на тесте по художественным книгам или большой кодовой базе (разве что дип ресёч по гитхаб репозиторию немного справляется). Да, и автономные кодинг агенты тоже: моделям как минимум до ноября 2025го нужно бить код на небольшие модули даже больше, чем человеку

У антропика это честнее сделано: claude честно показывает, как ковыряется в большом количестве токенов с помощью специальной тулзы, а не напрямую

Polnoch Ксю · « **Ответ #11798 :** **Вчера** в 23:07:49 »

ну что ж, я только что проверила грок 4.1 фаст с художественной книгой в файле с промтом прочитать главу в середине и рассказать, как потом это влияет на сюжет, ничего не пропуская.

Модель, в целом, справилась с рассказом о главе, номер которой я указала (хотя она зачем-то начала почти полностью её печатать, и не дословно, а пересказывая, но не суть), а вот то, как это используется в дальнейшем сюжете нагаллюционировала с уверенным видом, как это всегда и бывает.

Короче я думаю, Маск сделал то же, что и Антропик, только соврал что это не хитрые хаки с помощью тулзы, а прям настоящее контекстное окно

Stalk.er

Компания Figure AI завершила почти годичные испытания человекоподобных роботов Figure 02 на заводе BMW в Спартанбурге (Южная Каролина, США). Роботы трудились с понедельника по пятницу в 10-часовых сменах, едва не потеряв руки к концу испытания. Компания с гордостью показывает исцарапанные корпуса, ладони и другие части тел роботов, заменивших человека на одной из неудобных ручных операций по сборке автомобилей.
В рамках пилотного проекта человекоподобные роботы пятого поколения Figure 02 с января 2025 года работали на реальной сборочной линии, выполняя операцию по вставке заготовки из листового металла в сварочные приспособления для кузова автомобиля BMW X3. За время эксплуатации парк из нескольких роботов помог собрать более 30 000 автомобилей, пропустив через свои руки свыше 90 000 деталей и прошагав по цеху около 320 км.

За время эксперимента роботы отработали более 1250 часов. На каждую операцию по установке заготовки для сварки у одного робота уходило 84 секунды. Точность выполнения операции с 5-мм допуском превысила 99 %. Роботы работали в две смены по 10 часов, 5 дней в неделю в жёстких промышленных условиях.
Несмотря на неплохие и, возможно, даже успешные показатели, разработчик принял решение вывести из эксплуатации весь парк моделей поколения Figure 02 — фактически «отправить роботов на пенсию». Компания начала плановый переход на следующее поколение моделей — Figure 03. В процессе работы на конвейере у второго поколения роботов выявился конструктивный недостаток: частые поломки предплечий из-за нагрузки на кабели и приводы манипуляторов .

Компания полностью переработала архитектуру рук, повысив надёжность механики и устранив причины повреждения кабелей и сочленений. В целом испытания показали, что роботы даже первых поколений могут справляться с достаточно тяжёлой работой в настоящих заводских условиях.
Полученные данные позволят компании быстро нарастить производство моделей поколения Figure 03 и уже в 2026 году начать коммерческие поставки клиентам, включая BMW. Директор Figure, Бретт Эдкок (Brett Adcock), подчеркнул, что «боевые шрамы» роботов — лучшее доказательство реальности технологии и её готовности к массовому внедрению в промышленность.
https://3dnews.ru/1132703/posle-10-mesyatsev-raboti-na-konveyere-bmw-u-chelovekopodobnih-robotov-figure-02-nachali-otvalivatsya-ruki

Новости:

A A A A Автор Тема: Пределы автоматизации и внедрения роботов (Прочитано 444585 раз)