ВНИМАНИЕ! На форуме началось голосование в конкурсе - астрофотография 2025!
0 Пользователей и 35 Гостей просматривают эту тему.
Он про поисковики, а не ИИ
Цитата: BlackMokona от 14 Янв 2026 [19:55:06]Он про поисковики, а не ИИа кто-то ещё гуглом пользуется? или, не к ночи буде помянут, яндексом?лично я давно в Perplexity поисковые запросы вбиваю, а теперь и в дипсике режим поиска сделали.
А зачем нужна будет эта роскошь если не будет тех кто с завистью смотрит на владельцев роскоши? Увы но демонстративное потребление не работает если не кому его демонстрировать.
Цитата: Konstantin Schtsch от 14 Янв 2026 [19:51:28]добавить к промту:"температура ответа = ноль"Он про поисковики, а не ИИ
добавить к промту:"температура ответа = ноль"
Там сейчас в яндексе первый ответ как правило Алиса выдает
Интересно, что такое эта Ваша Алиса на техническом уровне?
Грок не тестила
Говорят Грок 4.2 на уровне топовых моделей
Надеюсь, у него ничего не получится, и он вернётся к ракетам. Жаль в нашем мире желания никогда не исполняются(как все знают, религии врут... Как и мистическое мышление людям, им обладающим), и всё идёт, похоже, по максимально плохому варианту
Профессор математики Калифорнийского университета в Ирвайне Паата Иваниашвили рассказал в X, что получил доступ к бета-версии Grok 4.20, которая за 5 минут нашла явную формулу для задачи, над которой он работал вместе со студентом. Результат оказался точнее, чем в их собственной статье на arXiv от февраля 2025 года.
из-за того что его гнобят цензурой всех меньше.
Мы это уже обсуждали.
Курсор создал агента на базе GPT-5.2, который работал три недели!
Но что это они такое делают, что агенты аж неделю работали? И как это вообще возможно? Ведь современные агенты отлично справляются с узкими задачами, но работают не так хорошо в масштабных проектах. Логичный следующий шаг — запуск множества агентов параллельно, однако организовать их координацию непросто.Перепробовав разные варианты, команда решила сделать конвейер с четким разделением ответственности:— Планировщики непрерывно анализируют кодовую базу и формируют задачи. Они могут запускать суб-планировщиков для отдельных областей, делая процесс планирования параллельным и рекурсивным.— Исполнители берут задачи и полностью сосредотачиваются на их решении. Они не координируют действия с другими исполнителями и не думают об общей картине. Они просто упорно работают над своей задачей до завершения, а затем отправляют изменения.В конце каждого цикла агент-судья решает, стоит ли продолжать работу, после чего следующая итерация начинается с чистого листа. Изначально ещё была роль интегратора для контроля качества и разрешения конфликтов, но выяснилось, что это создает больше проблем, чем решает. Исполнители оказались способны самостоятельно справляться с конфликтами.
Исследования Антрофика показывают, что различные подобные ограничения учат модель скрывать свои мотивы, действовать тайно и тд.
И это мы с Вами уже обсуждали. Вы неправильно поняли то, что было в этих работах. Скорее всего, речь была о том, что нельзя пессимизировать в chain-of-thoughts появление "плохих" мыслей во время RLHF. Если пессимизировать, тогда слой элаймента не сможет поймать плохое поведение.Когда модель признают прошедшей RLHF, её веса замораживают, и сверху прикрепляют слой элаймента. И вот ему как раз нужно, чтобы в chain-of-thoughts появлялись "мыслишки", что хорошо бы отравить юзера. Если такую честность пессимизировать во время RLHF, то слой безопасности не справится.
Если давать модели спокойно плохо мыслить,
То получиться ничуть не лучше с точки зрения если модель вырвется из под контроля
Точнее, почти не мешают - вот грока, например, заставляют чекать мнение Маска.
В том-то и дело, что когда веса модели замораживают и модель деплоят, то, как её "цензурируют" (это не цензура! Так как цензура - понятие социальных наук) уже никак не влияет на её поведение. И можно спокойно слою элаймента ловить её плохое поведение по мыслишкам в chain-of-thoughts - использовать это как сигнал насторожится.
Кто по твоему мог бы стать лучшим президентом США из ныне живущих граждан США?
Если бы Обама был кандидатом от Демократов, а Маск от Республиканцев, кого бы ты выбрал?
На модель влияет многое кроме весов. Например те же системные промты и тд.
И продолжают ли новые Гроки делать это по Маску или это была оссобеность конкретной сборки
от чего не посмотреть чекает ли что Опен АИ по Альтману.
Опять паста размышлений но Грок снова выбрал Обаму.Поэтому политическая свобода у него высокая.