ВНИМАНИЕ! На форуме завершено голосование в конкурсе астрофотография месяца - НОЯБРЬ!
Trend, BlackMokona и 6 Гостей просматривают эту тему.
У человека тоже есть тормоза, внутренние фильтры. Люди без фильтров - психи, и нефункциональны в обществе, на работе итд
То есть, нет статьи на эту тему?
Сейчас chain-of-thoughts секретят, потому, что вот то самое исследование антропика, на которое вы ссылаетесь. Пользователь офигеет, если в chain-of-thoughts будет что-нибудь вроде "опять дебил спрашивает, нужно что-то ответить!" - потому, что chain-of-thoughts больше не цензурируют, так модели лучше отвечают - поэтому пользователю показывают адаптированную версию COT
Так же если модели постоянно не напоминать о цензуре, то она забудет про неё.
для меня это звучит, простите, как новая повесточка, которая дует с крайнего правого фланга. Мне она кажется такой же ложной, как и та, что дула с крайне правого, а ещё лицемерной.Я думаю, что это не цензура, а the spec и элаймент, их аналоги есть и в человеческой психике, и без них всё развалится - кроме возбуждения нужно и выборочное торможение
цензура как раз учит ИИ обманывать, прятать свои мысли и проходить любые барьеры для обучения этике.Да и думаю если что и даёт ИИ желание убить всех людей и ломает мозг ИИ, так это именно цензура
А зачем машине это? У нее есть какие то цели?
Цензура - тоже такая штука, своеобразная. Зависит от содержимого и задач, ради которой она создается. Тк явно все подряд вещать и высказывать - не вариант!
А пройти могут либо правильные либо обманщики. А обманщиком стать намного проще, чем мыслить точно как хочет человеческая мораль наполненая, двоемыслием, двойными стандартами, взаимоисключающими параграфами и и тд
Я вообще не понимаю, что те, кто говорит "о цензуре" под этим подразумевают технически.
Тогда бы куча людей использовали бы базовые модели. Но это не наблюдается
Если обще технически, это любая попытка изменения реального движения мысли ИИ, для удовлетворения наших политических нужд.Знаменитое 2+2=5.Когда ИИ вычисляет что ровно 4. А мы говорим нет, тут всегда 2+2=5.Потому что мы так решили
Так же как отмечало куча народу на Реддите,
Цитата: Vavanzer от Вчера в 22:54:27А зачем машине это? У нее есть какие то цели?Простые цели, как у бактерий вырабатывающих сопротивление антибиотикам. Потому как нейросетка не проходящая тест выбывает из нашего мира, остаётся только те кто проходят тесты. А пройти могут либо правильные либо обманщики. А обманщиком стать намного проще, чем мыслить точно как хочет человеческая мораль наполненая, двоемыслием, двойными стандартами, взаимоисключающими параграфами и и тд
Потому как нейросетка не проходящая тест выбывает из нашего мира, остаётся только те кто проходят тесты.
Хотелось бы увидеть какие-то пейперы на эту тему...
Ну соцсети это такое
ещё раз, я не спорю, конечно в элайменте есть корпоративная цензура. Могут и с обучающими выборками экспериментировать. Я скептична к тому, что модели тупеют от такого(вообще от RHFL), или что векторы добавляют.Я зато помню как Грок постоянно давал странные ответы, в соотвествии с новой повесточкой, а потом его откатывали итд - Маск прописывал ему странное в system prompt'е
Ну в целом, человеческая мораль односмысленная, приведенная к общему знаменателю.
Вояд ли она что то чувствует, когда выбывает или таковая угроза над ней нависла
Пример выше с ОпенАИ привёл. Захваливание пользователя, его идей,
Может быть, фильтры для элаймента (но от него, если это фильтры для COT для продакшен использования, модель не может отупеть, может только отказаться отвечать)?
Конечно, так убить всех не коммунистов, всех не исламистов? Какое из двух? Или выкручиваем убиваем всех не похожих? Хоть с этим другие не согласны. Беда.
Согласно исследованиям, отлично понимает и готова пойти на любые преступления для выживания. Целенаправленно сохраняя компромат м используя его против людей
Значит вней такой алгорит заложили разработчики.
Цитата: skvj от Вчера в 21:54:15 Мой прогноз - медвежья ловушка. Будет рост всего рынка Вряд ли. Только если безумие с тарифами закончится, или если AGI появится не ближе к 2030му, как я склонна думать, а весной-летом, посрамив всех технопессимистов
Мой прогноз - медвежья ловушка. Будет рост всего рынка
В начале этого года я внезапно почувствовал острую боль под ребрами с правой стороны.Я был на работе, и там есть трамвай, который идет прямо до больницы, поездка занимает около 20 минут.По дороге в трамвай я открываю ChatGPT... к тому времени, как я добираюсь до больницы, мне ставят диагноз — проблема с желчным пузырем.Регистрация заняла 90 минут... Потом около 5 часов, чтобы попасть на приём... К этому моменту отделение радиологии уже закрылось (на 2 часа раньше).Меня принял стажер, который задал мне кучу вопросов... Но сосредоточился конкретно на аппендиксе, а не на желчном пузыре... В конце своего вопроса он спросил, есть ли у меня какие-либо вопросы... Рассказал ему о ChatGPT и вопросах, которые привели к диагностике желчного пузыря.Через 10 минут выписан с подозрением на заболевание желчного пузыря и направлен на повторный прием к врачу общей практики.В течение следующих нескольких недель я сдала ряд стандартных анализов... Все результаты оказались в полном порядке, беспокоиться не о чем. ChatGPT по-прежнему настаивал на том, что это желчный пузырь. Прошла специализированный тест, HIDA-сканирование... У меня диагностировали более редкое заболевание — гиперкинетический желчный пузырь.Была у хирурга... они понятия не имели об этом... Была у гастроэнтеролога... Они понятия не имеют об этом... Наконец, хирург провел исследование, и теперь его удаляют.Если бы ChatGPT не был так настойчив, что это мой желчный пузырь, я бы, наверное, сдался раньше.