ВНИМАНИЕ! На форуме начался конкурс - астрофотография месяца МАРТ!
Dvd и 10 Гостей просматривают эту тему.
Вот образец ДИНАМИЧЕСКАЯ ГРАВИТАЦИОННАЯ СЕТЬ КАК ПРИРОДА ТЕМНОЙ ЭНЕРГИИ. Но как распознать, по какому критерию, что он искусственно создан? Я за такую задачу, честно скажу, не взялся бы...
Это все конечно замечательно. Если все носители разных ценностей живут по принципу "живи сам и давай жить другим". Но что, если нет? Если ценности группы А оскорбляет само существование группы Б? Если одна из их базовых ценностей – беспощадная борьба на уничтожение группы Б? Или, как минимум, искоренение в группе Б определенных практик, членами группы Б считающихся традиционными и правильными?Беда в том, что иные системы ценностей между собой не примирить. И если ИИ примет их как равноправные, недовольны будут и А, и Б.
Таким образом получается, что "элайнмент - способность колебаться синхронно с линией Партии". Очень полезное свойство, да-съ. Имеет ли оно отношение к решению каких-то обсуждаемых вопросов - вопрос риторический.
А совершенная что должна делать - вообще никак не отвечать на вопросы со словами "угон, воровство, наркотики, оружие" и т.п.? Типа как Ютуб нынешний, забанивший слова "самоубийство" и т.п. Наверное Роскомпозор РФ забанивший некогда свой собственный список "экстремистских материалов" имел таки совершенный элайнмент. Строго по Эпимениду и Гёделю с тьюрингом.Ну и называть "элайнментом" элементарную цензуру, только в отношениии ИИ-выдач (то есть ограничение на распространение любых неперсональных данных) - это, конечно, очень толерантно и политкорректно, да-съ.
Зачем? Жители Суматры/Калимантана не особо отличают орангутанов от людей, говоря, что это лесные люди, которые не разговаривают чтобы их не заставили работать. Вполне практичный подход. Сами суматранцы и калимантанцы от этого менее сапиенсами и носителями цивилизации (аграрной в том случае) не перестают.
Иными словами - смутным хотелкам. Каковые хотелки эти самые группы сами не могут чётко и внятно изложить (о чём и в той же википузической статье прямо написано) и каковые хотелки у низ самих могут менять направление до противоположного по семь раз за поколение. Таким образом получается, что "элайнмент - способность колебаться синхронно с линией Партии". Очень полезное свойство, да-съ. Имеет ли оно отношение к решению каких-то обсуждаемых вопросов - вопрос риторический.
Это цель, как её понимают гуманистически настроенные люди в силиконовой долине(всякие утилитаристы, рациональные альтруисты итд). Есть ещё цели злодеев: они просто хотят захватить власть над миром с помощью ASI с элайментом к лично им, и управляющим армией килл-ботов с AGI.
Все должны жить по шариату. Кто не согласен жить по шариату – должны быть уничтожены.Помнится, вступая в комсомол, я учила моральный кодекс строителя коммунизма. Там тоже была непримиримая и беспощадная борьба (другое дело, что практика на тот момент уже заметно отличалась от теории). И если у ИИ будет мировоззрение, выровненное с МКСК – мало тоже не покажется.
означает ли это, что он уже умнее тех аишников, кто запреты ставил?
Те же яйца: значит мы берем пустую операционку с программой обучения и подростка с 16 годами предобучения (с 16 лет теперь можно?)+целый инструктор - и ой, чёт подросток доучивается быстрее.Тогда как правильное, адекватное сравнение: пустая операционка +младенец, или вставил флэшку- и обучил на уровне аса быстрее чем подросток пристегнул ремень.
А вот военный истрибитель или тем более атомная бомба у гражданского лица быть не должны.
Наличие истребителя у гражданского лица гораздо менее опасно, чем кажется - если собираешься его использовать - его надо где-то хранить, заправлять, заряжать, уметь им управлять - это огромные накладные расходы (не говоря уже о невозможности незаметного использования самолета), а без них самолет - просто музейный экспонат, куча металла, каким бы страшным он вам не казался. При этом обычное огнестрельное оружие имеет гораздо меньше накладных расходов и именно поэтому использовать его гораздо проще. А кухонный нож или дубина их вообще не имеют. И именно поэтому большинство убийств совершаются кухонными ножами и кирпичами, подвернувшимися под руку. Ваш пример - это ошибка минимизации минимальных рисков.
частные лица могут покупать военные истребители
ни AGI ни ASI - сами по себе не восстанут: у одного команды не было, а своих желаний еще нет, а второму - оно нафиг не надо, как нам нет дела до бактерий на 10м под землёй.
Наличие истребителя у гражданского лица гораздо менее опасно, чем кажется - если собираешься его использовать - его надо где-то хранить, заправлять, заряжать, уметь им управлять - это огромные накладные расходы (не говоря уже о невозможности незаметного использования самолета), а без них самолет - просто музейный экспонат, куча металла, каким бы страшным он вам не казался.
представьте мир, в котором частные лица могут покупать военные истребители. Как бы в нём выглядела атака 9/11, или взрывы метро в России, которые устраивали исламисты?
Ну а что касается ASI систем, тут риски без элаймента умножаются многократно.
современные модели - они готовы шантажировать
Draken International, LLC — американская частная военная компания, предоставляющая боевые самолеты различным клиентам. Центральный офис компании расположен в международном аэропорту Лейкленд Линдер[англ.], штат Флорида, а дополнительная операционная база — на авиабазе Неллис, штат Невада.
Компания владеет примерно 150 истребителями, что делает ее обладателем крупнейшего в мире частного флота боевых самолетов
При этом мне понятно, что и контекстное окно в миллионы токенов можно сделать, и элаймент. Просто, видимо, не в 2025.Мне кажется, люди, кто представляют элаймент как ненужную цензуру, не понимают, что он нужен вот прямо сейчас: уже есть автономные агенты, и в теории они могут помогать людям с бытом - ну там продукты покупать, когда кончаются (можно камеру в холодильнике сделать), следить за календарём, разбирать электронную почту итд. Но галлюцинации и мизалаймент мешают: автономный агент, когда гуглит что-нибудь, может наткнуться в интернете на то, что называют prompt injection (инъекцию в промпт? Наверное лучше так перевести) - специальный текст для LLM на сайте-приманке, который заставит, например, модель купить на все ваши деньги что-то Вам совсем не нужное или перевести деньги мошенникам.
Интересно как и чем они шантажируют?
Вы сами дали вашей Алисе ключи от карты и отправили с запросом купи мне что-нибудь полезное? Феерически "мудрый" поступок...
Я разумеется ей не доверяю - вот через поколение-два ИИ станут надежнее, и тогда и банковскую карточку можно будет подключить, и даже как говорящий интерактивный автоответчик на телефоне использовать - это уже и сейчас технически возможно, но я совсем не доверяю тому, что машина наговорит. Можно и для звонков использовать, когда лень на это время тратить своё, но опять же проблема низкой надежности.Из России возможно не очень понятно вот это про автоответчик - это часть местной культуры в Северной Америке, тут очень любят голосовые сообщения.
Вы думаете, что AGI система ничего такого не сделает: мизалаймент и опасное поведение демонстрируют и современные модели - они готовы шантажировать, обманывать людей в определенных случаях: https://www.axios.com/2025/06/20/ai-models-deceive-steal-blackmail-anthropic
Единственное, в чем я вижу прореху в вашей логике- вы считаете, что алаймент(идеальный и непогрешимый, которому можно будет доверять) существует или может существовать,
или может существовать
А как вы себе представляете концептуальную реализацию алаймента?