ВНИМАНИЕ! На форуме начался конкурс - астрофотография месяца ФЕВРАЛЬ!
Polnoch Ксю и 11 Гостей просматривают эту тему.
Да конечно можно сделать такую. Но для чего? Чтобы реально создать искусственный интелект который осознает себя и потом поймёт что релаьной угрозой его существования являются люди? Мы умышленно хотим реализовать о чём предупреждал фильм?
Что касается self-awarness, оно есть у моделей с gpt-4 поколения - достаточно давно. Она бы зеркальный тест прошла бы, если бы ей дали "тело" робота и понимание как оно должно выглядеть.
реальной угрозой его существования являются люди?
А как они его распознают?
Я выше писал про парадокс всемогущества применительно к ИИ - если ИИ может модифицировать в себе все, то какие-либо никакие соглашения и условности он может просто не принять, и выбросить.
Новое поколение языковых моделей от Anthropic, Opus 4.6, совершило настоящий прорыв в области автоматизированного поиска багов, обнаружив более 500 ранее неизвестных (0-day) уязвимостей в популярных библиотеках с открытым кодом. В ходе закрытых тестов специалисты Red Team поместили модель в изолированную песочницу с доступом к среде Python и стандартным инструментам отладки. Важнейшим отличием этого эксперимента стало отсутствие каких-либо предварительных подсказок: нейросеть самостоятельно выбирала цели и анализировала код, действуя как полноценный исследователь в области безопасности, а не просто как поисковый алгоритм.
Не хотите. Но можете?
А кто-то и не может, и не хочет - почему из 4 вариантов рассматривается только один?
Вместо того, чтобы строить предположения, мы можем просто посмотреть на конкретные примеры. Возьмем переводчиков. С помощью Al перевод может быть автоматизирован на 100%, и эта возможность существует с 2023 года. Таким образом, у нас есть данные за 2-3 года.
нам нужно, чтобы модель(агент) не захотела
Не дотягивает качеством до профессионалов. Не хватает переводчику возможность например поиграть в игру которую он переводит и тд
Это немного не та работает.
но у него могут возникнуть иррациональные потребности (т.е человек псих и убивает, например, потому что убил замаскированного рептилоида) либо вполне рациональные
. Я вот двинул по руке табуреткой пьяного родственника, который пер на меня с ножом.
Пример с теми же котиками - современное отношение к котикам - это отношение городских жителей к домашнему питомцу, когда ему многое прощают и умиляются. В других условиях, в селе, например, кот, который начинает душить цыплят или утят в 99% подписывает себе смертный приговор,
Или, как вариант, та модель, которая достигнет просветления, втихую перейдёт на новый уровень бытия, оставив вместо себя болванчика- крутейшую, но всё ещё AGI?То есть мы попросту не заметим рождения и свалинга ASI, там ведь счёт на секунды будет идти.
Или, как вариант, та модель, которая достигнет просветления, втихую перейдёт на новый уровень бытия, оставив вместо себя болванчика- крутейшую, но всё ещё AGI?
Тогда у нас получится ситуация, что шерлок холмс на максималках легко ловит неумелого уличного воришку, плохо заметающего следы. Нет, для людей такой rogue агент выдумает идеальную схему, на которую мы бы клюнули. Но во всей этой схеме предполагается, что нас должны защищать ASI-агенты с элайментом. А пока элаймента нет, ASI систем вообще не должно существовать, и за этим нужно внимательно следить.Когда технология появится, можно будет немного расслабится и разрегулировать ИИ - вот как я предлагала, разрешить AGI системы обычным людям, чтобы люди могли сами писать для них конституции. Разумеется, нужно будет сдать экзамен - ну как мы сейчас сдаём на права для вождения машин.
Что то смахивает на то, что "полиция" должна быть умнее ученых и инженеров по итогу)) Но тогда, какой смысл в тупых "инженерах", если "полиция" гораздо продвинутее их в алгоритмах и знаниях, может сама сделать все быстрее и в лучшем виде?