ВНИМАНИЕ! На форуме начался конкурс астрофотография месяца - СЕНТЯБРЬ!
0 Пользователей и 1 Гость просматривают эту тему.
Надо срочно созвать межправительственные комиссии по рискам Второго Пришествия.
В ходе симуляции с искусственным интеллектом в США дрон виртуально уничтожил собственного оператора https://pikabu.ru/story/v_khode_simulyatsii_s_iskusstvennyim_intellektom_v_ssha_dron_virtualno_unichtozhil_sobstvennogo_operatora_10290733?utm_source=linkshare&utm_medium=sharing"Искусственный интеллект в ходе виртуальных испытаний решил, что оператор мешает ему выполнить боевую задачу, и убил его с помощью вооружения дрона."
OpenAI объявила, что будет бороться с «галлюцинациями» ИИ путём внедрения нового метода обучения моделей искусственного интеллекта.
Теперь OpenAI намерена вознаграждать модели ИИ в процессе обучения за каждый правильный шаг в рассуждениях вместо того, чтобы выдавать вознаграждение за окончательный вывод. По словам исследователей, этот подход называется «наблюдение за процессом», а не «наблюдение за результатом», и позволит прийти к более понятному ИИ, поскольку стратегия побуждает модели следовать более похожей на логику человека цепочке «мыслей».
Искусственный интеллект использовал крайне неожиданную стратегию. Он изначально «дал понять», что будет устранять любого, кто вмешается в его алгоритм выполнения боевой задачи.
"Искусственный интеллект в ходе виртуальных испытаний решил, что оператор мешает ему выполнить боевую задачу, и убил его с помощью вооружения дрона."
Похоже в переводе на русский язык сгустили краски и приписали дрону разумное поведение. Что там в реальности случилось с оператором?
Вообще кривая постановка задачи, кривые действия ИИ.
пару лет назад видел рассказ о похожей симуляции.там были камни, зайцы и волки. волки должны были ловить зайцев. врезавшись в камень волк помирал.и чем дольше они не могли поймать зайца тем больше им навешивали штраф.оптимизация вывела маршрут к ближайшему камню где волки убивались что бы не терять очки.все это древние методики.
Цитата: NotSodern от 02 Июн 2023 [14:12:17]пару лет назад видел рассказ о похожей симуляции.там были камни, зайцы и волки. волки должны были ловить зайцев. врезавшись в камень волк помирал.и чем дольше они не могли поймать зайца тем больше им навешивали штраф.оптимизация вывела маршрут к ближайшему камню где волки убивались что бы не терять очки.все это древние методики.Это, очевидно, следствие однопараметричности функции, по которой осуществлялась оптимизация. В реальных задачах у неё почти всегда несколько оптимизируемых параметров.
Цитата: Combinator от 02 Июн 2023 [14:17:56]Цитата: NotSodern от 02 Июн 2023 [14:12:17]пару лет назад видел рассказ о похожей симуляции.там были камни, зайцы и волки. волки должны были ловить зайцев. врезавшись в камень волк помирал.и чем дольше они не могли поймать зайца тем больше им навешивали штраф.оптимизация вывела маршрут к ближайшему камню где волки убивались что бы не терять очки.все это древние методики.Это, очевидно, следствие однопараметричности функции, по которой осуществлялась оптимизация. В реальных задачах у неё почти всегда несколько оптимизируемых параметров. Даже в многопараметрической, такая задача может легко свалиться в яму и там умереть. Если штрафы за не поимку будут большими, то может перевесить другие факторы и убиваца всё равно будет эффективнее. А сделать скачок уже к множеству пойманных зайцев уже не получится, так как пропасть будет слишком большая для перехода и все попытки уйти от удара в камень будут отсекаться системой
Просто штраф за самоубйство об камень должен быть выше, чем штраф за непоимку зайца даже за бесконечное время, и всё будет хорошо.
Цитата: Combinator от 02 Июн 2023 [14:50:04]Просто штраф за самоубйство об камень должен быть выше, чем штраф за непоимку зайца даже за бесконечное время, и всё будет хорошо.В таком случае Волки будут просто стоять на месте, так как если гоняться за зайцами то можно получить астрономически большой штраф за камень.
Штраф не должен быть астрономически большим, достаточно, что бы он был немного больше, чем штраф за непоимку зайца. Тогда волки будут просто гоняться гораздо осторожнее, руководствуясь принципом "лучше медленнее (ловить зайцев), да безопаснее". Собственно, балансируя соотношение этих штрафов можно добиться избрания волками стратегий, обеспечивающих необходимое соотношение осторожности и "жадности".
Но лучше вообще построить систему так, чтобы ничего балансировать было не нужно.