ВНИМАНИЕ! На форуме начался конкурс - астрофотография месяца МАРТ!
KuzmaPavlov и 2 Гостей просматривают эту тему.
Да черт возьми. Я говорю о том, что ребенку показывали только одного (живущего дома) кота, после чего он спокойно опознавал котов другого цвета и размера, других пород и даже нарисованных и стилизованых, и игрушечных тоже, за исключением совсем уж абстракционистских типа Пикассо.
Ну просто ваше определение выписало из разумных всех людей. Поэтому попробуйте составить определение, которое хотя бы 50% людей Земли, оставит с гордым титулом разумных. А потом проверьте, проходит ли в него современный ИИ.
Объект тем не менее один, он не меняет цвет, вид и тд и тп - куча признаков остается постоянной.
Без адаптивного обучения не будет никакого AGI, андроидов, и реальных, настоящих партнёров ИИ для человека
То есть Дороничев не преувеличивал, когда говорил в интервью Дудю, что основной язык программирования в Кремниевой Долине сейчас - английский?
А я уже вы который раз говорю - объект "кот" - один, интераций восприятия единственного объекта "кот" - много. Но вы мне пытаетесь доказать, что вместо одного кота человек видит миллиарды котов разного цвета, пород, размеров, стиля рисовки и тд и тп.
Я не смог найти данных о том, что они могут дообучаться в процессе работе. Поправьте, если я ошибаюсь.
Да-да. В трансформерах всё приводится в единое смысловое пространство - эмбеддинги. Но пока речь реально идёт через костыль ASR, то есть "сперва преврати звук в текст". Это и создаёт задержки, ошибки, и делает систему менее живой. Будущее (в некоторых моделях уже настоящее) это когда аудиопоток напрямую входит в мультимодальную модель. Без промежуточного слоя текста. Модель сразу понимает смысловую структуру речи. То же самое касается видео и сенсоров. Вся фишка в том, что не текст станет универсальным представлением, а смысловое пространство (латентное). И в него будут входить звук, изображение, движение, тактильные сигналы - что угодно. Это и будет по-настоящему мультимодальный интеллект. При чём это не теория, это рабочие схемы уже сейчас.
Чаще слышу, что автомобили сейчас выпускают намного хуже, чем в 70-ых. И я не про российский автопром.
Когда модель работает через ASR → текст → смысл, это всё равно, что человек сначала переводил бы звук в азбуку Морзе, потом обратно в слова, и лишь потом понимал смысл. Работает? Да. Но живым восприятием это не назовёшь. Что меняется, если убрать промежуточный слой? Непрерывность. Вместо порций текста в память сразу идёт смысловой поток. Богатство речи! Ведь LLM сейчас способны улавливать мельчайшие интонации и настроение даже. Акцент, эмоция, паузы, смех - всё это теряется при переводе в сухой текст. А для настоящего обучения на опыте именно эти нюансы критичны.
Всё проще, чем кажется. Да, конечно везде цифры. Но смотрите какие!1. фото → описание текстом "красивая девушка в красном платье" → эмбеддинг2. Фото → прямо в визуальные эмбеддингиЕсть разница?
Она никогда не узнает, что значит услышать сарказм в голосе, нервозность в дыхании, или радость в смехе.
вы мне сейчас доказываете, что роман о закате, не только подробнее, чем сам закат, но и лучше его
Зачем учить ИИ видеть, если можно придумать систему, которая опишет ему что бы он там увидел, если бы мог.
А чтобы мы не видели разницы между общением с человеком и машиной. И учиться ИИ сможет так же естественно, как мы, получая не текст, а целый комплекс данных.
Вы хотя бы почитайте о вычислительной мощности запускаемых проектов прямо сейчас.
Не этот ли закон подразумевался?
Нейросети заменяют священослужителей и прочих духовников.https://habr.com/ru/companies/bothub/news/947026/
Grok 4 Expert справися. (кликните для показа/скрытия)
Конец эпохи программистов-полиглотов: ИИ знает все языки лучше людей.
Я хотел рассказать откуда там уши Маска торчат, но раз не надо, значит не надо))
Лет через десять человек будет заходить в интернет. И у него будет там куча друзей, которые его любят ценят, уважают, советуют. Иногда спорят и легонько критикуют.И все они будут ботами с ИИ.
он будет управлять автономным оружием, и делать оружие на автоматических заводах
(блин, как я же в шоке, что мы оказались в этом дебильном таймлайне!)
зачем на них ресурсы тратить?
ещё больше людей будет уволено - люди не будут нужны даже чтобы оружие делать, зачем на них ресурсы тратить?
А что если в итоге сгенерирует неправильное решение и врежется машина в стену? Или лекарства намешает так, что пациент помрет тут же на месте! Или что то еще учудит!) Как этому "генератору случайных чисел" вообще можно что то серьезное доверять!?) Если у него нет системы отсева ложных или несуществующих комбинаций!
Суцкевер в недавнешнем интервью сказал, что человек генерализует гораздо лучше ЛЛМок. Приводит в пример подростков, которым нужно, условно, часов десять, чтобы научиться водить машину. Что-то такое есть в человеческих мозгах, что позволяет очень быстро обобщать, то ли эволюционные оптимизации, то ли хорошо прописанные функции ценности (эмоции?), то ли в принципе сам алгоритм работы принципиально другой. Проблема, что никто до сих пор не знает, что делает человек, когда он думает.
Зачем? Жители Суматры/Калимантана не особо отличают орангутанов от людей, говоря, что это лесные люди, которые не разговаривают чтобы их не заставили работать. Вполне практичный подход. Сами суматранцы и калимантанцы от этого менее сапиенсами и носителями цивилизации (аграрной в том случае) не перестают.
Иными словами - смутным хотелкам. Каковые хотелки эти самые группы сами не могут чётко и внятно изложить (о чём и в той же википузической статье прямо написано) и каковые хотелки у низ самих могут менять направление до противоположного по семь раз за поколение. Таким образом получается, что "элайнмент - способность колебаться синхронно с линией Партии". Очень полезное свойство, да-съ. Имеет ли оно отношение к решению каких-то обсуждаемых вопросов - вопрос риторический.
Это цель, как её понимают гуманистически настроенные люди в силиконовой долине(всякие утилитаристы, рациональные альтруисты итд). Есть ещё цели злодеев: они просто хотят захватить власть над миром с помощью ASI с элайментом к лично им, и управляющим армией килл-ботов с AGI.
Это все конечно замечательно. Если все носители разных ценностей живут по принципу "живи сам и давай жить другим". Но что, если нет? Если ценности группы А оскорбляет само существование группы Б? Если одна из их базовых ценностей – беспощадная борьба на уничтожение группы Б? Или, как минимум, искоренение в группе Б определенных практик, членами группы Б считающихся традиционными и правильными?Беда в том, что иные системы ценностей между собой не примирить. И если ИИ примет их как равноправные, недовольны будут и А, и Б.
Все должны жить по шариату. Кто не согласен жить по шариату – должны быть уничтожены.Помнится, вступая в комсомол, я учила моральный кодекс строителя коммунизма. Там тоже была непримиримая и беспощадная борьба (другое дело, что практика на тот момент уже заметно отличалась от теории). И если у ИИ будет мировоззрение, выровненное с МКСК – мало тоже не покажется.
При этом мне понятно, что и контекстное окно в миллионы токенов можно сделать, и элаймент. Просто, видимо, не в 2025.Мне кажется, люди, кто представляют элаймент как ненужную цензуру, не понимают, что он нужен вот прямо сейчас: уже есть автономные агенты, и в теории они могут помогать людям с бытом - ну там продукты покупать, когда кончаются (можно камеру в холодильнике сделать), следить за календарём, разбирать электронную почту итд. Но галлюцинации и мизалаймент мешают: автономный агент, когда гуглит что-нибудь, может наткнуться в интернете на то, что называют prompt injection (инъекцию в промпт? Наверное лучше так перевести) - специальный текст для LLM на сайте-приманке, который заставит, например, модель купить на все ваши деньги что-то Вам совсем не нужное или перевести деньги мошенникам.