ВНИМАНИЕ! На форуме завершено голосование в конкурсе астрофотография месяца - НОЯБРЬ!
0 Пользователей и 4 Гостей просматривают эту тему.
И так то нормально меньше мозг иметь.
Это уже к критерию обучения и запроса.
АльфаЗеро помогли синтетические данные.
А вот тут, кстати, важный момент лежит: действительно сильный ИИ на Наш взгляд должен прежде всего обрести самокритичность - осознать собственные ограничения и понять какие из них объективны. Т.е. развить рефлексию до сократического уровня, а не галлюцинировать в ответ на запрос за пределами достоверно моделируемого из известных данных.Но при этом максимально подробно и убедительно аргументировать - почему этот запрос лежит за этими пределами и насколько они (не)преодолимы.И вот тогда, когда машина с признанно превосходящим интеллектом доступно объяснит способным к пониманию, что она не всемогуща и в принципе не может таковой быть: что ей, например, также недоступно предсказание погоды на месяц вперёд и решение самых глубоких математических проблем тысячелетия, и не будет доступно даже если придать ей на порядки большую производительность - тогда-то люди и осознают пределы развития цивилизаций.
В полтора-два раза максимум. А вот существенно меньше судя по некоторым данным - это вряд ли.
Тогда эти критерии следует делать более адекватными реальности, а не апологизировать волюнтаризм.
Игра кагбе исходно и по определению максимально синтетическая среда и "синтетические данные" для неё становятся не более чем углубленной конкретизацией-детализацией правил и следствий из них. Всех же даже довольно базовых комбинаций законов природы в реальности в отличие от игры мы никогда не знаем. Например можно исправно обучать шахматный ИИ почти всем главным правилам и партиям до тех пор, пока, например, на реальном матче не станет применяться редкое неучтёное, но допустимое правило типа рокировки или взятия пешки на проходе.
В каком-то смысле это аналогично увеличению мощности общего интеллекта цивилизации за счёт того, что всё человечество делится на какие-то профессии, и именно их взаимодействие позволяет двигаться вперёд. Общий объём знаний человечества на много порядков превосходит объём знаний любого конкретного индивидуума, каким бы гениальным он не был.
Тут просто обучать становится сложно. Нужно балансировать между тем что ИИ будет постоянно посылать всех лесом, потому что ИИ не слишком уверен в точности ответа. И тем чтобы она несла охинею.
Поэтому целый ряд идей можно крутить.
Т.е. говоря простым и ясным языком, мы уже сами не можем ничего дать ИИ, но очень хотим пытаться трясти учить дальше, потому что очень не хотим в итоге услышать ответ в духе "Вы чего, бледнотики, с дуба рухнули?! Этого никто не знает и вряд ли в обозримое время узнает!"
Но с известным пределом. Но заинтересованный круг специалистов и энтузиастов явно не хотят, чтобы получившаяся система, заведомо более умная чем они сами, открыто этот предел признала и обозначила.
Ну нейросети исходно и так представляют собой массово распараллеленный вычислитель, а в области параллельных вычислений есть также давно известный общий предел - закон Амдала.Так что по сути это просто способ как-то немного смягчить ограничения на масштабирование конкретного единичного унифицированного вычислительного блока.
Фишка в данном случае не в распараллеливании, а в специализации нейросеток.
Цитата: Combinator от 01 Апр 2024 [12:15:56]Фишка в данном случае не в распараллеливании, а в специализации нейросеток. А что тогда мешает всех специалистов снова собрать в один ЦОД и плотно соединить высокоскоростными шинами?
А что тогда мешает всех специалистов снова собрать в один ЦОД и плотно соединить высокоскоростными шинами? Кто потом разберётся где какой "специалист", как неврологи до сих пор не могут разобраться с центрами в мозге?
Наверное, теоретически ничего не мешает, только зачем?
Заявлено, что Grok-1 — это модель типа mixture of experts (8 экспертов, где 2 активных) на 314 млрд параметров, где активных параметров 86 млрд. Эту БЯМ xAI обучила с нуля. Опубликованная модель — базовая, тонкой настройки для какой-либо конкретной задачи не имеет.
Цитата: Rattus от 01 Апр 2024 [12:23:15]А что тогда мешает всех специалистов снова собрать в один ЦОД и плотно соединить высокоскоростными шинами? Кто потом разберётся где какой "специалист", как неврологи до сих пор не могут разобраться с центрами в мозге?Цитата: Combinator от 01 Апр 2024 [12:34:14]Наверное, теоретически ничего не мешает, только зачем?Уже так делают и есть в общем доступе нейросетки сделанные по принципу экспертного совета. Их можно легко узнать когда параметры указаны не одним числом. А двумя с икском посредине. Например 7*9. Что будет значит что 9 экспертов по 7 миллиардов параметров каждый.
Я в курсе, просто все они вовсе не обязаны физически находиться в одном ЦОД, имхо.
просто все они вовсе не обязаны физически находиться в одном ЦОД, имхо.
Цитата: Combinator от 01 Апр 2024 [12:42:02]Я в курсе, просто все они вовсе не обязаны физически находиться в одном ЦОД, имхо.Можно и на бумажках считать и по голубиной почте списываться. Но учитывая те объёмы информации что собираемся гонять. Лучше всё же в один ЦОД пихать, там скорость будет повыше чем в распределённой по миру сети.
Положим, условный GPT4 агент генерирует ответ за 5 сек. Потом он направляется на анализ другому агенту который анализирует его ещё 5 сек. Займёт ли передача данных от одного эксперта к другому 1 микроскунду, или 1 миллисекунду, на мой взгляд, роли особо не играет, но спорить не буду. В любом случае, ускорить ответ многоэкспертной системы за счёт параллелизации вычислений, производимых самими экспертами, вряд ли возможно.
Цитата: Combinator от 01 Апр 2024 [13:01:49]Положим, условный GPT4 агент генерирует ответ за 5 сек. Потом он направляется на анализ другому агенту который анализирует его ещё 5 сек. Займёт ли передача данных от одного эксперта к другому 1 микроскунду, или 1 миллисекунду, на мой взгляд, роли особо не играет, но спорить не буду. В любом случае, ускорить ответ многоэкспертной системы за счёт параллелизации вычислений, производимых самими экспертами, вряд ли возможно. Там может быть длинная ветка рассуждений.
Ну что , специалисты из ДипМид и Антропик говорят что исследования ИИ будут ускоряться благодаря автоматизации исследований ИИ. Ну что пристёгиваем ремни? Прогнозы сингулярности никогда не были такими близкими
Ну что пристёгиваем ремни?
Надеюсь, прогнозы алармистов всё же окажутся неверными.