ВНИМАНИЕ! На форуме завершено голосование в конкурсе астрофотография месяца - НОЯБРЬ!
BlackMokona, AlexDark, марс 144 (+ 1 Скрытых) и 5 Гостей просматривают эту тему.
А почему этот алгоритм работает гораздо хуже когда человеку надо научиться ходить? Там не десять часов а десять месяцев.
Почему подростки попав в другую страну начинают бегло говорить на чужом языке через несколько месяцев,а люди за 40 - и через несколько лет говорят с трудом. - тоже разные алгоритмы?
Это для любой аудитории применимо.
Ну конечно LLMки очень ограничены, нужна архитектурная работа, изобретение новых, лучших видов нейронок. Другое дело, смотрите: у современныхSOTA(ссылка для @ivanij , остальные я думаю знают о чём речь)
Другое дело, смотрите: у современных SOTA нейронок сотни миллиардов параметров, а в мозге свыше ста триллионов связей между нейронами. При этом нейроны сильно сложнее тех, что в нейронках.Тем более удивительно, что нейронки могут хоть что-то! Я думаю, дело в том, что в нашем языке уже упаковано очень много информации - он помогает и людям и нейронкам ускорять мышление, но нейронкам особенно помогает - у нас мозг эволюционно сконструирован мыслить без языка. И языковые оптимизации очень поздние, они куда моложе неокортекса.
В LLM информация видимо упакована плотнее и оптимальнее, чем в нашей голове.
В последнее время вообще число параметров упёрлось в плато, его особо не увеличивают уже пару с лишним лет,
Но упакована, вероятно, по-другому.
Суцкевер в недавнешнем интервью сказал, что человек генерализует гораздо лучше ЛЛМок. Приводит в пример подростков, которым нужно, условно, часов десять, чтобы научиться водить машину.
Суцкевер в недавнешнем интервью сказал, что человек генерализует гораздо лучше ЛЛМок. Приводит в пример подростков, которым нужно, условно, часов десять, чтобы научиться водить машину. Что-то такое есть в человеческих мозгах, что позволяет очень быстро обобщать, то ли эволюционные оптимизации, то ли хорошо прописанные функции ценности (эмоции?), то ли в принципе сам алгоритм работы принципиально другой. Проблема, что никто до сих пор не знает, что делает человек, когда он думает.
Когда люди срываются в многословие, объясняя на пальцах, наоборот мешает.
Это ошибка всех молодых преподавателей. Не спешите, с возрастом и опытом - придёт.
Цитата: AlexDark от Вчера в 14:36:26Можно снять видео хоть на 1000 часов, на котором со всех ракурсов заснят квадратный черный стол на 4 прямых ножках. Только комп из этого видео никак не получит инфу о том, что столы бывают круглые, прямоугольные и прочих форм, на 3 или 1 ножке, или что их может вообще не быть (крепится к стене), что ножки могут быть изогнутыми, плоскими, что все это может быть разных цветов и тд и тп. и и тд и тп. А человек запросто может опознать стол такой конструкции, которую до этого он не встречал.Если только видел очень много разных столов, от чего смог создать образ стола в своём мозгу, на который можно натянуть новый найденный стол. Иначе так же распознать стол не сможет.
Можно снять видео хоть на 1000 часов, на котором со всех ракурсов заснят квадратный черный стол на 4 прямых ножках. Только комп из этого видео никак не получит инфу о том, что столы бывают круглые, прямоугольные и прочих форм, на 3 или 1 ножке, или что их может вообще не быть (крепится к стене), что ножки могут быть изогнутыми, плоскими, что все это может быть разных цветов и тд и тп. и и тд и тп. А человек запросто может опознать стол такой конструкции, которую до этого он не встречал.
Цитата: Olweg от Вчера в 19:25:39В последнее время вообще число параметров упёрлось в плато, его особо не увеличивают уже пару с лишним лет, Почему? Я думаю, прототип GPT-5 сильно больше gpt-4.5 и тем более 4o. Просто продакшен версия gpt-5 дистиллирована с той, очень большой модели. Это вычислительная оптимизация - очень много сотен миллиардов параметров плохо влезают в видеокарты и даже TPU, и сильнее грузят тензорные ядра итд слоями - даже если это модель с микстурой экспертов, в которой только часть слоёв в определенное время активна.
Странный пример.У подростка к этому возрасту, во-первых уже отлажен софт координации движений, во-вторых, машина для него не диковина, а естественный элемент нашего расширенного фенотипа. Он знает (даже не побывав пассажиром ни разу, возьмём такого), что старшие соплеменники жмут педали газ-тормоз, крутят руль влево-вправо и справляются с этим чуть ли не поголовно. Легко. Он сам играл в игрушечные и виртуальные машинКИ, смотрел "Форсаж" и т.д. Не "с пальмы слез и через 10 часов уже всё освоил", у него пред-подготовка была серьезная, как ни крути.
Подросткам перед этим память стирают или она уже приходят в автошколу с многолетней видеопамятью о том как водили их родители, другие люди, обученные правилам дорожного движения в школе и тд и тд и тд и тд?
Вы, кажется, не поняли идею: это не образовательный тред,
В данном случае это не имеет решительно никакого значения и, если угодно, моё сообщение не имеет конкретного адресата,
Достаточно одного
И в 60-е 70-е без всяких «Форсажей» и GTA молодёжь так же неплохо справлялась. Кро
Цитата: Polnoch Ксю от Вчера в 19:11:21 Другое дело, смотрите: у современных SOTA нейронок сотни миллиардов параметров, а в мозге свыше ста триллионов связей между нейронами. При этом нейроны сильно сложнее тех, что в нейронках.Тем более удивительно, что нейронки могут хоть что-то! Я думаю, дело в том, что в нашем языке уже упаковано очень много информации - он помогает и людям и нейронкам ускорять мышление, но нейронкам особенно помогает - у нас мозг эволюционно сконструирован мыслить без языка. И языковые оптимизации очень поздние, они куда моложе неокортекса.Да, возможно, языковая оптимизация помогает, но если это так, то число параметров/синапсов не так критично. В последнее время вообще число параметров упёрлось в плато, его особо не увеличивают уже пару с лишним лет, после выхода GPT-4. Значит, нет большой необходимости и нет быстрой отдачи от увеличения.ЦитатаВ LLM информация видимо упакована плотнее и оптимальнее, чем в нашей голове.Но упакована, вероятно, по-другому.
успели достроить и запустить датацентры).", но в целом развитие идёт.
А двумерное изображение на сетчатке глаза (ЕНС) либо на матрице (ИНС), в зависимости от угла зрения, расстояния, освещённости и т.д., получается разным (зачастую – очень разным). То есть, на сетчатке (на матрице) будет отображаться куча разных картинок, которые являются разными изображениями одного и того же объекта.
У компьютера нет тела и он не может на своём опыте что-либо использовать, как-то улучшать удобство своей жизни. Для него всё это носит теоретический, абстрактный характер. И в этом принципиальное различие. Накопление статистических данных вместо конкретного опыта.