ВНИМАНИЕ! На форуме начался конкурс астрофотография месяца - СЕНТЯБРЬ!
0 Пользователей и 1 Гость просматривают эту тему.
И ни одна разумная личность не обратила внимание, что звучит как-то дико, не посмотрела закон 295.
Цитатавы мне сейчас доказываете, что роман о закате, не только подробнее, чем сам закат, но и лучше егоНе закат, а фотка заката.
вы мне сейчас доказываете, что роман о закате, не только подробнее, чем сам закат, но и лучше его
И да, подробностей туда влезет больше чем человек может представить думая о закате хоть сутки.
А про лучше- хуже, это не ко мне, это субъективизм. И тем более не к машинам (вы ведь про ощущения, не так ли?).
Вот как придумают как научить ИИ Видеть(именно так, с большой буквы) - поговорим. Природа за 4 млрд лет - не придумала.
И пока все эти громкие слова про мультимодальность- просто маркетинг. Те самые интонации и микропаузы- это очередная надстройка к ASR, ничего более.
Я же прекрасно понимаю сколько весит картинка, сколько матрица с её параметрами, и тем более сколько будут весить её эмбеддинги. Это далеко не 5 слов. А если набрать всего лишь пол- мегабайта =500.000 букв = полноформатная книга в твердой обложке на 25-30 глав. Понятное дело что массив эмбеддингов от одной картинки - это намного больше 5 слов. Но до полноформатной книги этому полумегабайту- как до луны. Как раз из-за неинформативного мусора, отсекаемого ASR.
Или, есть ещё вариант, где вы запутались в терминологии, ведь сам концепция ASR - автоматическое распознование речи не исключает обработку интонаций, тембра и чего-то ещё - например видеопотока.
Вы хотя бы почитайте о вычислительной мощности запускаемых проектов прямо сейчас.
Не этот ли закон подразумевался?
Нервы - передают не изображение, а его характеристики, описательные данные.
Мозг не видит, а обрабатывает данные.
Вашу картину мира, где машина, или человек - ВИДИТ, мог бы разбить вдребезги простой аргумент - про перевернутое изображение на сетчатке.
Радио не дрожит как барабанная перепонка
И, кстати, ваш аргумент "глаз не видит, видит мозг" полностью бьёт против вас - если видит мозг, а не глаз, значит видеть = обрабатывать информацию. Что и делают ИИ.
Результаты обновили. GPT 5 реабилитировался и набрал 116 баллов IQ, то есть примерно тот же уровень, что у других топовых моделей. Благодаря провальному первому результату среднее пока 93. А вот GPT 5 Thinking показал… 70 баллов. …https://www.trackingai.org/home