ВНИМАНИЕ! На форуме завершено голосование в конкурсе - астрофотография месяца - АВГУСТ!
0 Пользователей и 1 Гость просматривают эту тему.
А я уже вы который раз говорю - объект "кот" - один, интераций восприятия единственного объекта "кот" - много. Но вы мне пытаетесь доказать, что вместо одного кота человек видит миллиарды котов разного цвета, пород, размеров, стиля рисовки и тд и тп.
Спасибо, копну в этом направлении…
Гляньте. Это первый конкурент Optimus от Tesla. Можно сказать андроид №2 в мире от figure.aiОн складывает полотенца. Обучался обучением, просто через свой опыт. Потому что программировать это невозможно.
Одна из подсистем представляет собой зрительно-языковую модель на основе опенсорс-нейросети с семью миллиардами параметров, обученной на интернет-данных.…Вторая подсистема — зрительно-моторная модель. Это обученный на данных телеманипуляций трансформер с 80 миллионами параметров, который управляет всей верхней половиной тела робота, включая движения рук, пальцев, головы и корпуса.…Для обучения Helix инженеры Figure записали около 500 часов высококачественных данных демонстраций различных манипуляций. Для создания текстовых инструкций к ним использовалась система автоматической аннотации: зрительно-языковая модель анализировала видеозаписи и генерировала текстовые команды в формате «какие действия робот должен сделать в этом видео?». Обе подсистемы Helix обучались совместно сквозным образом (end-to-end). В результате модель научилась выполнять сложные манипуляции без необходимости в ручной настройке для каждой новой задачи.
А мы рассматриваем LLM, но! они также станут мультимодальными. Не как сейчас, а смогут видеть через камеры, и воспринимать речь вербально, а не через перевод в текст (как сейчас).
Я не смог найти данных о том, что они могут дообучаться в процессе работе. Поправьте, если я ошибаюсь.
Насколько я понимаю, речь они сразу в эмбеддинги пакуют. В этом и фишка трансформерной архитектуры, её универсальность: в общее смысловое пространство можно перевести вообще любой тип информации. Но пока с этим есть ограничения из-за ресурсов.
Они качают поведенческий промт из 500 часов демонстраций. Но! Это и есть обучение через опыт. Почему? После просмотра демонстрации Helix будет складывать ужасно! Но уже начнёт что-то делать. А мы видим Helix уже с прямой демонстрацией адаптивности. Если робот делает это устойчиво, значит модель внутри обобщила опыт, а не просто "зазубрила" 500 часов. Иначе, поймите - это же проще простого - заснял любое действие 500 часов - и робот научился. Это не так. Нам показывают почти конечный результат адаптивности.
Но пока речь реально идёт через костыль ASR, то есть "сперва преврати звук в текст". Это и создаёт задержки, ошибки, и делает систему менее живой. Будущее (в некоторых моделях уже настоящее) это когда аудиопоток напрямую входит в мультимодальную модель. Без промежуточного слоя текста. Модель сразу понимает смысловую структуру речи.
Так вот где бы почитать, как эта адаптивность реализована. Я не нашёл. Может быть, через ризонинг?
Вообще мне не очень понятно настроение многих участников.
К первой. Причём, возможно, это даже не экспонента, а гиперболическая кривая. Вот, в прошлом году в этой теме выкладывал пару ссылок:https://astronomy.ru/forum/index.php/topic,130794.msg6021252.html#msg6021252
ИИ сегодня - 2-х летний ребёнок: вроде говорит, вроде мыслит, но мир ещё обрывается глюками.
Цитата: skvj от Вчера в 11:11:11ИИ сегодня - 2-х летний ребёнок: вроде говорит, вроде мыслит, но мир ещё обрывается глюками.Только сегодня эти младенцы усиленно распихиваются на места принятия решений и вместо старых, но нормально работающих механизмов. Потому что "модно, современно". А то, что стало хуже чем было - "отнеситесь к этому с пониманием".
вот реальные авто уже сейчас (в будущем) - реально крутые по сравнению с мечтами фантастов из прошлого, замечали?
Самообучение неизбежно, вы правы. Без самообучения никакой сингулярности. Но! Сейчас это уже происходит на "подкорке". Figure и Optimus учатся как мы обсуждали выше. Это факт. Мы не видим весь процесс, но мы видим результат. А это далеко не единственные игроки на рынке. Там ещё немало серьёзных машин. Boston Dynamics и ещё куча.