ВНИМАНИЕ! На форуме начался конкурс - астрофотография месяца - АВГУСТ!
Ulkolainen и 3 Гостей просматривают эту тему.
комменты есть очень интересные
Исследование Apple показало, что ИИ-модели не думают, а лишь имитируют мышление
Типа как Мафин и Мини-мафин. Она признак "smaller" определило как указатель на "тип продукта", вместо "размер продукта". Фразу "5 of them were a bit smaller than average", она восприняла как "5 из них оказались вовсе не киви, а мини-киви". Поэтому на вопрос сколько "kiwi" она ответила математически верно, исключив "мини-киви".Например, "Коля купил вчера 2 Кекса(конкретный продукт), а сегодня купил вдвое больше кексов(тип кондитерского изделия), но 2 из них были Мини-кексы(конкретный продукт). На вопрос "Сколько Кексов(конкретный продукт) купил Коля?", правильный ответ "два".
На реддите народ засунул эти примеры в ИИ и те порешали их верно. Поэтому отстают ребята
Ну и пишут, что o1-preview (та самая, которая со встроенной рассуждалкой) справилась вполне неплохо, снижение качества всего на 17.5%. Ну а в блиц-опросах без времени на размышления и человек может посыпаться (глянул саму статью - некоторые «интуитивные» модели просели тоже не сильно, на 20-30%).
Ну и на хабре разобрали где была беда у Эппл, те допустили лингвистическую двусмысленность, от чего и полетели.ЦитатаТипа как Мафин и Мини-мафин. Она признак "smaller" определило как указатель на "тип продукта", вместо "размер продукта". Фразу "5 of them were a bit smaller than average", она восприняла как "5 из них оказались вовсе не киви, а мини-киви". Поэтому на вопрос сколько "kiwi" она ответила математически верно, исключив "мини-киви".Например, "Коля купил вчера 2 Кекса(конкретный продукт), а сегодня купил вдвое больше кексов(тип кондитерского изделия), но 2 из них были Мини-кексы(конкретный продукт). На вопрос "Сколько Кексов(конкретный продукт) купил Коля?", правильный ответ "два".
З.Ы. Алиса правильно ответила 2 кекса. Про киви, если сказать, что 5 киви меньшего размера, ответила 190 киви, а если сказать меньше среднего размера, то 185.
Новое видео, Тесла Оптимусаhttps://www.youtube.com/watch?v=5cNB96pqe8U&ab_channel=MoterWorld
Медлительный очень.
Какое у него контекстное окно? У меня написал, что всего 8192 токенов, или «примерно 3,000–6,000 слов в текущем разговоре».