ВНИМАНИЕ! На форуме начался конкурс - астрофотография месяца - АВГУСТ!
0 Пользователей и 2 Гостей просматривают эту тему.
Я вот примерно про это писал. «Железный конь идёт на смену крестьянской лошадке» — цитата из романа И. Ильфа и Е. Петрова. Удивляет то, как вот так прямо, быстро, планомерно и без всякой бюрократии Китай строит коммунизм в своей стране. Скоро ведь пенсионный возраст начнут снижать, хулиганы!
Только зачем мучаться, когда есть десятки опен сорс моделей лучше?
Цитата: Albireo7 от Вчера в 07:26:04Я вот примерно про это писал. «Железный конь идёт на смену крестьянской лошадке»Так беспилотные тракторы уже пол века служатВот например фотка из статьи 2016 года
Я вот примерно про это писал. «Железный конь идёт на смену крестьянской лошадке»
Так одно дело беспилотный трактор, который управляется оператором через дистанционное управление наподобие БПЛА. То есть, фактически тот же самый тракторист, только сидит в кабинете. И совсем другое - аналогичный трактор, который работает полностью автономно под руководством ии. Где оператор вообще не нужен. Он может работать круглосуточно без выходных. Производительность труда в пересчёте вырастает в разы.
В чём мучение?
ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence) — это эталонный тест (бенчмарк), разработанный для оценки способности искусственного интеллекта к обобщению и адаптации в новых, незнакомых условиях. Его главная цель — измерить прогресс в создании ИИ, способного обучаться новым навыкам без опоры на предварительные данные тренировки, что является ключевым критерием искусственного общего интеллекта (AGI)
Результаты и значимость: Люди решают 98% задач ARC-AGI-1 и 100% ARC-AGI-2, тогда как лучшие ИИ (например, OpenAI o3) достигают лишь 75.7% на первой версии и <4% на второй. Провал современных LLM (GPT-4, Claude 3) на ARC-AGI-2 доказывает их неспособность к символическому и композиционному мышлению.
Maze 30×30 — задача из ARC-AGI-2, специально разработанная для проверки многоэтапного планирования.Её провал современными LLM — доказательство их ограниченности в символическом мышлении, что стимулирует создание гибридных архитектур (нейро-символические системы, рекуррентные машины).
Судя по всему, анонс GPT-5 сегодня в 22:00 по московскому.
Ну зачем когда есть куча моделей получше?
Цитата: BlackMokona от Вчера в 10:23:49Ну зачем когда есть куча моделей получше? Точно ли они лучше? Повторюсь, я пока не ставила эту модель против реальных задач, но то, что я вижу - пока очень впечатляет. Особенно баланс скорости генерации токенов и их качества.Я думаю, через несколько дней, может, пару-тройку недель появятся версии без цензуры, или с хаками в систем шеле, которые её отключают, и тогда можно будет попробовать.
Наверное, самое важное новшество - очень низкий уровень галлюцинаций.