ВНИМАНИЕ! На форуме началось голосование в конкурсе астрофотография месяца - НОЯБРЬ!
0 Пользователей и 2 Гостей просматривают эту тему.
А что с Гроком я не пойму? был Grok 4 Fast с 2 млн токенов, заменили на Grok 4.1 с 256k!И такое ощущение, что он стал хуже. Или Fast остался? Может он отвечает в режиме эксперт? тогда зачем старшая модель, ничего не понимаю
Цитата: skvj от 19 Ноя 2025 [01:04:35]А что с Гроком я не пойму? был Grok 4 Fast с 2 млн токенов, заменили на Grok 4.1 с 256k!И такое ощущение, что он стал хуже. Или Fast остался? Может он отвечает в режиме эксперт? тогда зачем старшая модель, ничего не понимаюФаст убран, заменили на 4.1. Который лучше чем Фаст по бенчмаркам. Ну а контекст наверное слишком дорого обходился и урезали. Старшей моделью остаётся Грок 4 Хэви, а Грок 4 просто, это эксперт для бесплатных пользователей.А старших уже заменит Грок 4.2 который уже доступен для теста на сторонних площадках по имени Шерлок и у него как раз под 2 миллиона контекста.
Какие контекстные окна можно будет включить? ну, чтоб по настоящему заработали.
Цитата: skvj от 19 Ноя 2025 [07:29:10]Какие контекстные окна можно будет включить? ну, чтоб по настоящему заработали.Мощности не имеют никакого отношения к предоставляемому окну. Вопрос в экономике. Чем больше оно, тем дороже обрабатывать каждый запрос пользователя и рост затрат идёт экспоненциальный с ростом окна. Есть конечно архитектуры и всякие способы сократить этот бешенный рост. Но всё равно, всё упирается в деньги, деньги и ещё раз деньги. Ни одна компания не готова платить сотни баксов за бесплатные запросы пользователей. Сотни баксов за каждый запрос.
Как так? Всё наоборот)) Чем больше кластер (десятки экзаFLOPS условно, а всё придет туда и пойдет ещё выше), тем сильнее падает цена обработки токенов. Экспоненциальный рост вычислительной мощности и оптимизация моделей уменьшают стоимость каждого токена. Можно обеспечить длинные окна не только для облачных Гроков, но и для ИИ-агентов типа Оптимус без значительного роста стоимости работы. Как андроиды будут работать?
Когда послать письма не дали, ИИ наотрез отказался дальше заниматься бизнесом.
NVIDIA и AMD планируют отказаться от выпуска бюджетных видеокартПод нож могут попасть народные модели карт: RTX 5060, 5060 Ti и RX 9060, 9060 XT.
В моём же мире реальных доходов и глубокого заМКАДья, бюджетной является только видеокарта без дополнительного питания и существующая в низкопрофильном форм-факторе - то есть чевтёртый (первый жёлтый) столбец слева на данной диаграмме (красный - "уровень картошки" - уже довольно давно реализуется встройками GPU, для которых видеопамять выделяется из системной ОЗУ).
Также очень сильно подорожала буквально за месяц оперативная память.
Цитата: Rattus от 19 Ноя 2025 [14:23:17]В моём же мире реальных доходов и глубокого заМКАДья, бюджетной является только видеокарта без дополнительного питания и существующая в низкопрофильном форм-факторе - то есть чевтёртый (первый жёлтый) столбец слева на данной диаграмме (красный - "уровень картошки" - уже довольно давно реализуется встройками GPU, для которых видеопамять выделяется из системной ОЗУ).Сейчас ядра ГПУ даже в процессор напрямую встраивают
Цитата: Olweg от 04 Ноя 2024 [10:41:58]Интересный бенчмарк для языковых моделей:https://simple-bench.com/index.htmlЗадаются заковыристые вопросы на здравый смысл. Люди правильно отвечают в среднем на 84% вопросов, «интуитивные» модели - максимум на 27.5%, модели с рассуждениями - на 41.7% (o1-preview) и 41.4% (новый Claude 3.5 Sonnet). Провели тест для GPT-5 Pro - набрала 61.6%. Первое место уже скоро 5 месяцев удерживает Gemini 2.5 Pro версии от 6 июня. 4.5 месяца - срок немалый для такой быстро развивающейся области. Такое впечатление, что LLM действительно выходят на плато. Нужны новые подходы.
Интересный бенчмарк для языковых моделей:https://simple-bench.com/index.htmlЗадаются заковыристые вопросы на здравый смысл. Люди правильно отвечают в среднем на 84% вопросов, «интуитивные» модели - максимум на 27.5%, модели с рассуждениями - на 41.7% (o1-preview) и 41.4% (новый Claude 3.5 Sonnet).
С контекстным окном в 2 миллиона токенов