A A A A Автор Тема: Пределы автоматизации и внедрения роботов  (Прочитано 444585 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн skvj

  • *****
  • Сообщений: 1 228
  • Благодарностей: 17
  • AI DLT DeFi Web3
    • Сообщения от skvj
Кстати, как Теслы сходят с конвейера

https://youtu.be/UKpagx0yLc8

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Ещё одно приятное видео про ИИ и оценку его интеллекта.
https://www.youtube.com/watch?v=eP1dSWFqKVs&t=21s

Оффлайн Vitaliy

  • *****
  • Сообщений: 43 642
  • Благодарностей: 1391
    • Сообщения от Vitaliy
    • Два стрельца
Исследование: детские ИИ-игрушки учат опасным и непристойным вещам https://4pda.to/2025/11/15/449419/issledovanie_detskie_ii_igrushki_uchat_opasnym_i_nepristojnym_vescham/?ysclid=mi3p3tyg5h221010373
Добро пожаловать на сайт Два стрельца http://www.shvedun.ru/
Телескоп Добсона 8" (203мм) по кличке "Карандаш", Advanced C9¼-SGT XLT, Celestron NexStar 5 SE
Видео Мой канал на Ютубе - http://www.youtube.com/user/VitaliyShvedun
Мои 3D модели https://www.thingiverse.com/vitaliysh/designs
Дзен https://dzen.ru/vitaliysh
Rutube https://rutube.ru/channel/308317
Telegram https://t.me/hobby_3Dprinter_radio

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona

Оффлайн Rattus

  • Модератор
  • *****
  • Сообщений: 15 892
  • Благодарностей: 609
  • Души прекрасные порывы! Убеждённый Ωптимистъ
    • Сообщения от Rattus
Область AGI - это зелёненький квадратик сверху слева?
Тому, кто жаждет всех запретных тайн Астрофорума в одном месте поможет число 1919.

Ннапыльн%х тpапинкахъ далиокихъ плонеттъ астануцца нашшы погадкиъ! (ЙожЪ, SKL)
Скоро у людей закончится космос. (П.Лемтыбож - "Теоремы Пафнуция")
Я брала города, я стану - еда! (Серебряная Свадьба - "Пищевая цепочка")
Уранизация естественным образом снижает численность человечества (Вика Воробьёва, ВЖР, 30.10.2012)

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Область AGI - это зелёненький квадратик сверху слева?
Это человеческий уровень по мнению создателей теста. На самом деле это полная чушь, потому как они взяли большую кучу людей и если хоть один из них решил задание верно, то задание считалось верным у всех. Но бегство от ИИ, оно такое да.

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Ну и немного фактов приколов. У меня под рукой только для второго поколения теста.
Открываем сайт
https://arcprize.org/leaderboard
Цитата
Human Panel   Human   N/A   98.0%   100.0%   $17.00
И так 100% прохождение, с ценой 17 долларов за задание. Учитывая что там не долгие головоломки. Не сложно понять, уровень людей которых они наняли.

А теперь глянем среднее, благо они тоже это раскрыли в своё время. Для второй версии теста
https://habr.com/ru/news/894196/
Цитата
Более 400 человек прошли тест ARC-AGI-2 для установления базового человеческого уровня. В среднем, «панели» участников справлялись с 60% заданий — значительно лучше, чем любые из протестированных моделей
Поэтому для второй версии теста человеческий уровень это 100% прохождение с ценой 17 баксов и ниже для одного задания.
Хоть на самом деле нанятые доктора наук и прочие светилы мысли за овер прайс, дают точность только 60%.  :)\

Пример головоломок, чтобы оценить время прохождения и тем самым оплату за час у нанятых людей.

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Очередной новый лидер гонки. Дженеми 3.

Оффлайн Metatron

  • ****
  • Сообщений: 346
  • Благодарностей: 12
  • Мне нравится этот форум!
    • Сообщения от Metatron
А чего Грок 4.1 не включен? Не достоин?

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
А чего Грок 4.1 не включен? Не достоин?
Маска не любят. Табличка же от Гугла, а не от независимых обзорщиков. Как дадут всем пощупать, будут все челики.
Да и в любом случае Грок 4.1 хуже, следующий ход Икс.Аи это Грок 5. А тут чисто оптимизации.

Оффлайн Combinator

  • *****
  • Сообщений: 2 665
  • Благодарностей: 89
    • Сообщения от Combinator
Это человеческий уровень по мнению создателей теста. На самом деле это полная чушь, потому как они взяли большую кучу людей и если хоть один из них решил задание верно, то задание считалось верным у всех. Но бегство от ИИ, оно такое да.
😉

Оффлайн Combinator

  • *****
  • Сообщений: 2 665
  • Благодарностей: 89
    • Сообщения от Combinator
Пример головоломок, чтобы оценить время прохождения и тем самым оплату за час у нанятых людей.

Это какой-то позор (с).

Оффлайн Vitaliy

  • *****
  • Сообщений: 43 642
  • Благодарностей: 1391
    • Сообщения от Vitaliy
    • Два стрельца
Пример головоломок, чтобы оценить время прохождения и тем самым оплату за час у нанятых людей.

Это какой-то позор (с).
Вот интересно, с каким минимальным IQ человек еще может решить такую головоломку. Обычному человеку достаточно взглянуть и тут же решить ее в уме.
Добро пожаловать на сайт Два стрельца http://www.shvedun.ru/
Телескоп Добсона 8" (203мм) по кличке "Карандаш", Advanced C9¼-SGT XLT, Celestron NexStar 5 SE
Видео Мой канал на Ютубе - http://www.youtube.com/user/VitaliyShvedun
Мои 3D модели https://www.thingiverse.com/vitaliysh/designs
Дзен https://dzen.ru/vitaliysh
Rutube https://rutube.ru/channel/308317
Telegram https://t.me/hobby_3Dprinter_radio

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Вот интересно, с каким минимальным IQ человек еще может решить такую головоломку. Обычному человеку достаточно взглянуть и тут же решить ее в уме.
Попробуйте пройти весь тест
https://arcprize.org/play
Выбирать публичный набор для оценки 2, сложный

Оффлайн AlexDark

  • *****
  • Сообщений: 601
  • Благодарностей: 24
    • Сообщения от AlexDark
А как эта картинка (которая из задания) оценивает уровень интеллекта человека? Какой-нить Рэймонд (из "Человек дождя")  наверняка сможет решать подобные задачи лучше нейротипичных людей, но при этом может иметь кучу иных интеллектуальных проблем. А давайте будем использовать не машинночитаемые тесты (вы б еще предложили людям в уме корни кубические из 12-значных чисел извлекать), а человекочитаемые - ну, чтоб машину сравнивать с человеком, а не пытаться натянуть ИИ на тест.

Оффлайн Olweg

  • *****
  • Сообщений: 17 144
  • Благодарностей: 458
    • Сообщения от Olweg
А давайте будем использовать не машинночитаемые тесты (вы б еще предложили людям в уме корни кубические из 12-значных чисел извлекать), а человекочитаемые - ну, чтоб машину сравнивать с человеком, а не пытаться натянуть ИИ на тест.
Так тест и создан как интуитивно лёгкий для человека (по крайней мере первая его версия, насчёт второй я уже не уверен), но для ИИ местами непреодолимо сложный.
Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Так тест и создан как интуитивно лёгкий для человека (по крайней мере первая его версия, насчёт второй я уже не уверен), но для ИИ местами непреодолимо сложный.
Да, цель теста это выявить слабые места ИИ, чтобы было как оценивать рост их интеллекта.

Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
Текущий топ лист ИИ, по средней оценке тестов. Грок 4.1 пока не завезли. Но Дженеми 3 уже тут



Онлайн BlackMokona

  • *****
  • Сообщений: 21 515
  • Благодарностей: 644
  • Мне нравится этот форум!
    • Сообщения от BlackMokona
А тут с ИмАрены есть Грок 4.1. Но смысл не меняется, Гугл в лидерах.

Оффлайн Olweg

  • *****
  • Сообщений: 17 144
  • Благодарностей: 458
    • Сообщения от Olweg
Цитата
Более 400 человек прошли тест ARC-AGI-2 для установления базового человеческого уровня. В среднем, «панели» участников справлялись с 60% заданий — значительно лучше, чем любые из протестированных моделей
Поэтому для второй версии теста человеческий уровень это 100% прохождение с ценой 17 баксов и ниже для одного задания.
Хоть на самом деле нанятые доктора наук и прочие светилы мысли за овер прайс, дают точность только 60%.  :)\
Gemini 3 Deep Think решает почти половину задач:

Планеты других звёзд. История открытий
http://allplanets.ru/history_Olweg.htm