Метод проб и ошибок — это… Что такое Метод проб и ошибок?
Метод проб и ошибок (в просторечии также: метод (научного) тыка) — является врождённым методом мышления человека. Также этот метод называют методом перебора вариантов.
В 1898 году описан Э. Торндайком как форма научения, основанная на закреплении случайно совершённых двигательных и мыслительных актов, за счет которых была решена значимая для животного задача. В следующих пробах время, которое затрачивается животным на решение аналогичных задач в аналогичных условиях, постепенно, хотя и не линейно, уменьшается, до тех пор, пока не приобретает форму мгновенного решения. Последующий анализ метода проб и ошибок показал, что он не является полностью хаотическим и нецелесообразным, а интегрирует в себе прошлый опыт и новые условия для решения задачи.
Достоинства и недостатки
Если рассматривать абсолютно случайный перебор вариантов, то можно сделать следующие выводы:
Достоинства метода:
- Этому методу не надо учиться.
- Методическая простота решения.
- Удовлетворительно решаются простые задачи (не более 10 проб и ошибок).
Недостатки метода:
- Плохо решаются задачи средней сложности (более 20—30 проб и ошибок) и практически не решаются сложные задачи (более 1000 проб и ошибок).
- Нет приёмов решения.
- Нет алгоритма мышления, мы не управляем процессом думанья. Идет почти хаотичный перебор вариантов.
- Неизвестно, когда будет решение и будет ли вообще.
- Отсутствуют критерии оценки силы решения, поэтому неясно, когда прекращать думать. А вдруг в следующее мгновение придет гениальное решение?
- Требуются большие затраты времени и волевых усилий при решении трудных задач.
- Иногда ошибаться нельзя ИЛИ этот метод не подходит (не будет человек резать на бомбе провода наугад).
Считается, что для метода проб и ошибок выполняется правило — «первое пришедшее в голову решение — слабое». Объясняют этот феномен тем, что человек старается поскорее освободиться от неприятной неопределённости и делает то, что пришло в голову первым.
Метод проб и ошибок лежит в основе принятия решений участниками рынка в условиях совершенной конкуренции, что является одной из главных причин постоянных кризисов.
ТРИЗ
МПиО — аббревиатура, обозначающая метод проб и ошибок. Часто встречается в текстах, так или иначе связанных с Теорией решения изобретательских задач. В ТРИЗ метод проб и ошибок рассматривается как эталон неэффективности. Для оценки какого-либо другого эвристического метода его сравнивают с МПиО. Так как МПиО — это метод перебора вариантов, то можно количественно определить число вариантов при использовании МПиО и сравнить с ним какой-либо другой эвристический метод. Такое математическое исследование предполагает, что количество необходимых вариантов обратно пропорционально эффективности метода и прямо пропорционально времени нахождения решения при его использовании. Однако точные количественные и статистические исследования проводятся редко. В ТРИЗ ограничиваются приблизительной количественной оценкой эффективности по уровням изобретательских задач (Ю.
Как точные, так и приблизительные количественные сравнения с МПиО возможны при допущении полной случайности перебора вариантов при использовании МПиО. В рамках ТРИЗ такая точка зрения служит обоснованием неэффективности МПиО. Однако с другой стороны выбор вариантов не может быть полностью произвольным. Он ограничен предыдущим опытом, инерцией мышления, стереотипами и гештальтами. На этом ставится акцент в рамках другой теории — метасистематике. В рамках метасистематики основным недостатком МПиО считается фактическая неслучайность перебора вариантов.
См. также
Метод проб и ошибок — Психологос
Метод проб и ошибок в научении
Метод проб и ошибок в научении по другому называется инструментальное научение, operant conditioning. Это простейшая форма оперантного обусловливания. В оперантном поведении подкрепляется спонтанное поведение, а спонтанность бывает как творческая, так и случайная. В инструментальном научении подкрепляется именно случайное поведение, не ища в нем какого-либо творческого разума и поиска. Достаточно, что это поведение нужное нам или находящееся на пути к нужному нам.
Кошка сидит в ящике, что делать не знает, дергается туда или сюда. Когда (чаще всего случайно) она тянула за шнур, ее награждали. Рано или поздно она научалась тянуть за шнур…
Подкрепление производится в простейшей форме, методом наград и наказаний, и научение происходит за счет примитивных форм нервной деятельности, без включения разума. См.→
Метод проб и ошибок — медленное научение. Когда жизнь требовала, что научение было быстрым, практически мгновенным, у животных вырабатывался механизм якорения, формировались фобии. См.→
Метод проб и ошибок в обучении
Метод проб и ошибок в обучении состоит в том, что учитель предлагает ученику задачу, которая имеет одно решение. Ученик многократно пробует то одно решение, то другое, до тех пор, пока решение не будет найдено.
От инсайта отличается тем, что проб может быть очень много, а учитель может давать те или иные наводящие подсказки.
С дрессировкой схож тем, что есть конечная цель, нужная учителю. Отличие в том, что в этом случае ученик сам достигает ее, подходя к задаче с разных сторон, и есть вероятность, что найденное решение будет отличаться от того, которое задумал учитель: например будет более оригинальное.
Как метод обучения, метод проб и ошибок выше дрессировки и ниже инсайта. Логично использовать метод проб и ошибок, когда базовые навыки уже получены.
Метод проб и ошибок для обучения
Как работает принцип проб и ошибок?Принцип проб и ошибок был впервые введен в начале 20-го века Гербертом Дженнингсом и Оливером Холмсом. Первоначально используемый в биологии, процесс, известный как метод проб и ошибок, позже был адаптирован к различным областям. Американский исследователь поведения Эдвард Ли Торндайк ввел принцип проб и ошибок в процесс обучения.
Метод очень прост: для решения проблемы проводятся многочисленные испытания, в которых проверяется и измеряется достижение целей. Если попытка не приводит к желаемому результату, она отклоняется как ошибка. Эти шаги выполняются с новым итерациями до тех пор пока не будет достигнута желаемая цель.
В основе этого принципа лежит простая идея – люди учатся на своих ошибках. Активно пробуя и выясняя, что не работает, мы учимся и приближаемся к цели. Каждый наш опыт содержит обучающий эффект, который приводит к лучшим решениям, действиям и результатам.
Каждый человек проходит практику проб и ошибок в первые годы. Дети учатся ходить именно по этой схеме. Ходи, падай, вставай и начинай снова. Малыш будет пробовать до тех пока не научится.
В соответствии с методом проб и ошибок, одновременно можно пробовать и испытывать множество вариантов. Когда есть разные способы выбора или отсутствует ясная идея, можно попробовать просто поискать решение проблемы, используя различные направления.
Основные принципы реализации принципа проб и ошибок просты, но есть несколько вещей, которые следует учитывать при работе с этим методом. С помощью следующих советов вы сможете наилучшим образом и достичь желаемых результатов.
Разрешите себе делать ошибкиБез правильного применения метод проб и ошибок лишь пустая трата времени. Вы должны быть готовы делать ошибки и исключать то, что не сработало. Неудача – не недостаток, а необходимый шаг. Не бойтесь ошибок, а рассматривайте их как возможность.
Установите критерииЧтобы оценить, является ли попытка успешной, необходимо установить четкие и понятные критерии. Прежде чем начать, вы должны определить как именно будете измерять успех. Эти параметры должны оставаться одинаковыми для всех испытаний.
Корректируйте действияМетод проб и ошибок не означает, что вы полностью отвергаете любой подход, если он не привел к достижению цели на 100%. Вам не нужно каждый раз начинать все сначала. Учитесь на ошибках и используйте полученные знания. Внесите незначительные изменения в предыдущие попытки и скорректируйте свое направление.
Чтобы в долгосрочной перспективе получить пользу от знаний, полученных вами в ходе проб и ошибок, вы должны записывать результаты. Это необходимо для того, чтобы в следующий раз не повторять ошибки.
Какие методики помогают в обучении: правда и вымысел
Методики запоминания информации
Почему мы забываем выученный материал
Почему традиционные методы обучения английскому языку терпят неудачу
Похожие записи
Метод проб и ошибок | Мир Психологии
МЕТОД ПРОБ И ОШИБОК
Метод проб и ошибок (англ. trial-and-error learning) — форма научения, детально описанная в докторской диссертации Э. Торндайка (1898). Торндайк придавал доминирующее значение навыку, который, согласно его взглядам, образуется путем закрепления случайных двигательных и мыслительных актов, приводящих к достижению необходимых для живого существа результатов. Так, кошка, посаженная в т.н. проблемную клетку и лишенная пищи, начинает метаться по клетке, находит выход, выходит на свободу и получает пищу. При повторении опытов время, затрачиваемое животным на то, чтобы выйти из клетки, постепенно, хотя и с большими колебаниями, уменьшается. В конце концов животное открывает клетку сразу, что м. б. воспринято наблюдателем, не видевшим предшествующих опытов, как «догадка» животного.
Критики Метода проб и ошибок отмечали, что хаотические и нецелесообразные движения во время научения наблюдаются г. о. в ситуациях, когда проблема неадекватна уровню развития обследуемого (как животного, так и человека), чрезмерно трудна. При решении адекватной проблемы испытуемый прежде всего пытается применить прошлый опыт с учетом того нового, что содержится в проблеме.
Психологический словарь. А.В. Петровского М.Г. Ярошевского
Метод проб и ошибок — способ выработки новых форм поведения в проблемных ситуациях. Метод проб и ошибок, широко используемый бихевиоризмом для объяснения научения как вероятностного процесса, получил распространение в психологии после работ Э.Л. Торндайка, согласно к-рым слепые пробы, ошибки и случайный успех, закрепляющий удачные пробы, определяют путь приобретения индивидуального опыта у животных и человека. Тем самым была выделена согласованность поведения со средой на вероятностной основе, что позволило при интерпретации категории действия выйти за пределы жесткой альтернативы: либо механистической, либо телеологической его трактовки. гештальтпсихология подвергла М. п. и о. критике, противопоставив ему решение проблемы путем инсайта. Непродуктивность и теоретическая слабость такого противопоставления была показана И.П. Павловым.
Свое значение Метод проб и ошибок сохранил лишь в узкой сфере искусственно создаваемых ситуаций; в частности, он вошел в состав конструктивных принципов кибернетических устройств.
Словарь психиатрических терминов. В.М. Блейхер, И.В. Крук
нет значения и толкования слова
Неврология. Полный толковый словарь. Никифоров А.С.
нет значения и толкования слова
Оксфордский толковый словарь по психологии
Научение путем проб и ошибок — научение, которое отличается пробами и ошибками в реагировании. Ход такого научения характеризуется постепенным устранением неэффективных реакций и усилением тех реакций, которые являются удовлетворительными. Торндайк в своих ранних рассуждениях по поводу окончания столетия, утверждал, что, этот процесс является главным при усвоении всех сложных действий, такая позиция сейчас полностью отвергнута.
Противопоставляется инсайту и научению через наблюдение.
предметная область термина
НАУЧЕНИЕ ПУТЕМ ПРОБ И ОШИБОК — принцип теории научения, первоначально сформулированный Эдвардом Торндайком. Этот принцип гласит, что реакции, не достигающие желаемого эффекта, постепенно затухают, а остальные реакции постепенно закрепляются.
назад в раздел : словарь терминов / глоссарий / таблица
Сериал Методом проб и ошибок 1 сезон: фото, видео, описание серий
Американский комедийный ситком, транслируемый на канале NBC. Сериал «Метод проб и ошибок» начали снимать в 2016 году, главные роли сыграли Николас Д’Агосто, Джейма Мэйс, Стивен Бойер, Криста Родригес, Шерри Шеперд и Джон Литгоу.
Комедия «Метод проб и ошибок» получила положительные отклики и высокие рейтинги при просмотрах. Сериал напоминает предыдущие проекты NBC комедию «Парки и зоны отдыха» и псевдо документальный сериал «Офис». Шоу пародирует многие моменты детективных сериалов. «Метод проб и ошибок» — комедия ошибок, рассказывающая о провинциальных недалеких людях из маленького городка, которые удалены от реального мира и не могут адекватно воспринимать совершенные преступления.
Сюжет сериала Метод проб и ошибок 1 сезон / Trial & Error
Неопытный адвокат из Нью-Йорка Джош Сигал (Николас Д’Агосто) приезжает в небольшой городок, чтобы принять участие в первом для себя судебном процессе. Джош выступает как адвокат эксцентричного профессора поэзии (Джон Литгоу), которого обвиняют в жестоком убийстве собственной жены.
Сигал снял офис рядом с магазином таксидермии, нанял команду из местных неудачников, но выиграть дело своего клиента Ларри Хендерсона будет сложно из-за его выходок. Однако вскоре Джош находит на месте преступления ДНК другого человека, затем «секс-принт» в спальне Ларри, который приводит к новому подозреваемому. Но по своей неопытности в судебном разбирательстве Джош выдает часть обвинительных доказательств прокурору Кэрол Энн Кин (Джейма Мэйс). А после того, как новый подозреваемый впадает в кому, сам Сигал становится обвиняемым.
Прокурор Кэрол представляет отчет о вскрытии Маргарет Хендерсон, в котором говорится, что ее убили ударом тупого предмета. Следователи ищут орудие убийства. Дуэйн Рид (Стивен Бойер) в поисках орудия наталкивается на отрубленную человеческую руку в озере. Команда адвоката Сигала получает нового благодетеля, а Дуэйн становится героем.
Новая улика приводит Джоша Сигала к опасному новому подозреваемому Джереми Джефферсону Дэвису. Ларри настаивает на детекторе лжи, чтобы доказать свою невиновность, но в итоге подозрения падают на его семью.
Босс Джоша мистер Манкевич приезжает из Нью-Йорка, чтобы проверить его. После ссоры с адвокатом и дочерью Саммер (Криста Родригес) Ларри берется за свою защиту сам, что приводит к смертоносным последствиям.
Судебный процесс над наивным профессором по литературе привлекает всеобщее внимание. Манкевич настаивает на признании Ларри невменяемым, Джош и Кэрол Энн Кин вместе убеждают обвиняемого предстать перед судом. Стратегия Джоша заключается в том, чтобы найти другого подозреваемого. Он всеми способами пытается оправдать своего клиента в глазах присяжных. Но Ларри на помощь приходит его бывший любовник Альфонсо.
Съемочная группа сериала Метод проб и ошибок 1 сезон / Trial & Error
- Режиссеры: Джеффри Блитц, Райан Кейс, Дженнифер Челотта
- Сценарист: Джефф Астроф, Мэттью Миллер
- Продюсеры: Джефф Астроф, Трей Кошия, Мэттью Миллер
- В главных ролях: Николас Д’Агосто, Джейма Мэйс, Стивен Бойер, Криста Родригес, Шерри Шеперд и Джон Литгоу, Патриция Белчер, Энджел Паркер, Лоретта Шеноски, Клинт Калп, Джон Хартман, Эрвин Росс, Ларри Седар, Фред Меламед
Метод проб и ошибок. — Детский сад №22
Метод проб и ошибок.
Рассмотрение методов мы, конечно, начнем с метода проб и ошибок. Этот метод еще называют методом перебора вариантов. В шутку говорят: «Перебор вариантов еще не самое худшее, хуже, когда предлагается всего один вариант!» Для примера решим задачу. Анаграммами «дорогвон» и «невежа» зашифрованы названия двух известных городов. Что это за города? Проследите, что вы начали делать? Наверняка начали перебирать слоги и буквы. Это и есть МПиО. (Ответ: Новгород и Женева.)
Мышление методом проб и ошибок зарождается в раннем детстве, когда ребенок начинает познавать мир: трогает руками, пробует, смотрит, слушает — накапливает образы и понятия, ищет связи между своими действиями и результатами этих действий. Затем, накопив некоторый опыт (на своих ошибках и победах) и знания, ребенок постепенно переходит от наглядно-действенного и наглядно-образного мышления к более сложным видам: абстрактно-понятийному и логическому. Тогда полнее начинает работать «здравый смысл» — толковый, рассудительный, трезвый, «взрослый».
Здравый смысл — это наша логичность, умение анализировать. Здравому смыслу, мышлению по аналогии и по ассоциации посвящены специальные разделы книги.
Есть задачи, которые иначе как перебором вариантов не решить.
Например, такая: дано пять стаканов с бесцветной жидкостью, внешне совершенно одинаковых. Известно, что сливание двух каких-то жидкостей дает смесь красного цвета. Как найти эту пару жидкостей? Придется переливать наугад. В этой задаче нет творчества. Единственное, что можно сделать, это исключить повторные сливания: пронумеровав стаканы, определим общее число переливаний без повторов по формуле сочетаний (в данном случае из пяти по два находим, что число таких сочетаний равно десяти) и составим таблицу сочетаний. Может быть, конечно, повезет и понадобится менее десяти переливаний.
Или такая простенькая задачка: приведите примеры, когда количество букв в названии числа равно самому числу. Начали перебирать: один, два, ТРИ! — (годится), четыре… Найдите и другие совпадения.
Решите старинную задачу.
Представьте, что вам дали два кувшина сложной формы емкостью 9 л и 4 л и попросили из большой бочки отлить 6 л дорогого вина, не больше и не меньше. Других сосудов нет. А теперь последите за своим мышлением! Что вы начали делать? По всей вероятности, вы начали мысленно наполнять и переливать из кувшина в кувшин вино — это тоже МПиО. Получить 6 л, вылив в 9-литровый кувшин 4 л и еще 2 л, наполнив 4-литровый кувшин до половины, нельзя по условию задачи — кувшины сложной формы.
Если не решили методом пробных переливаний, воспользуемся здравым смыслом. Он говорит, что самый простой способ получить 6 л — это слить 3 л из наполненного 9-литрового кувшина. Но куда? А это уже другая задача. И более простая! Другого сосуда, кроме 4-литрового кувшина, у нас нет, значит, надо сделать так, чтобы в 4-литровом кувшине был 1 л вина. А это уж совсем простая задачка: надо наполнить 9-литровый кувшин и слить из него два раза по 4 л, а оставшийся литр вылить в 4-литровый кувшин (9-4-4 = 1). Когда в 4-литровом кувшине окажется 1 л, надо вторично наполнить 9-литровый кувшин и слить из него 3 л (9-3 = 6). Задача решена.
Решим еще несколько задачек, чтобы накопить кое-какой опыт, подвести итоги и сделать некоторые обобщения.
1. На столе стоят опрокинутыми пять одинаковых фарфоровых чашек. Известно, что под одной из них — орех. Определите, под какой чашкой орех? Ясно, чтобы надежно определить, под какой чашкой орех, надо поднять 4 чашки. Но, может, и повезет, и орех окажется под первой же поднятой чашкой.
2. Возьмите 12 спичек и выложите из них 4 одинаковых квадрата. Переложите спички так, чтобы получилось три таких же квадрата. Отметьте, с чего вы начали решать? Сразу начали перекладывать (МПиО) или сначала подумали (здравый смысл)? 3. А вот задачка, над которой без здравого смысла придется долго мучиться, перебирая варианты. Расставьте недостающие цифры в квадрате так, чтобы их сумма по всем направлениям была равна 9.
Используем цепное правило: «Операцию, которая приводит к однозначному ответу (без вариантов), надо делать сразу». Без вариантов заполняется второй столбец. В нижнюю строчку вписываем 0, в левый нижний угол 5. А потом? Придется подобрать цифры в оставшиеся четыре пустые клетки. Начать лучше с первой строки, так как вариантов тут меньше (3). 9-6 = 1+2.
Ставим в левый верхний угол 1, а в правый 2. Тогда в пустые клетки среднего ряда надо вписать две тройки. Задача решена. Кстати, она решается, если в левый верхний угол вписать 2.
4. В США имеются монеты достоинством 1, 5, 10, 25 и 50 центов. Как набрать 1 доллар из 13 монет? 1 доллар равен 100 центам. Для этой задачи известны, по крайней мере, три варианта решения. Найдите их.
Перечислим преимущества и недостатки МПиО и подведем некоторые итоги.
Достоинства МПиО:
1. Этому методу не надо учиться.
2. Методическая простота решения («А что, если попробовать сделать так?…»).
3. Удовлетворительно решаются простые задачи (не более 10 проб и ошибок).
4. Учит упорству и терпению, учит не отчаиваться при неудачах.
5. Вообще говоря, с каждым новым решением человек «становится умнее». Не случайно говорят, что на ошибках учатся.
Мы знаем, что учиться надо и на ошибках, и на успехах, и на победах, и на поражениях, своих и чужих.
Перебрать 1000 вариантов решений невозможно, но не надо считать позорным перебор вариантов, если их не много: 4-5-6… до 10.
Недостатки метода проб и ошибок. Обратите особое внимание на приведенные ниже недостатки, далее мы будем рассматривать много методов мышления, и все они будут исключать или уменьшать эти недостатки.
1. Плохо решаются задачи средней сложности (более 20-30 проб и ошибок) и практически не решаются сложные задачи (более 1000 проб и ошибок). Согласитесь, трудно предложить даже более 10 разных решений.
Вспомните, был ли случай в вашей практике, когда, решая какую-нибудь, даже серьезную проблему, вы предложили более 20 различных вариантов решений? Тем более это трудно, если вы думали в одиночку.
Если не верите — предложите 20 способов передачи простейшего сообщения (да — нет) на расстояние в полкилометра.
Я начну: дым костра, трембита, барабан, шест с флагом, забраться на дерево, веревка длиной 0,5 км, выстрел из ружья, почтовый голубь, собака…
А вот дети, у которых специально развивали воображение, предлагали более 20 способов. Почему? Потому что они умели управлять своим мышлением и не боялись фантазировать!
2. Нет никаких помощников мышления — приемов решения задач.
3. Нет алгоритма мышления, мы не управляем процессом думанья. Мы не знаем, как мы думаем. Мы не знаем, как нам в голову приходят новые варианты решений. Идет довольно хаотичный перебор вариантов.
4. Неизвестно, когда придет хорошая идея и придет ли вообще.
5. Отсутствуют критерии оценки силы решения, поэтому не ясно, когда прекращать думать. А вдруг в следующее мгновение придет гениальное решение?
6. Требуются большие волевые усилия и большие затраты времени при решении трудных задач.
7. МПиО часто дает усложненные, неоптимальные решения.
Считается, что для МПиО выполняется правило: «первое пришедшее в голову решение — слабое». Объясняют этот феномен тем, что человек старается поскорее освободиться от неопределенности и «брякает» то, что пришло в голову первым. МПиО сравнивают с ловлей мячика с закрытыми глазами или в темноте. Повезет — не повезет, придет хорошее решение — не придет хорошее решение. Чаще всего мы начинаем решать любые задачи, используя метод проб и ошибок. И только если решить с ходу не удается, мы обращаемся к другим методам, если, конечно, ими владеем. «Чем шкура красивей, тем охотник хитрей».
Вследствие своей врожденности, способ мышления методом проб и ошибок очень консервативен, трудно поддается изменению и переучиванию. Это последнее обстоятельство надо учитывать и сознательно прикладывать волевые усилия (и немалые!), заставляя себя осваивать другие, более эффективные методы мышления. Эффективность МПиО (число вариантов, быстроту и силу решений…) увеличивают использованием рассуждений на основании здравого смысла и напряжением мышления.
Напряжение мышления — это преодоление несоответствия между какой-либо потребностью, желательностью действия и ее удовлетворением, это недовольство ситуацией и желание исправить положение, что заставляет думать и действовать.
Можно составить своеобразную формулу нашего обычного мышления: Перебор вариантов + Здравый Смысл + Напряжение мышления.
Но основной недостаток МПиО заключается в том, что отсутствуют какие-либо более-менее надежные «помощники»: приемы, методики или способы, помогающие решать задачи, помогающие «прорваться» в подкорку и извлечь оттуда сильное решение.
Здравый смысл.
Что такое здравый смысл и чем он отличается от логики? Как отмечалось, здравый смысл — это логические операции в повседневной жизни, интуитивные суждения, это умение делать правильные выводы на основе недостаточно формализованного практического опыта, в условиях нечетких значений слов.
Можно сказать, что здравый смысл — это рационализм, умение принимать обдуманные, рациональные решения, в отличие от иррационального мышления — нелогичного, непонятного, необъяснимого на разумной основе.
Чем отличается строгое научное мышление от обычного, житейского — здравого смысла? Если здравый смысл построен на принципе интуитивной очевидности (это каждому дураку ясно!), то строгое логичное мышление построено на полной доказательности каждого положения, каждого шага, каждого суждения и вывода. Поэтому его называют научным, логическим.
Житейские суждения могут основываться на доверии к человеку, на симпатиях, на догмах, на правдоподобных рассуждениях, на лукавой заинтересованности, на привычках и обычаях, даже на преднамеренной лжи — то есть на основаниях, весьма далеких от достаточных, чтобы быть логически верными.
Отсюда вытекает, так сказать, «совет здравому смыслу» — ищи строгий научный закон, на который можно было бы смело опереться. А это нечто иное, как законы формальной логики.
Поэтому здравый смысл может дать досадные осечки.
1. Ответьте, например, на такой умозрительный вопрос: если земной шар и грецкий орех мысленно обтянуть нерастяжимыми нитями, а потом одну и другую нити удлинить на десять метров и опять обтянуть земной шар и орех, то в каком случае зазор (провисание) будет больше? Здравый смысл говорит, что в случае с грецким орехом. Ибо на такой огромной длине окружности земного шара равной 40 000 000 м удлинение на 10 метров просто не будет заметно (0,000025 %).
А теперь посчитаем. Длина окружности земного шара Lз = 2nRз, откуда Rз = Lз/2n. Длина окружности ореха Lо = 2nRо, откуда Rо = Lо/2n.
Увеличенная на 10 м длина окружности земли равна Lз+10 м = 2nRзу, откуда Rзу = (Lз+10 м)/2n. Увеличенная на 10 м длина окружности ореха Lо+10 м = 2nRоу, откуда Rоу = (Lо+10 м)/2n. Теперь найдем искомые зазоры: Rзу-Rз = (Lз+10 м)/2n-Lз/2n = 10 м/2n = 1,6 м; Rоу-Rо = (Lо+10 м)/2n-Lо/2n = 10 м/2n = 1,6 м!!! Столь странный результат вытекает из постоянства отношения длины окружности к своему радиусу L/R = 2n.
2. Очевидно, что через точку на плоскости можно провести одну и только одну прямую, параллельную заданной. Этому нас учили в школе. Так утверждал еще в III веке до н. э. великий греческий математик Евклид. Через 21 век(!) другой великий математик, Н. И. Лобачевский, совершил переворот в геометрии, доказав, что это не так, что через точку можно провести много прямых, параллельных исходной. Это привело к отличию многих теорем геометрии Лобачевского от аналогичных теорем геометрии Евклида. Например, сумма углов треугольника меньше 180°, подобные треугольники всегда равны между собой…
3. Согласно здравому смыслу, заливать пожар холодной водой эффективней, чем кипятком. Однако это не так. Удельная теплота парообразования много больше удельной теплоты нагревания.
4. Вряд ли на основании здравого смысла можно сказать, что диапазон слышимости человека от едва слышимого звука до невыносимого по своей громкости равен триллиону (числу с 12 нулями).
Несколько примеров правильных поступков, с позиций формальной логики (инструкций), но противоречащих здравому смыслу, что нередко приводит к глупости.
* В одном из павильонов научно-исследовательского института, где размещалась научная аппаратура, возник пожар.
Огнетушителей в павильоне не оказалось, и люди побежали в главный корпус института. Показали свои пропуска на проходной, взяли огнетушители и хотели идти тушить пожар, который, кстати, был хорошо виден из проходной. Однако не тут-то было, охрана потребовала предъявить пропуска на вынос материальных ценностей(!). Начальник охраны горячо поддержал своих бдительных вахтеров и пригрозил оружием. Только вмешательство генерального директора пресекло глупость, но для тушения пожара уже пришлось вызывать специалистов со шлангами, насосами и лестницами.
* Врач прописал больному, страдающему бессонницей, таблетки и попросил медсестру давать таблетки через каждые два часа. Придя к больному в очередной раз, сестра увидела, что больной крепко спит. Сестра его с трудом разбудила и заставила принять таблетку!!!
* Машенька написала в тетради «што» вместо «что».
Мама замечает:
— Ты же знаешь, как надо писать.
— А кого мы обманываем? Говорим «што», а писать надо «что»!
Тренинг здравого смысла.
Прекрасным тренингом здравого смысла является решение задач на смекалку.
1. Мама испекла кулич и дочка испекла кулич, из того же теста и точно совпадающий по форме с маминым, но его размеры в три раза меньше. Мамин кулич весит 1 кг, сколько весит кулич дочери?
2. Чему равна сумма чисел натурального ряда? 1 + 2 + 3 + 4 + 5 + 6 + Е = ? Здравый смысл совершенно правильно говорит — бесконечности.
3. А чему равна сумма убывающих правильных дробей? 1/2 +1/3+1/4+1/5+1/6+Е = ?
4. Чему равна сумма убывающих дробей такого ряда? 1/2+1/4+1/8+1/16+1/32+Е = ? Здравый смысл говорит — надо спросить математиков.
5. Решим такую задачку.
Можно ли написать пять нечетных цифр, таким образом, чтобы в сумме получить 14?
Ответы.
1. Здравый смысл вроде бы говорит — 333 г. Трудно поверить, но он весит менее 40 г. Для проверки посчитаем. Чтобы найти массу, надо объем умножить на плотность. Плотность у обоих куличей одинакова. Пусть кулич дочки имеет размеры 1x*1x*1x = 1x, тогда мамин кулич 3x*3x*3x = 27x. Если 1кг разделить на 27, то получится 37 г.
3. Бесконечности!
4. Математики говорят, что сумма приведенного ряда равна 1!
5. Что мы начинаем делать? Пытаемся подобрать нечетные цифры. 1 + 3 + 5 + 7 + 9 = 25.
Первая догадка: несколько цифр должны быть одинаковыми. 1 + 3 + 5 + 3 + 1 = 13.
Вторая догадка: сумма нечетного числа нечетных цифр никогда не может быть четным числом. «Спасительная» мысль: эта задача не решается! А если не сдаваться? Вчитаемся в условия задачи. Что они не запрещают? Они не запрещают, как угодно комбинировать, необязательно складывать, пять каких-то нечетных чисел, среди которых могут быть одинаковые. Третья догадка: 11+1+1+1 =
Нам удалось вырваться из стандартной ситуации, когда знания есть, а задачу не решить. В чем дело? Не можем догадаться.
Одним из недостатков здравого смысла является то, что он ставит вне закона фантазию и вообще «дикое мышление».
Методом проб и ошибок я научился пробовать и ошибаться
Ой, подружки, хорошо быть гусеницей! Жрешь-жрешь-жрешь, укутываешься, спишь-спишь-спишь, просыпаешься — красавица!
* * *
Золушка вышла замуж за принца. Он разбросал по ее комнате лепестки роз, но в 12 они превратились в носки.
* * *
Я поняла, что уже пора заканчивать с диетой, когда реакция на уползающего червячка в яблоке стала не «Фу, гадость!», а «Куда?».
* * *
— Сходила с детьми в зоопарк, дети рычали, пищали, кричали, махали. Надеюсь, звери остались довольны.
* * *
Уровень «не выспался»: утром стоял с кошачьим кормом в руках перед кофемолкой, сердцем понимал, что что-то не так, а головой — нет…
* * *
— Стас, я в интернете в чате с такой девчонкой познакомился, ей 17 лет, она юна и непорочна, красива, как богиня,
и жаждет встречи со мной.
— А ее случайно не Изольда зовут?
— А ты откуда знаешь?
— Ну, здравствуй, Антуан.
* * *
— Послушайте, у этого парня в резюме: «Управление успешным обновлением и внедрением новой системы освещения с
непревышенными затратами и без происшествий, связанных с безопасностью».
— Ему удалось заменить лампочку?
* * *
Сижу, смотрю советское кино 70-х прошлого века. А ведь когда-то русские сами работали на всех своих стройках!
* * *
Работники музея восковых скульптур только на третий день поняли, что кассир умер.
* * *
— Алло! Мы украли вашу жену. Выкуп — сто тысяч евро, в доказательство высылаем ее палец!
— Идите на фиг! Палец может быть чей угодно. Голову пришлите.
* * *
Коля — счастливый водитель снегоуборочной машины. Его начальник — понимающий человек, и в такую погоду позволяет ему работать дистанционно.
* * *
Никогда не лгите индийской девушке! Эта красная точка на лбу все записывает!
* * *
Я хорошо готовлю, прекрасно убираю квартиру, стираю, бережно слежу за личными вещами и электроникой…
Вы спросите, в чем мой секрет?
Ответ прост: я мало зарабатываю.
* * *
— А сколько у нас шпаг!
— Четыре!
— А сколько у нас мушкетов?
— Четыре!
— Так кто же мы?
— Вооруженные силы Эстонии!
Trial & Error — NBC.com
В духе настоящих криминальных документальных фильмов, второй сезон этой возмутительной комедии о рыбе из воды сосредоточен на проницательном нью-йоркском юристе Джоше Сигале (Николас Д’Агосто), который все еще относительно новичок в крошечном южном городке, который твердо готовится к следующему крупному делу там. Его миссия? Защищать эксцентричную первую леди Восточного Пека, Лавинию Пек-Фостер (Кристин Ченовет), известную своими яркими нарядами, большими шляпами и лысой кошкой, которая внезапно оказывается обвиненной в странном убийстве своего любимого мужа.Пока Джош продолжает устраиваться в своем импровизированном офисе за магазином таксидермии, работая со своей необычной командой местных неудачников, он подозревает, что выиграть его второе крупное дело на этот раз должно быть легко (особенно когда его клиент — фаворит города), но так ли это? ?
Эпизоды доступны для покупки.
КРЕДИТОВ
В ролях
Кристин Ченовет, Николас Д’Агосто, Джейма Мэйс, Шерри Шеперд, Стивен Бойер, Аманда Пэйтон
Исполнительные продюсеры
900ff2 Jeff Astrof, , Мэтри Коэн Исполнительные продюсерыМэтт Зинман, Крейг Джерард
Создано
Джефф Астроф, Мэтт Миллер
Директора
Джеффри Блитц, Мэтт Соон, Яна Горская
Продюсер
БонниБенвик
Сценаристы
Джефф Астроф, Мэтт Зинман, Крейг Джерард, Лиз Астроф, Дэвид Бут, Патрик Канг, Майкл Левин, Нора Нолан, Мелани Бойсо
Кастинг-директора
Никки Валко, Кен Миллер
, Питер Паппас Художник-постановщик
Ян Томас
Художник-постановщик
Майкл Балфри
Художник по костюмам
Андреа Дес Рош
Художник по волосам
Флоренсия Сепеда Джек
0002 Дарси 9007
Дэйн Макмастер, Яна Горская, Джастин Чинн
Origination
Бербанк, Калифорния
Производство
Barge Productions и Good Session Productions совместно с Warner Bros.Телевидение
Необходимая боль проб и ошибок
Метод проб и ошибок — одна из самых полезных форм обучения. Когда мы делаем ошибку или терпим неудачу в чем-то, мы даем себе возможность проанализировать эту ошибку, внести изменения, а затем повторить попытку.
В мире, полном неопределенности и непредсказуемости, мы неизбежно будем проходить через непредвиденные трудности на протяжении всей нашей жизни, будь то на работе, дома или в наших отношениях.
Это потому, что наш разум несовершенен. Мы не можем учесть все факторы, влияющие на жизненный результат. Поэтому иногда нам необходимо пройти через боль проб и ошибок, прежде чем мы узнаем правильный жизненный путь. Редко бывает всегда делать все правильно с первой попытки.
Во многих отношениях метод проб и ошибок — единственная форма обучения, которая у нас действительно есть. Когда мы делаем ошибку или терпим неудачу в чем-то, мы даем себе возможность проанализировать эту ошибку, внести изменения, а затем повторить попытку.Этот процесс, повторяющийся с течением времени, — единственный реальный и эффективный способ узнать больше о нашем мире и решить проблемы в нашей жизни. Это двигатель науки. А еще это двигатель самосовершенствования.
В этом посте описаны основные причины, по которым в нашей жизни нужны методы проб и ошибок.
У тебя нет идеальных знаний
Я уже упоминал об этом раньше, но стоит повторить еще раз: у вас нет точных знаний о том, как устроен мир. Понимание этого требует некоторого смирения, но оно того стоит, потому что помогает вам лучше подходить к жизни.
Греческий философ Сократ считал, что знание того, чего вы не знаете, было одним из важнейших шагов к истинной мудрости. И даже со всеми знаниями, которые у нас есть сегодня, это все еще правда.
Каким бы могущественным ни был наш разум, он ограничен. Ни один разум полностью не понимает, как устроена Вселенная. В лучшем случае у нас есть только кусочки пазла. Не совершайте ошибку, думая, что вы все знаете.
Поскольку наши знания несовершенны, нам иногда приходится терпеть боль проб и ошибок, прежде чем мы сможем лучше что-то понять.
То, что работает для одного человека, не обязательно сработает для вас
Родители, учителя и эксперты могут быть отличным источником знаний и вдохновения, но только обучение через них может иметь свои недостатки.
Хотя у нас много общего с другими людьми, правда в том, что у нас также есть свои различия, например, в наших генах, воспитании, культуре и личных ценностях. Из-за индивидуальности каждого человека то, что работает для одного человека, не обязательно сработает для вас.
Важно помнить об этом. Учителя и эксперты могут быть в лучшем случае полезными наставниками, но не стоит ожидать, что они дадут вам все ответы. В конце концов, вам все еще нужно «намочить ноги», прежде чем вы научитесь плавать.
Опыт — один из лучших ваших учителей
Иногда, независимо от того, сколько книг и статей вы читаете или к скольким людям вы обращаетесь за советом, единственный реальный способ научиться — это испытать это на себе.
Поиск новых впечатлений — это метод проб и ошибок.Когда вы пробуете что-то новое, нет гарантии, что вам это понравится — вы можете даже возненавидеть это. Но если вы будете более готовы пробовать что-то новое, вы сможете больше узнать о себе и о том, что вам действительно нравится или не нравится.
Часто бывают случаи, когда вы думаете, что вам что-то не понравится, но как только вы попадаете в это, вы понимаете, что это действительно весело. В других случаях вы можете подумать, что вам что-то понравится, но потом обнаруживаете, что это не то, чего вы ожидали.
Например, некоторые люди проходят несколько лет обучения в медицинской школе, прежде чем осознают, что на самом деле они не хотят быть врачом.Это болезненная вещь, с которой нужно смириться — много времени, усилий и денег в унитаз. Однако часто лучше признать «ошибку» и изменить свое поведение, чем посвятить себя несчастной жизни.
Это крайний пример боли проб и ошибок, но это случается. Часто людям время от времени нужно идти ложными путями, прежде чем они смогут по-настоящему найти себя. Это часть самопознания, с которой многие люди не хотят сталкиваться.
Реальные примеры проб и ошибок
Вот наиболее распространенные способы применения метода проб и ошибок, которые мы можем использовать на протяжении всей жизни:
- Встречаюсь с несколькими парнями / девушками, прежде чем найти подходящего.
- Пробовать много работ, прежде чем выбрать карьерный путь.
- Проведите время в разных районах, прежде чем выбрать новое место для жизни.
- Поэкспериментируйте с разными хобби, прежде чем открыть для себя свое увлечение.
- Слушайте разные типы музыки, чтобы найти то, что вам больше всего нравится.
- Есть разные продукты, чтобы понять, что лучше всего подходит для вашего рациона.
- Подходя к личной проблеме с разных сторон.
- Участвуйте в различных видах спорта и физических нагрузках, чтобы выбрать, что вам больше всего нравится.
Чем больше вы готовы пробовать новое и время от времени совершать ошибки, тем лучше вы поймете себя и улучшите свою жизнь в долгосрочной перспективе.
Будьте в курсе новых статей и ресурсов по психологии и самосовершенствованию:
Проб и ошибок» и краткое содержание фильма (1997)
В «Пробах и ошибках» есть несколько очень забавных сцен — забавных, потому что они отражают характер персонажей (в нем есть некоторые другие сцены, которые не таковы). Забавно, когда персонажи спотыкаются и опрокидываются, а мы сомневаемся, что кто-то из людей окажется таким неуклюжим.К концу фильма нас действительно волнует, что происходит с людьми в фильме, а в современной комедии такое бывает редко.
В фильме дебютирует Майкл Ричардс, завсегдатай «Сайнфелда», который играет так себе актера по имени Ричард Ритти. Он планирует стать шафером на свадьбе своего друга Чарльза Таттла (Джефф Дэниэлс). адвокат
Таттл женился на дочери своего босса в юридической фирме. Его отправили в Неваду, чтобы защищать дальнего родственника босса, Бенни Гиббса (Рип Торн), который является аферистом уже 50 лет.Его последний трюк: продажа «подлинных медных гравюр Великого Освободителя» по почте за 17,99 доллара и отправка своим жертвам пенни.
Ричард пробирается в маленький городок, чтобы устроить неожиданный мальчишник для Таттла. Таттл так напился он не может явиться в суд на следующий день. Риетти притворяется адвокатом, и, когда просьба о продлении срока отклоняется, он оказывается перед отчаянным выбором: продолжить маскарад и защищать клиента или быть арестованным за выдачу себя за адвоката.Двое друзей разрабатывают импровизированную схему, включающую флеш-карты, звуковые сигналы и другие сигналы, с помощью которых Таттл пытается, но терпит неудачу, контролировать фальшивого адвоката.
Перспективное помещение. А режиссер Джонатан Линн уже доказал, что умеет работать с комедиями о рыбе, выловленной из воды, во дворе небольшого городка: пять лет назад он снял «Мой кузен Винни». Именно за этот фильм Мариса Томей получила «Оскар», и на этот раз он снова играет ключевую роль для новичка: Шарлиз Терон играет Билли, официантку местного отеля, которая влюбляется в Таттла.
Рип Торн, весь в своей вине и фальшивом оскорбленном достоинстве, превращает мошенника в обвиняемого, которого, очевидно, следует сажать в тюрьму. Остину Пендлетону очень нравится играть в судью, человека, который находит дело все более невероятным и веселым. Джессика Стин играет ключевую, но неблагодарную роль обвинителя, но сценарий избавляет ее от роли с одной примечанием, давая ей бесценные сцены, в которых она подвергает перекрестному допросу двух свидетелей защиты: один из них — «психиатр», который бойкий, но кажется, что ему около 18, а другой, краеугольный камень защиты твинки Риетти, является «экспертом по питанию», который объясняет, что единственная разница между сахаром и кокаином — это несколько молекул здесь и там.
Быстрое обучение методом проб и ошибок с моделированием поддерживает гибкое использование инструментов и физическое обоснование.
Abstract
Многие животные и все большее число искусственных агентов демонстрируют сложные способности воспринимать объекты и манипулировать ими. Но люди по-прежнему отличаются своей способностью гибко и творчески использовать инструменты — использовать объекты по-новому, чтобы воздействовать на мир, достичь цели или решить проблему. Чтобы изучить этот тип решения общих физических задач, мы представляем игру Virtual Tools.В этой игре люди решают большое количество сложных физических головоломок всего за несколько попыток. Мы предполагаем, что гибкость решения физических проблем человеком основывается на способности вообразить эффекты предполагаемых действий, в то время как эффективность человеческого поиска возникает из богатых априорных значений действий, которые обновляются посредством наблюдений за миром. Мы создаем экземпляры этих компонентов в модели «образец, моделирование, обновление» (SSUP) и показываем, что она отражает производительность человека на 30 уровнях игры Virtual Tools.В более широком смысле, эта модель обеспечивает механизм для объяснения того, как люди объединяют общие физические знания в действенные, ориентированные на конкретные задачи планы для достижения гибкого и эффективного решения физических проблем.
Пытаясь установить палатку в походе, вы понимаете, что земля слишком твердая для кольев для палатки, и у вас нет молотка. Что бы вы сделали? Вы можете поискать подходящую замену молотка, пропуская такие предметы, как сосновые шишки или бутылки с водой, в пользу хватательного камня.И если этот камень сначала не удался, вы можете попробовать другой захват или поискать более тяжелый камень. Скорее всего, вам понадобится всего несколько попыток, прежде чем вы найдете подход, который работает. Определение того, как забивать колья для палатки без молотка, является примером гибкости и эффективности решения более общих физических задач. Это требует причинного понимания того, как работает физика мира, и сложных умений для умозаключений и обучения для построения планов, которые решают новую проблему.Подумайте, как, столкнувшись с проблемой палаточного колышка, мы не выбираем объект наугад; мы выбираем камень, потому что считаем, что знаем, как использовать его для создания достаточной силы на столбе. И если мы обнаруживаем, что первый камень терпит неудачу, мы снова ищем решение, но используем знания о наших неудачах для направления наших будущих поисков. Этот стиль решения проблем представляет собой очень структурированный метод обучения методом проб и ошибок: наш поиск имеет элементы случайности, но в пределах правдоподобного пространства решений, так что цель часто может быть достигнута очень быстро.
Здесь мы изучаем когнитивные и вычислительные основы гибкого использования инструментов. В то время как использование человеческого инструмента зависит от ряда когнитивных систем — например, от знания того, как захватывать объект и манипулировать им, или от понимания того, как обычно используется конкретный инструмент, — здесь мы сосредотачиваемся на «механических рассуждениях» или способности спонтанно изменять назначение объектов в наше окружение для достижения новой цели (3⇓ – 5).
Мы нацелены на это механическое рассуждение, потому что это тип использования инструмента, который является типично человеческим.В то время как другие животные могут манипулировать объектами для достижения своих целей, было замечено, что только несколько видов птиц и приматов спонтанно используют объекты по-новому, и мы часто рассматриваем эти действия как одни из наиболее «человеческих» форм познания животных. (например, Рис.1 A и B ) (6). Точно так же, хотя системы искусственного интеллекта (ИИ) становятся все более искусными в восприятии объектов и манипулировании ими, ни одна из них не выполняет быстрых механических рассуждений, которые делают люди.Некоторые искусственные агенты учатся использовать инструменты на демонстрациях экспертов (7), что ограничивает их гибкость. Другие учатся на тысячах лет моделирования опыта (8), который значительно больше, чем требуется для людей. Третьи могут рассуждать о механических функциях произвольных объектов, но требуют совершенных физических знаний об окружающей среде (9), которые недоступны в реальных сценариях. Напротив, даже молодые люди являются способными пользователями инструментов: к 4 годам они могут быстро выбрать подходящий объект и определить, как использовать его для решения новой задачи (например,g. взятие крючковатым, а не прямым трубочистителем для извлечения предмета из узкой трубки; Рис.1 C ) (10).
Рис. 1.Примеры использования предметов для достижения цели. ( A ) Бородатая обезьяна капуцин открывает орех кешью камнем подходящего размера. Печатается по исх. 1, который находится под лицензией CC BY 4.0. ( B ) Ворона Новой Каледонии использует тяжелые блоки, чтобы поднять уровень воды в трубке, чтобы достать пищу (2). ( C ) Малыш использует лопату, чтобы достать мяч.Изображение предоставлено YouTube / Funny Vines (http://youtu.be/hwrNQ93-568?t=198). ( D ) Одно показательное испытание в игре Virtual Tools (https://k-r-allen.github.io/tool-games/). ( D , i ) Игрок должен попасть красным предметом в зеленые ворота, используя один из трех инструментов. ( D , ii ) Игрок выбирает инструмент и где его разместить. ( D , iii ) Физика включена, и инструмент взаимодействует с другими объектами. Действие заканчивается промахом.
Какие когнитивные системы позволяют нам так гибко использовать инструменты и так быстро достигать наших целей? Было высказано предположение, что механическое мышление основывается на ментальном моделировании, которое позволяет нам предсказать, как наши действия вызовут изменения в мире (3). Это универсальное моделирование — необходимый компонент, который поддерживает нашу способность рассуждать об объектах в новой среде, но сам по себе не может объяснить, как мы так быстро составляем и обновляем наши планы. Мы предполагаем, что еще одним ключом к быстрому использованию инструментов является знание того, какие действия следует даже учитывать — как на основе первоначального понимания того, какие действия полезны, так и путем обновления этого убеждения на основе наблюдения за результатом наших действий в моделировании и в реальности.
Эта статья внесла два вклада. Во-первых, мы представляем игру Virtual Tools, которая представляет собой набор задач по решению физических проблем и позволяет проводить точные, поддающиеся количественной оценке сравнения между человеческими и машинными агентами. Во-вторых, мы представляем минимальную модель гибкого использования инструмента, которая называется «образец, моделирование, обновление» (SSUP). Эта модель построена на основе эффективного, хотя и шумного механизма моделирования, который позволяет модели гибко действовать при решении широкого круга физических задач. Для быстрого решения проблем модель SSUP содержит обширные знания об окружающем мире в виде структурированной предварительной информации о возможных инструментах и действиях, которые могут решить проблему, что позволяет ограничить моделирование перспективными кандидатами.Далее он учится на своих симуляциях и наблюдении за результатами своих собственных действий, чтобы обновить свои убеждения о том, какими должны быть эти многообещающие кандидаты. На 30 уровнях виртуальных инструментов в двух экспериментах мы показываем, что реализация модели SSUP фиксирует относительные трудности различных уровней для игроков-людей, конкретные действия, выполняемые для попытки решения каждого уровня, и то, как меняются коэффициенты решения для каждого уровня.
The Virtual Tools Game
Вдохновленные использованием человеческих инструментов, а также играми с мобильной физикой (11), мы предлагаем игру Virtual Tools в качестве платформы для исследования априорных значений, представлений, а также алгоритмов планирования и обучения, используемых при решении физических задач. (https: // kr-allen.github.io/tool-games/). В этой игре игрокам предлагается поместить один из нескольких объектов («инструментов») в двухмерную (2D) динамическую физическую среду для достижения цели: поместить красный объект в зеленую область (Рис. 1 D ). Эта цель одинакова для всех уровней, но то, что требуется для ее достижения, сильно различается. Как только один инструмент размещен, физика мира активируется, так что игроки видят эффект своего действия. Если цель не достигнута, игроки могут «сбросить» мир в исходное состояние и попробовать еще раз; они ограничены одним действием при каждой попытке.Мы разработали 30 уровней — 20 для исходного эксперимента (рис. 2) и 10 для проверочного эксперимента (см. Рис. 7 A ) — для тестирования таких концепций, как «запуск», «блокировка» и «поддержка». Из первых 20 уровней 12 были построены в шести «согласованных парах», которые включали небольшие различия в целях или объектах сцены, чтобы проверить, приведут ли тонкие различия в стимулах к наблюдаемым различиям в поведении.
Рис. 2.Двадцать уровней, используемых в игре Virtual Tools. Игроки выбирают один из трех инструментов (показанных справа от каждого уровня) и помещают его в сцену, чтобы поместить красный объект в зеленую зону ворот.Черные объекты фиксируются, а синие объекты также перемещаются; серые области запрещены для размещения инструмента. Уровни, обозначенные метками A / B, представляют собой согласованные пары.
Игра Virtual Tools представляет особые проблемы, которые, как мы полагаем, лежат в основе рассуждений, необходимых для быстрого решения физических проблем в более общем плане. Во-первых, существует множество задач, которые требуют различных стратегий и физических концепций для решения, но используют общую физическую динамику, которая приближается к реальному миру. Во-вторых, игра требует долгосрочного причинно-следственного рассуждения.Поскольку игроки могут взаимодействовать с игрой только путем размещения одного объекта, они должны иметь возможность рассуждать о сложных причинно-следственных связях своих действий в далеком будущем, когда они больше не смогут вмешиваться. Наконец, игра вызывает у людей быстрое обучение методом проб и ошибок. Люди-игроки обычно не проходят уровни с первой попытки, но также обычно не требуют более 5-10 попыток для достижения успеха. Люди демонстрируют широкий спектр способов решения проблем, в том числе понимание «ага», когда они внезапно обнаруживают правильную идею того, как решить конкретную задачу, а также постепенное уточнение стратегии методом проб и ошибок.Рис. 3 демонстрирует, как это происходит на практике, показывая четыре разных примера, как участники учатся быстро или медленно и открывают различные способы использования инструментов на разных уровнях.
Рис. 3.Примеры поведения участников на трех уровнях, характерные для быстрого обучения методом проб и ошибок: первоначальные планы строятся вокруг объектов, за которыми следует исследование для определения более перспективных стратегий и затем уточнение действий до успеха. Объекты начинаются, как показано голубыми / красными контурами, и следуют по траекториям, очерченным цветными линиями.Возможный выбор инструмента показан под справа . ( A ) На уровне «Катапульта» полезная стратегия часто сразу определяется и быстро настраивается. ( B ) Другие участники сначала пробуют неудачную стратегию, но затем переключаются на более жизнеспособную стратегию и уточняют ее. ( C ) Уровень Launch ( B ) предназначен для предотвращения очевидных решений. Этот участник, возможно, изначально полагал, что мяч начнет катиться, и попытался использовать инструмент в качестве моста.Когда это не удалось, участник осознал необходимость запустить мяч, но только после нескольких попыток обнаружил, как использовать инструмент неочевидным способом для достижения этой цели, посредством зацепления вокруг блокирующего выступа. Затем участнику потребовалось еще несколько попыток, чтобы настроить это действие. ( D ) На уровне SeeSaw участник со второй попытки осознал, что платформа должна поддерживаться, чтобы мяч перекатился, а затем попробовал разные способы добиться этого.
SSUP Модель
Мы рассматриваем компоненты, необходимые для обеспечения гибкости и эффективности использования человеческого инструмента.Мы предлагаем людям достичь гибкости с помощью внутренней ментальной модели, которая позволяет им представить эффекты действий, которые они, возможно, никогда раньше не пробовали («моделировать»). Однако одной ментальной модели недостаточно — существует слишком много возможных действий, которые можно смоделировать, многие из которых неинформативны и вряд ли приведут к достижению конкретной цели. Необходим некоторый механизм для управления внутренним поиском, чтобы сосредоточиться на полезных частях пространства гипотез. Поэтому мы предлагаем людям использовать структурированные объектно-ориентированные априорные значения («образец») и механизм быстрого обновления убеждений («обновление»), чтобы направлять поиск в направлении многообещающих гипотез.Мы формализуем использование человеческих инструментов с этими компонентами в модели SSUP (рис. 4 A ).
Рис. 4.( A ) Алгоритм SSUP. ( B ) Схема модели для игры Virtual Tools. Он включает в себя объектно-ориентированный априор, механизм моделирования для фильтрации предложений и модуль обновления, который предлагает новые предложения на основе наблюдений «в уме» и действий, предпринятых в мире. ( C ) Иллюстрация политики π ‘, развивающейся при попытке уровня.Цветные пятна представляют политику Гаусса для каждого инструмента, как указано цветовым ключом веры.
SSUP вдохновлен теорией «решения проблем как поиск» (12), а также Dyna и другими методами оптимизации политик на основе моделей (13, 14). Важно отметить, что мы постулируем, что структурированные априорные задачи и физические симуляторы уже должны быть в наличии, чтобы решать проблемы так же быстро, как и люди; таким образом, в отличие от большинства методов оптимизации политики на основе моделей, мы не выполняем онлайн-обновления динамической модели.
Мы подчеркиваем, что рассматриваем SSUP как общую структуру моделирования для решения физических проблем, и представляем здесь только один пример этой структуры: минимальную модель (описанную ниже, с более подробной информацией в приложении SI , раздел S2), которая, по нашему мнению, является необходимо, чтобы зафиксировать базовое поведение человека в игре Virtual Tools. В Обсуждении мы выделяем способы улучшения модели в будущей работе, а также аспекты физического мышления, которые опираются на более богатый набор когнитивных систем, выходящих за рамки представленных здесь рамок.
Пример: объектно-ориентированный Prior.
Как минимум, действия, которые мы должны рассмотреть для достижения любой цели, должны иметь потенциал воздействия на нашу окружающую среду. Поэтому мы включаем объектно-ориентированный априор для выборочных действий. В частности, модель выбирает один из подвижных объектов в сцене, а затем выбирает координату x в области, которая немного выходит за пределы ширины объекта, и координату y выше или ниже этого объекта (рис. 4 ). B : образец).Что касается выбора инструмента, мы предполагаем, что участники с одинаковой вероятностью выберут любой из трех инструментов, поскольку все инструменты в игре были разработаны так, чтобы они были незнакомы участникам. Образцы из этого дистрибутива используются для инициализации поиска.
Моделирование: шумный физический движок.
Чтобы определить, какие выборочные действия стоит попробовать в мире, мы предполагаем, что люди используют «интуитивно понятный физический движок» (15), чтобы гибко представить эффекты своих действий. Этот движок способен моделировать мир вперед во времени с приблизительно правильной, но стохастической динамикой (16, 17).Таким образом, определение эффекта предлагаемого действия включает применение этого действия к мысленному представлению и использование интуитивно понятного физического механизма для определения диапазона способов, которыми действие может привести к развертыванию мира (18, 19). Здесь мы реализуем моделирование с использованием игрового физического движка с шумной динамикой. Обычно люди имеют зашумленные прогнозы того, как разрешатся столкновения (16), поэтому для простоты мы предполагаем, что неопределенность результатов вызвана только шумом в этих столкновениях (направление и количество силы, приложенной между двумя сталкивающимися объектами).*
Поскольку внутренняя модель несовершенна, для оценки действия мы производим небольшое количество стохастических симуляций (nsims, здесь установлено четыре), чтобы сформировать набор гипотез о результате. Чтобы формализовать, насколько хорош результат (награда за данное действие), мы заимствуем идею из литературы по причинно-следственной логике о том, как люди концептуализируют «почти» успех (20). Почти успешный результат зависит не от абсолютного расстояния, на которое вы продвинулись к цели, а от того, насколько сильно это действие имело значение.Чтобы зафиксировать это, записывается минимальное расстояние между зеленой зоной ворот и любым из красных объектов ворот; эти значения усредняются по моделированию и нормализуются на минимальное расстояние, которое было бы достигнуто, если бы не был добавлен инструмент. Вознаграждение, используемое в SSUP, равно 1 минус нормализованное расстояние, поэтому более близкие объекты приводят к более высокому вознаграждению.
Как только модель находит достаточно хорошее действие (формализованное как среднее вознаграждение, превышающее некоторый порог), она предпринимает это действие «в мире».Кроме того, чтобы смоделировать временные рамки для размышлений, если модель рассматривает более T различных предложений действий без каких-либо действий (здесь установлено пять), она предпринимает наилучшие действия, которые она себе представляла. Мы оцениваем влияние выбора всех параметров в анализе чувствительности ( SI Приложение , рис. S1).
Обновление: учимся на мыслях и действиях.
До сих пор мы описали способ интеллектуальной инициализации поиска, чтобы избежать рассмотрения действий, которые не будут полезны.Но что, если априор по-прежнему представляет собой неразрешимо большое пространство возможных действий?
Чтобы решить эту проблему, мы включаем механизм обновления, который учится как на моделированном, так и на реальном опыте, чтобы направлять будущий поиск в более перспективные области пространства гипотез (21). Формально это определяется как политика модели гауссовой смеси по трем инструментам и их положениям, π ′ (s), которая отражает мнение модели о важных действиях для каждого инструмента. π ′ (s) инициализируется выборками из объектно-ориентированного предшествующего уровня и обновляется с использованием простого алгоритма градиента политики (22).Этот алгоритм будет формировать апостериорные убеждения вокруг областей для размещения каждого инструмента, которые, как ожидается, будут перемещать целевые объекты близко к цели и, следовательно, могут содержать решение. Такая стратегия обновления полезна, когда она находит важные действия, которые находятся рядом с успешными действиями, но также могут застрять в локальных оптимумах, где успешного действия не существует. Поэтому мы используем стандартный метод обучения с подкреплением: эпсилон-жадное исследование. При эпсилон-жадном исследовании потенциальные действия выбираются из политики 100 − 100% времени и из предыдущих ϵ% времени.Обратите внимание, что это исследование используется только для предложения внутреннего моделирования; Действия модели выбираются на основе набора результатов моделирования. Это похоже на размышление о чем-то новом, вместо того, чтобы сосредоточиться на существующей стратегии.
Результаты
Мы анализируем производительность человека на первых 20 уровнях игры Virtual Tools и сравниваем людей с моделью SSUP и ее альтернативами, включая модели SSUP с абляциями и двумя альтернативными базовыми уровнями обучения. Мы показываем, что полная модель SSUP лучше всего отражает производительность человека.Доступ к игре и всем данным, включая размещение людей и моделей, предоставляется по адресу https://k-r-allen.github.io/tool-games/.
Человеческие результаты.
Эксперименты были одобрены Комитетом Массачусетского технологического института по использованию людей в качестве субъектов экспериментов в соответствии с протоколом 0812003014. Участники были уведомлены о своих правах до начала эксперимента, могли в любой момент прекратить участие, закрыв окно браузера, и денежная компенсация за свое время.
Мы набрали 94 участника через Amazon Mechanical Turk и попросили каждого участника решить 14 уровней: все 8 несовпадающих уровней и по одному варианту каждой из 6 совпадающих пар (выбранных случайным образом).
Участники могли продолжить работу после решения проблемы или по прошествии 2 минут. См. SI Приложение , раздел S1 для получения дополнительной информации.
Разница в сложности между уровнями игры была значительной. Участники показали средний уровень решения 81% (SD = 19%), с диапазоном от 31% для самого сложного уровня до 100% для самого простого.Точно так же участники предприняли в среднем 4,5 действия (SD = 2,5) для каждого уровня с диапазоном от 1,5 до 9,4 средних попыток. Даже в рамках испытаний наблюдалась большая неоднородность в количестве действий, которые участники использовали для решения уровня. Этого можно было ожидать при обучении методом «быстрого проб и ошибок»: участники, которые изначально пробовали многообещающее действие, быстро решали головоломку, в то время как другие изучали различные действия, прежде чем переходить к многообещающим (например, рис. 3).
Поведение различается во всех шести совпадающих парах уровней.Мы изучаем, действительно ли эти тонкие различия влияют на поведение, даже без обратной связи по первому действию, спрашивая, можем ли мы определить, из какого варианта уровня произошло каждое действие. Мы находим, что эти действия можно различить на соответствующих уровнях в «Шахтах», «Предотвращении», «Запуске» и «Таблице» с первой попытки, но не в «Падении» или «Башнях» (см. Приложение SI , рис. S11 и раздел S6A для подробностей). Однако участникам требовалось разное количество действий для решения каждого уровня (все ts> 2.7, пс <0,01). Это говорит о том, что люди обращают внимание на тонкие различия в сцене или цели, чтобы выбрать свои действия.
Результаты модели.
Мы исследуем несколько показателей для сравнения моделей с человеческими данными. Во-первых, мы смотрим, как быстро и как часто каждая модель решает каждый уровень и соответствует ли это участникам. Это измеряется как корреляция и среднеквадратичная ошибка (RMSE) между средним количеством попыток участников для каждого уровня и средним количеством попыток модели для каждого уровня, а также корреляцией и RMSE между скоростью решения человека и модели.Модель SSUP хорошо объясняет модели человеческого поведения на разных уровнях ( SI Приложение , Таблица S2). Он использует одинаковое количество попыток на каждом уровне (r = 0,71; 95% ДИ = [0,62,0,76]; среднее эмпирическое количество попыток на всех уровнях 4,48; среднее количество попыток модели 4,24; рис. 5 A ) и достигает аналогичных результатов. точность (r = 0,86; 95% ДИ = [0,76,0,89]; Рис. 5 B ).
Рис. 5.( A ) Сравнение среднего количества попыток участников-людей для каждого уровня со средним количеством попыток для модели SSUP.Столбцы указывают 95% доверительный интервал оценок средних значений. ( B ) Сравнение точности участников-людей в каждом испытании с точностью модели SSUP. ( C ) Сравнение точности участников со всеми альтернативными моделями. Числа соответствуют испытаниям на рис. 2.
На многих уровнях модель SSUP не только достигает той же общей скорости решения, что и люди, но и приближается к ней с той же скоростью. Мы измеряем это, глядя на совокупные коэффициенты решения — по всем участникам или прогонам модели, какая доля решила каждый уровень в пределах X мест размещения — и обнаруживаем, что люди и модель часто демонстрируют схожие профили решений (рис.6 А ; см. SI Приложение , раздел S6B для количественного сравнения).
Рис. 6.( A ) Совокупный коэффициент решения по количеству размещений для участников по сравнению с моделью SSUP. ( B ) Распределение действий модели (фон) по сравнению с действиями человека (баллами) при первой и последней попытках уровня для выбора из четырех уровней. Распределение действий модели оценивается на основе подгонки оценки плотности ядра к действиям, предпринимаемым моделью в 250 симуляциях.Цвета указывают на используемый инструмент, а инструменты и соответствующие цвета показаны в позиции Справа каждого уровня. На большинстве уровней модель SSUP хорошо отражает эволюцию решений участников, включая конкретные выбранные действия; в тех немногих случаях, когда они отличаются, нет альтернативной модели, которая систематически объясняет эти различия.
Мы можем более подробно рассмотреть, как модель выполняет это, сравнив как первые действия, которые предпринимают люди и модель, так и действия, которые оба предпринимают для решения уровня (рис.6 В ). Как и наши участники-люди, модель выполняет существенно разные действия при первой попытке между совпадающими парами уровней ( SI Приложение , раздел S6A). В более общем плане и люди, и модель часто начинают с множества правдоподобных действий (например, катапульты). В некоторых случаях оба будут пытаться выполнить начальные действия, которые очень мало влияют на сцену [например, SeeSaw и Prevention (B)]; это может быть связано с тем, что люди не могут придумать каких-либо полезных действий и поэтому решают попробовать что-то, подобное тому, как модель может превысить свой порог симуляции.Однако в других случаях первоначальные прогнозы модели расходятся с человеческими, и это приводит к другой модели поиска и решений. Например, в «Падении» (A) модель быстро обнаруживает, что размещение объекта под контейнером надежно опрокинет мяч на землю, но люди склонны бросать объект сверху. Из-за этого модель часто быстро решает уровень с объектом внизу, тогда как часть участников находит способ перевернуть контейнер сверху; это несоответствие также можно увидеть при сравнении количества попыток до решения, когда модель находит решение быстро, а людям требуется гораздо больше времени (рис.5 А ). Для сравнения первого и последнего действий на всех уровнях см. Приложение SI , рис. S11.
Сравнение моделей виртуальных инструментов.
Мы сравниваем полную модель SSUP с набором из шести альтернативных моделей. Три модели исследуют вклад каждого компонента SSUP, удаляя предыдущие, моделируя или обновляя по отдельности. Две модели предлагают альтернативные методы решения: изучение лучших моделей мира вместо изучения действий (настройка параметров) или замена предшествующих моделей и имитатора изученным механизмом предложения (Deep Q Network [DQN, исх.23] + обновление). Альтернативная модель настройки параметров использует логический вывод для изучения плотности объектов, трения и эластичности по наблюдаемым траекториям. Выученный механизм предложения соответствует безмодельному агенту глубокого обучения с подкреплением (23), который обучается на наборе из 4500 случайно сгенерированных уровней игры ( SI Приложение , раздел S5), а затем обновляется онлайн для каждого из 20 тестов. уровни с использованием того же механизма, что и SSUP. Эта модель имеет значительно больший опыт работы со средой, чем другие модели, и служит проверкой того, могут ли безмодельные методы использовать этот опыт для изучения обобщаемых политик, которые могут направлять быстрое обучение.Наконец, мы сравниваем с базовым уровнем производительности «предположения», если бы агент просто размещал инструменты случайным образом. См. Рис. 5 C и SI Приложение , Таблица S2 для этих сравнений.
Исключение любого из трех компонентов SSUP приводит к значительному снижению производительности (измеряется как отклонение между эмпирическими и модельными кривыми кумулятивного решения; все загруженные ps <0,0001; дополнительные подробности см. В приложении SI , раздел S6B и рис. S6). Уменьшенные модели обычно требуют большего количества попыток решения уровней, потому что они ищут в неправильной области пространства действий (без предварительного), предпринимают действия, которые не имеют шансов на успех (без моделирования), или не направляют поиск в более перспективные области. (без обновления).
Обновление DQN + работает хуже всех возможных альтернативных моделей, используя наибольшее количество действий и решая уровни со скоростью, едва превышающей шанс. Поскольку это эквивалентно модели без имитации с другим предшествующим уровнем, ее низкая производительность предполагает, что обобщенные политики действий не могут быть легко изучены путем многократного прохождения одинаковых уровней ( SI Приложение , раздел S5).
Поскольку модель настройки параметров эквивалентна модели без обновления, за исключением того, что свойства модели динамики могут быть изучены при настройке параметров, сравнение этих двух моделей позволяет нам проверить, нужно ли нам предполагать, что люди изучают динамику мир в этой игре.Тот факт, что обе модели работают примерно одинаково (рис. 5 C ), предполагает, что здесь нам не нужно это предположение.
Наконец, мы количественно оценили, насколько хорошо каждая модель отражает конкретные действия людей. Из-за неоднородности ответов участников мы не смогли четко дифференцировать производительность моделей, за исключением того, что модель обновления DQN + уступала остальным ( SI Приложение , раздел S6C). Тем не менее, ни одна модель не достигла теоретического предельного уровня шума, предполагая, что компоненты структуры SSUP могут быть улучшены, чтобы лучше объяснять действия участников ( Обсуждение ).
Проверка новых уровней.
Мы провели второй эксперимент, чтобы проверить, можно ли обобщить модели на новые уровни и физические концепции без настройки гиперпараметров. Для этого эксперимента мы создали 10 новых уровней: 6 новых типов уровней и 4 варианта исходных уровней (рис. 7 A ), протестировав независимую выборку из 50 участников на всех уровнях. 6 новых типов уровней были разработаны для проверки новых физических стратегий, включая балансировку, разрушение и удаление предметов с пути мяча.Все остальные экспериментальные детали были идентичны основному эксперименту.
Без настройки каких-либо параметров модели мы находим хорошее соответствие между скоростью решения человека и моделью (рис. 7 B ) и сильную корреляцию между производительностью модели и производительностью человека по количеству размещений (рис. 7 C , r = 0,85) и точности (рис.7 D , r = 0,95). Как и в основном эксперименте, мы обнаруживаем снижение производительности при удалении предшествующего или имитационного моделирования или для модели обновления DQN + (все загружаемые ps <0.0001; SI Приложение , рис. S7). Однако, несмотря на то, что численно хуже, мы не находим надежной разницы, если механизм обновления удален (p = 0,055) или заменен на обучение модели (p = 0,346), предполагая, что конкретная функция вознаграждения или процедура обновления могут быть менее применимы к этим. уровней ( SI Приложение , раздел S6B).
Рис. 7.Результаты 10 дополнительных испытаний. ( A ) Испытания, использованные для второго эксперимента. ( B ) Совокупная скорость решения для участников и модель SSUP.( C ) Сравнение количества действий человека и модели путем испытания. ( D ) Сравнение точности человека и модели в каждом испытании.
Обсуждение
Мы представляем игру Virtual Tools для исследования гибкого решения физических проблем у людей и машин и показываем, что человеческое поведение при решении этой задачи выражает широкий спектр стратегий решения проблем методом проб и ошибок. Мы также представляем модель для решения физических проблем человека: образец, моделирование, обновление.Модель предполагает, что для решения этих физических проблем люди полагаются на внутреннюю модель того, как устроен мир. Поэтому обучение в этой игре включает в себя сжатие этих обширных мировых знаний, чтобы быстро научиться действовать в каждом конкретном случае, используя структурированный поиск методом проб и ошибок.
Ограничения модели.
Хотя модель SSUP, которую мы использовали, решает многие уровни игры Virtual Tools по-человечески, мы считаем, что это лишь первое приближение к богатому набору когнитивных процессов, которые люди привносят в задачу.В частности, модель недостаточна по крайней мере по двум причинам: она полагается на очень простые априорные факторы и ее планирование и обобщение только в прямом направлении.
Мы можем видеть пределы объекта-априора на уровне падения (A) (рис. 5 B ): люди гораздо реже рассматривают возможность размещения объекта под контейнером, чтобы его опрокинуть. Вместо этого многие люди пытаются опрокинуть его сверху, хотя это и труднее. Таким образом, приоритеты людей перед стратегиями зависят от контекста, что заставляет их действовать медленнее, чем модель на этом уровне.В других случаях эта контекстная специфичность полезна: например, на гипотетическом уровне, показанном на рис. 8 A , есть дыра, в которую подозрительно идеально подходит один из инструментов. Многие люди быстро замечают это совпадение, но поскольку модель не может оценить, как инструменты могут вписаться в среду, не выполняя симуляцию, она дает успех только в 10% случаев. В будущей работе более сложный априор может быть реализован в рамках SSUP, но остается открытым вопрос, как люди могут формировать эти контекстно-зависимые априорные элементы или как они могут формироваться с течением времени на основе опыта.
Рис. 8.Две проблемы, демонстрирующие ограничения текущей модели. ( A ) «Подозрительное совпадение» в том, что один инструмент идеально подходит для отверстия. ( B ) Создание «подцели» для переброски мяча на другую сторону полезно.
Люди демонстрируют большую гибкость, чем наша модель, в способности работать в обратном направлении от состояния цели, чтобы найти более легко решаемые подцели (24). На гипотетическом уровне, показанном на рис. 8 B , катапульта привередлива, что означает, что большинство катапультов не преодолеют барьер и, следовательно, никогда не попадут по мячу слева.Вместо этого, самый простой способ увеличить целевую функцию — это неправильная стратегия удара по мячу справа, чтобы приблизиться к цели, и поэтому модель решает уровень только в 8% случаев. Работа в обратном направлении для постановки первой подцели по запуску мяча через барьер предотвратит застревание с выбиванием мяча, как минимум локально. С инженерной точки зрения создание подцелей естественно для дискретных пространств проблем (12), но менее ясно, как они могут быть обнаружены в непрерывном пространстве действий игры Virtual Tools.
Родственные когнитивные системы.
Существует обширный объем исследований когнитивных систем, лежащих в основе использования реальных инструментов, включая понимание того, как ими манипулировать, и знание их типичного использования (например, ссылки 3, 4, 10 и 25). Здесь мы сосредоточились на «механическом знании» инструментов: как использовать предметы в новых ситуациях. Однако при использовании инструментов в реальном мире эти системы работают вместе с моторным планированием и семантическими знаниями инструментов. Дальнейшая работа может быть сосредоточена на этих связях, например, на том, как новые инструменты становятся привычными или как наши моторные ограничения ограничивают планы, которые мы могли бы рассмотреть.
Игра Virtual Tools представляет собой задачу решения проблем, которая сочетает в себе аспекты предыдущей работы, но включает в себя новую задачу. Для быстрого решения этих проблем требуется хорошее предварительное знание динамики — в отличие от решения сложных задач, при котором динамика изучается в развивающейся ситуации (26) — и дальнейшая итерация после рассмотрения многообещающего решения — в отличие от момента «ага», который немедленно приводит к к решению в решении задач инсайта (27, 28). В отличие от традиционного обучения с подкреплением на основе моделей или без моделей, в этой задаче люди приносят богатые модели мира, которые они могут быстро адаптировать к конкретным новым проблемам.
Превращение богатого знания мира в полезное знание задачи необходимо любому агенту, взаимодействующему со сложным миром. Одно из предложений относительно того, как это происходит, — это «обучение мышлением» (29): перевод знаний из одного источника (внутренние модели физики) в другой, более конкретное воплощение (отображение между действиями и результатами на этом конкретном уровне). Мы показываем, как SSUP реализует один пример обучения мышлением: путем обучения политики с данными из внутренней модели. Доказательства такого рода передачи знаний были обнаружены у людей (30, 31), но основное внимание уделялось более простым дискретным условиям, в которых модель и политика изучаются совместно.
Виртуальные инструменты как вызов ИИ.
В предварительных экспериментах с подходами к обучению с подкреплением без использования моделей (23) мы обнаружили ограниченное обобщение с неэффективным обучением почти на всех уровнях виртуальных инструментов ( SI Приложение , раздел S5), несмотря на значительный опыт работы со связанными уровнями.
Основываясь на наших экспериментах на людях, мы полагаем, что для возможности играть в такие игры, как Virtual Tools, потребуются подходы на основе моделей. Такие подходы становятся все более популярными в машинном обучении (32), особенно в сочетании с методами «обучения для обучения», которые могут научить быстро адаптироваться к новым задачам (33, 34).Изучение этих моделей остается сложной задачей, но подходы, включающие добавленную структуру, в последние годы преуспели (35, 36). В сообществах искусственного интеллекта и робототехники уже популярны методы, основанные на моделях (9, 37, 38). Остающиеся проблемы включают в себя изучение достаточно точных моделей, которые можно использовать с необработанными данными датчиков (39), и способы работы с динамическими средами.
Virtual Tools добавляет к растущему набору сред, которые проверяют способность искусственных агентов предсказывать и рассуждать с использованием физики, например, параллельно разрабатываемый тест физического мышления (PHYRE) (40) и другие (41⇓ – 43).Напротив, мы фокусируемся на решении проблем, которые люди считают сложными, но интуитивно понятными, решения которых неочевидны и не зависят от точного знания мировой динамики. Предоставляя человеческие данные для сравнения искусственного и биологического интеллекта, мы надеемся предоставить испытательную площадку для более похожих на человека искусственных агентов.
Будущие эмпирические направления.
Эта работа представляет собой начальную попытку формализовать вычислительные и эмпирические основы гибкого использования инструментов, но еще многое предстоит изучить.Например, мы не находим доказательств того, что люди больше узнают об окружающем мире, возможно, потому, что дополнительная точность здесь не приносит особой пользы. Но есть случаи, когда изучение динамики явно полезно (например, обнаружение того, что объект необычно тяжелый или приклеенный), и мы ожидаем, что люди обновят свои физические убеждения в этих случаях. Когда и каким образом люди обновляют свои внутренние модели для поддержки планирования — важная область исследования.
Дети могут узнать, как использовать существующие объекты, раньше, чем они смогут создавать новые инструменты (10), что говорит о том, что создание инструментов является более сложной задачей, чем их использование.Тем не менее, предполагается, что именно способность создавать и затем передавать новые инструменты движет человеческой культурой (44). Поэтому важно понимать не только то, как люди используют инструменты, но и то, как они их разрабатывают и передают, что мы можем изучить, расширив пространство действия игры Virtual Tools.
Заключение
Понимание того, как гибко использовать инструменты для достижения наших целей, является основной и центральной познавательной способностью. В игре Virtual Tools мы обнаруживаем, что люди эффективно используют инструменты для решения широкого спектра физических проблем.Мы можем объяснить это быстрое обучение методом проб и ошибок с помощью трех компонентов структуры SSUP: богатые предшествующие мировые знания, моделирование гипотетических действий и способность учиться как на симуляциях, так и на наблюдаемых действиях. Мы надеемся, что эта эмпирическая область и структура моделирования могут обеспечить основу для будущих исследований этой типично человеческой черты: использование, создание и рассуждение об инструментах и, в более общем плане, формирование физического мира для наших целей.
Благодарности
Мы благодарим Лесли Кельблинг, Роджера Леви, Эрика Шульца, Джессику Хэмрик и Тома Сильвера за полезные комментарии и Марио Белледонне за помощь с моделью настройки параметров.Эта работа была поддержана Премией Центра научных технологий Национального научного фонда CCF-1231216; Управление военно-морских исследований Междисциплинарной университетской исследовательской инициативы (ONR MURI) N00014-13-1-0333; и гранты на исследования от ONR, Honda и Mitsubishi Electric.
Сноски
Авторы: K.R.A., K.A.S. и J.B.T. спланированное исследование; K.R.A. и K.A.S. проведенное исследование; K.R.A. и K.A.S. проанализированные данные; и K.R.A., K.A.S. и J.B.T. написал газету.
Авторы заявляют об отсутствии конкурирующей заинтересованности.
Настоящий документ является результатом Коллоквиума Артура М. Саклера Национальной академии наук «Мозг производит разум путем моделирования», состоявшегося 1–3 мая 2019 г. в Центре Арнольда и Мейбл Бекман Национальных академий наук. и инжиниринг в Ирвине, Калифорния. Коллоквиумы NAS начались в 1991 году и с 1995 года публикуются в PNAS. С февраля 2001 года по май 2019 года коллоквиумы поддерживались щедрым подарком от Дамы Джиллиан и доктора Ф.Фонд искусств, наук и гуманитарных наук Артура М. Саклера, посвященный памяти мужа дамы Саклер, Артура М. Саклера. Полная программа и видеозаписи большинства презентаций доступны на веб-сайте NAS http://www.nasonline.org/brain-produces-mind-by.
Эта статья представляет собой прямое представление PNAS. Н.К. Приглашенный редактор по приглашению редакционной коллегии.
Размещение данных: доступ к игре Virtual Tools и всем данным, включая размещение людей и моделей, предоставляется на GitHub, https: // k-r-allen.github.io/tool-games/.
* Мы также рассмотрели модели с добавленными дополнительными источниками неопределенности физических моделей, но обнаружили, что дополнительные параметры не улучшают соответствие модели, поэтому мы не анализируем эти модели здесь.
Эта статья содержит вспомогательную информацию в Интернете по адресу https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.1912341117/-/DCSupplemental.
Манифест проб и ошибок в науке — JOTE
В «Манифест проб и ошибок в науке » мы изложили наше видение научной практики и научных публикаций, а также тесной связи между ними.Вы также можете просмотреть или скачать версию в формате pdf.
Мы заявляем, что…
Метод проб и ошибок — это элементарный процесс в науке, посредством которого приобретаются знания. Мы различаем два типа научных процессов проб и ошибок:
- Методологические ошибки в практическом смысле, способствующие улучшению понимания и применения методов. Эти ошибки здесь понимаются в широком смысле, как те, которые выходят за рамки знаний отдельного исследователя и влияют на масштабы научного сообщества.
- Концептуальные ошибки , возникающие из-за того, что гипотеза противопоставлена противоречивым наблюдениям. Когда первоначальные гипотезы неуместны перед лицом эмпирических данных, ученые улучшают или отвергают теоретические основы, разрабатывая альтернативные тезисы, направленные на повышение эмпирической адекватности. Не только попадания (положительные результаты), но и промахи (отрицательные результаты) являются ключом к научному прогрессу.
Мы выделяем три основные проблемы современной науки.А именно…
- … публичный имидж науки, основанный на революционных открытиях, захватывающих изображениях и ясных результатах. За эту репутацию приходится платить. И сами ученые, и философы, социологи и историки науки все чаще подчеркивают важность науки в процессе становления. Более правдивая картина науки — практика и методология тонкой настройки — кажется, противоречит нереалистичному общественному имиджу науки больших открытий.
- … разрыв между тем, что опубликовано и тем, что исследовано . Мы знаем, что предвзятость в отношении положительных публикаций заставляет ученых скрывать методологические ошибки и отказываться от исследований, содержащих отрицательные результаты, что угрожает правильной интерпретации. Перед лицом неудачных исследований — результатов науки, которые не соответствуют первоначальной цели отдельных исследователей — у ученых есть два доступных варианта: не публиковать или рассматривать результаты как продуктивные, например, добавляя специальные гипотезы в потенциально неадекватная манера.Этот момент является следствием ожиданий науки о больших открытиях и политики «опубликовай или исчезни » этой Науки.
- … кризис репликации. Поскольку ученые подтверждают свои результаты с точки зрения воспроизводимости, нынешняя ситуация невоспроизводимых экспериментов представляет собой серьезную проблему. Дебаты по поводу этого кризиса репликации сосредоточились на неправильном использовании статистических данных учеными, методологической небрежности или теоретической несоответствии. Лишь немногие заведения обращают внимание на потенциальный вред.
Мы стоим в контексте…
- … призыв к демократизации науки. Общество справедливо требует, чтобы результаты были доступны как для общественности, так и для коллег-ученых. Что еще более беспокоит, так это то, что отдельные исследователи или граждане должны платить большие суммы государственных денег, чтобы получить доступ к результатам исследований, в основном финансируемых государством. Нам необходимо переосмыслить то, как наука передается через традиционные каналы публикации.
- … потребность в диалоге.Мы выделяем узкоспециализированное академическое сообщество, стремящееся решать социальные и интеллектуальные проблемы и размышлять над ними, зачастую непродуктивно. Из-за разрозненной организации университетских кафедр и факультетов конструктивный диалог между различными племенами передовой науки отсутствует. В контексте вышеупомянутых проблем, связанных с пагубным общественным имиджем науки, предвзятостью публикаций, кризисом репликации и недоступностью науки, проблема отсутствия коммуникации должна быть решена еще более срочно.Перед лицом этих многогранных проблем нам нужны полезные решения для будущего науки.
Поэтому предлагаем
Журнал, служащий платформой для проб и ошибок в науке. Мы хотим опубликовать (1) методологические ошибки, которые приводят к продуктивным выводам для научного сообщества в целом, и (2) концептуальные ошибки в виде отрицательных результатов. Кроме того, наша инициатива направлена на создание платформы, чтобы открыто говорить о неудачах. Это не значит, что мы хотим публиковать неряшливую науку.Скорее, мы считаем, что, говоря об ошибках, ученые могут узнать, что можно и чего нельзя делать в их методах и концепциях. Кроме того, поскольку отрицательные результаты очень информативны, это поможет облегчить проблему предвзятости публикации и переосмыслить кризис репликации. Молодые исследователи — это надежда на перемены в науке, поэтому мы серьезно относимся к их работе и идеям. Мы стремимся публиковать высококачественные работы молодых ученых, прошедшие экспертную оценку и отредактированные более старшими учеными.По каждой опубликованной статье предметному специалисту или философу, историку, антропологу или социологу науки будет предложено поразмышлять, тем самым ответив и проблематизируя вопрос «что пошло не так?». Эта комбинация призвана обеспечить новизну и качество нашего журнала.
Так что…
- … и общество, и члены научного сообщества оценивают научные усилия более реалистично и продуктивно. Создавая форум для неудач, мы стремимся отдать должное трудностям эмпиризма.Мы, в Журнале проб и ошибок, признаем, что борьба науки за практику является решающим элементом в генерации и распространении знаний.
- … разрыв между тем, что исследуется, и тем, что публикуется, будет ликвидирован. В ответ на ложную дихотомию между публикацией достижений и публикацией ничего, мы стремимся предоставить платформу для публикации ошибок без страха и стыда. Мы утверждаем, что допустить ошибку в эксперименте и быть ученым-участником вполне допустимо, если мы переосмыслим, что означает неудача.Мы уже знаем, что метод проб и ошибок продуктивен в научной практике; сейчас мы изучаем, что означает продуктивность в научных публикациях
- … кризис репликации понимается во всей его сложности. Наш проект направлен на создание общей основы для размышлений об одном из ориентиров науки: воспроизводимости. И ученые-эмпирики, и ученые-гуманитарии давно задумывались о том, что значит показывать (не) сопоставимые, (несовместимые) или (не) идентичные результаты. Наш журнал предлагает место для обмена такими разными взглядами.
- … пользователи научных результатов получают неограниченный доступ к актуальному научному контенту. В эпоху открытой науки мы разделяем оптимизм бесплатного обмена статьями и результатами и хотим распространить его на обмен данными, методами и ошибками.
- … методологический плюрализм конкретен и конструктивно сфокусирован, тем самым помогая ученым совершать продуктивные ошибки, чтобы они могли опробовать полезные решения социальных и интеллектуальных проблем.
В соавторстве с основателями JOTE
Martijn van der Meer
Max Bautista Perpinyà
Stefan Gaillard
Nayra Hammann
Jobke Visser
Davide Cavalieri
Поддерживается всеми действующими членами и ведущими редакторами.
Дрессировка собак — Как собаки учатся методом проб и ошибок
Методом проб и ошибок
Собаки — умные животные. Они будут пытаться снова и снова, особенно если они столкнутся с проблемой, которую хотят решить. Любой, кто видел, как собака добиралась до печенья в шкафу или сбегала из конуры, знает это.
Собака, которая хочет выбраться из безопасного огороженного двора, предпримет несколько разных попыток побега. Сначала он может бегать по периметру в поисках дыры в заборе.Он может попытаться закопаться или даже забраться на свою собачью будку, пытаясь перепрыгнуть. От каждой неудачной попытки отказываются в поисках нового решения. Этот метод проб и ошибок помогает Фидо учиться.
Собака не будет повторять поведение, за которое не полагается вознаграждение. Так что, если собака не может перепрыгнуть через забор и не может копать под забором, она скоро откажется от этого поведения в пользу чего-то нового. Он может прыгнуть в ворота забора, увидев, как люди входят и выходят из двора через них. Это случайное испытание может дать результаты — хотя изначально случайно.Однако, поскольку желаемый результат был достигнут, собака теперь повторяет это поведение, все больше и больше осознавая, что именно она делает каждый раз, когда открывает ворота. Вскоре он может целенаправленно подойти к забору и открыть ворота. Он освоил новый навык, потому что столкнулся с проблемой и систематически исключал неправильное поведение, пока не нашел правильное решение.
Понимание метода обучения вашей собаки может помочь вам научить ее реагировать на простые команды послушания.Основная причина неудачных тренировок заключается в том, что владелец ожидает, что его питомец будет думать и реагировать, как люди. Если вы будете помнить об этом методе проб и ошибок, вы избавите себя и свою собаку от стресса.
Еще один ключ к успешному обучению послушанию — это местоположение. Лучше всего начать процесс в установленном месте с минимальными отвлекающими факторами. Как только вы оба освоитесь с командами, пора начинать тренировку за пределами этой знакомой зоны. Ожидайте неудач.Собаки ситуативны по своей природе, поэтому команда, которую непременно следует выполнять дома, может быть проигнорирована в парке (или где-либо еще). Вам следует ожидать повторного обучения команд в новых настройках, хотя на этот раз обучение должно происходить намного быстрее.
Гвен Бохенкамп указывает в статье «Обучение послушанию вашей собаки или щенка: как и почему», что, хотя это может показаться шагом назад, чтобы добавить отвлекающих факторов к вашим тренировкам, бессмысленно иметь собаку, которая сидит по команде только тогда, когда никто здесь.Хорошо воспитанная собака выгодна только в том случае, если она сидит и остается, когда компания у дверей. Отвлечения — это предсказуемая часть жизни; Ваша собака должна быть готова слушаться вас, несмотря на стук в дверь, пуделя в парке или любое другое вмешательство.
Дрессировка послушания не должна быть однообразной для вас или вашей собаки. Практикуйтесь ежедневно, но позвольте урокам проникнуть в повседневную деятельность, пока они не станут вашей второй натурой.
Первооткрыватель: обучение методом проб и ошибок
Луиза Хейс, доктор философии
Первооткрыватель помогает нам выйти за рамки и учиться методом проб и ошибок.
Использование силы первооткрывателя — один из самых крутых аспектов DNA-V, молодежной модели терапии принятия и приверженности (ACT) . Шагните вместе со мной внутрь первооткрывателя и представьте его себе.
Вы — первооткрыватель младенцев. Однажды во время еды вы подталкиваете чашку-поильник прямо к краю подноса стульчика для кормления, смотрите, как она падает на пол, и слушаете приятный стук. Родитель смеется, берет его и кладет обратно на поднос.
Вау, вы это видели? У тебя сильный ребенок. Вы открываете свое агентство методом проб и ошибок. Мир ждет, чтобы вы его толкнули, ткнули и перелезли через него.
По мере того, как начинается детство, ваше поведение первооткрывателя расширяется, и вы учитесь двигаться в физическом и социальном мире. Метод проб и ошибок — ваш проводник. В конце концов, вы узнаете, что ваш родитель будет брать чашку-поилку очень часто.
Вы появляетесь подростком. Независимость становится вашим Святым Граалем, а детское обращение с ней не терпит.Вы красите волосы, подстригаете их, меняете одежду, превращаетесь в нового себя, двигаясь с телом, которого вы с трудом узнаете. Вы постоянно не обращаете внимания на риски, пробуя новую любовь, дружбу и выходя на улицу в одиночестве. Иногда вы заходите слишком далеко, и ваши отчаявшиеся родители пытаются удержать конец веревки, пока вы сильно тянете. В других случаях вы говорите, заявляете о себе, раскрываете свою страсть в мире и требуете большего. Вы презираете коррупцию, жадность и взрослых, которые говорят с вами. Как первооткрыватель вы идете методом проб и ошибок.Ваша задача — упорно идти вперед, пока мир не покажет вам свои края.
Первооткрыватель в DNA-V стремится использовать аспекты развития, связанные с вовлечением, переживанием, попытками и тестированием. Мы помогаем молодым людям укреплять свои сильные стороны и создавать ценности путем обучения методом проб и ошибок. Когда у молодых людей есть пространство, чтобы открыть для себя их разговор с самим собой и изучение истории (советник), они могут стать гибкими. Сегодня мы видим подростков-первооткрывателей в действии, когда они встают и говорят своим голосом взрослым.
См. Также: «Процветающий подросток: гостевой пост» Луизы Хейс
У взрослых есть две задачи для наших первооткрывателей-подростков:
- Сможем ли мы слушать достаточно долго, чтобы услышать возможности, по которым они могут научить нас новыми глазами?
- Можем ли мы удерживать веревку и быть их опорой, пока они учатся сильно тянуть — падая, но с защитной сеткой?
Если мы сможем это сделать, мы как взрослые первооткрыватели выиграем.
Получите бесплатную возможность заглянуть на новый курс Луи Хейса по запросу!
.