Конспект по теме «Восприятие»
ВОСПРИЯТИЕ
Восприятие это наглядно-образное отражение действующих в данный момент на органы чувств, предметов и явлений действительности в совокупности их различных свойств и частей.
Прежде всего, процесс информации ни в коей мере не является результатом простого раздражения органов чувств и доведения до коры мозга возбуждений от периферически воспринимающих образов. В процесс восприятия всегда включены двигательные компоненты (ощупывание предметов и движение глаз, выделяющие наиболее информативные точки; пропевание или проговоривание соответствующих звуков, играющих существенную роль в определении наиболее существенных особенностей звукового потока). Поэтому восприятие правильнее всего обозначить как воспринимающую (перцептивную) деятельность субъекта.
Далее, восприятие тесно связано с оживлением следов прошлого опыта: сличением доходящей до субъекта информации с ранее сложившимися представлениями; выделением существенных признаков; созданием гипотез о предполагаемом значении доходящей до него информации; синтезом воспринимаемых признаков в целые комплексы «принятием решения» о том, к какой категории относится воспринимаемый предмет.
Наконец, важно и то обстоятельство, что восприятие предмета никогда не осуществляется на элементарном уровне: оно захватывает высшие уровни психической деятельности, в частности речь.
СВОЙСТВА ВОСПРИЯТИЯ
Предметность восприятия выражается в так называемом акте объективации, т.е. в отнесении сведений, получаемых из внешнего мира к этому миру. Предметность не будучи врожденным качеством, выполняет ориентирующую и регулирующую функцию в практической деятельности. Предметность формируется на основе процессов, в конечном счете всегда внешне двигательных, обеспечивающих контакт с самим предметом. Без участия движения наши восприятия не обладали бы качеством предметности, т.е. отнесенностью к объектам внешнего мира. Предметность как качество восприятия играет особую роль в регуляции поведения. Обычно мы определяем предметы не по их виду, а в соответствии с их практическим назначением или их основным свойством.
Целостность. В отличие от ощущения, отражающего отдельные свойства предмета, восприятие дает целостный его образ. Он складывается на основе обобщения знаний об отдельных свойствах и качествах предмета, получаемых в виде различных ощущений. С целостностью восприятия связана его структурность. Восприятие в значительной мере не отвечает нашим мгновенным ощущениям и не является простой их суммой. Мы воспринимаем фактически абстрагированную из этих ощущений обобщенную структуру, которая формируется в течение некоторого времени. Источники целостности и структурности восприятия лежат в особенностях самих отражаемых объектов.
Константностью восприятия называется относительное постоянство некоторых свойств предметов при изменении его условий. Благодаря свойству константности, состоящему в способности перцептивной системы (совокупность анализаторов, обеспечивающих данный акт восприятия) компенсировать эти изменения, мы воспринимаем окружающие нас предметы как относительно постоянные. В наибольшей степени константность наблюдается при зрительном восприятии цвета, величины и формы предметов.
Константность восприятия цвета — относительная неизменность видимого цвета при изменении освещения. Явление константности цвета обуславливается совокупным действием ряда причин, среди которых большое значение имеют адаптация к общему уровню яркости зрительного поля, светлостный контраст, а также представления о действительном цвете предметов и условиях их освещенности.
Константность восприятия величены предметов, называется относительное постоянство видимой величины предметов при их различной (но не очень большой) удаленности.
Константность восприятия формы предметов заключается в относительной неизменности ее восприятия при изменении положения по отношению к линии взора наблюдателя. С каждым изменением положения предмета относительно глаз форма его изображения на сетчатке меняется благодаря движению глаз по контурным линиям предметов и выделению характерных сочетаний контурных линий, известных нам по прошлому опыту.
Осмысленность восприятия. Восприятие у человека теснейшим образом связано с мышлением. Сознательно воспринимать предмет — значит мысленно назвать его, т.е. отнести к определенной группе, классу, обобщить его в слово.
Восприятие не определяется просто набором раздражителей, воздействующих на органы чувств, но представляет собой постоянный поиск наилучшего толкования, имеющихся данных.
Апперцепция. Восприятие зависит не только от раздражения но и от самого субъекта. Воспринимают не глаз и ухо а конкретный живой человек, и поэтому в восприятии всегда сказываются особенности личности человека. Зависимость от содержания психической жизни человека, от особенностей его личности называется апперцепцией.
КЛАССИФИКАЦИЯ ВОСПРИЯТИЙ
Обычно восприятие — результат взаимодействия ряда анализаторов. Двигательные ощущения в той или иной степени участвуют во всех видах восприятий. В качестве примера можно назвать осязательное восприятие, в котором участвуют тактильный и кинестезический анализаторы. Аналогично в слуховом и зрительном восприятиях также участвует двигательный анализатор. Различные виды восприятия редко встречаются в чистом виде; обычно они комбинируются, и в результате возникают сложные виды восприятий.
Основой другого типа классификации восприятий являются формы существования материи: пространство, время и движение. В соответствии с этой классификацией выделяют восприятие пространства, восприятие времени и восприятие движения.
Сложные формы восприятия
Восприятие пространства.
В основе восприятия трехмерного пространства лежит функция специального вестибулярного аппарата, расположенного во внутреннем ухе. Этот аппарат имеет характер трех изогнутых полукружных трубок, расположенных в вертикальной, горизонтальной и сагиттальной плоскостях, заполненных жидкостью. Когда человек меняет положение головы, жидкость, заполняющая каналы, меняет свое положение, раздражая волосковые клетки, и их возбуждение вызывает изменения в ощущении устойчивости тела (статические ощущения).
Этот аппарат тесно связан с аппаратом глазодвигательных мышц и каждое изменение в вестибулярном аппарате вызывает рефлекторные изменения в положении глаз. Такая тесная взаимная связь между вестибулярным и глазодвигательным аппаратом, вызывающим оптико-вестибулярные рефлексы, входит в качестве существенного компонента в систему восприятия.
Вторым существенным аппаратом, обеспечивающим восприятие пространства и прежде всего глубины, является аппарат бинокулярного зрительного восприятия и ощущения мышечных усилий от конвергенции глаз. Для отчетливого восприятия предметов нужно, чтобы их изображение падало на соответствующие (корреспондирующие) точки сетчатки, а это невозможно без конвергенции обоих глаз. Если при конвергенции глаз возникает незначительная диспаратность изображений, появляется ощущение удаленности предмета или стереоскопический эффект. При большей диспаратности точек сетчатки обоих глаз, на которые падает изображение, возникает двоение предмета.
Таким образом, импульсы вследствие относительного напряжения мышц глаз, обеспечивающих конвергенцию и смещение изображения на обеих сетчатках, являются вторым важным компонентом для восприятия пространства.
Третьим важным компонентом восприятия пространства являются законы структурного восприятия, описанные гештальтпсихологами. К ним присоединяется и последнее условие — влияние хорошо закрепленного прежнего опыта, которое может существенно воздействовать на восприятие глубины, а в некоторых случаях — приводить к возникновению иллюзий.
Восприятие времени.
Наиболее элементарными формами являются процессы восприятия длительности последовательности, в основе которых лежат элементарные ритмические явления, известные под названием «биологических часов». К ним относятся ритмические процессы, протекающие в нейронах коры и подкорковых образований. Смена процессов возбуждения и торможения при длительной нервной деятельности, воспринимается как волнообразно чередующиеся усиления и ослабления звука при длительном вслушивании.
Характерной особенностью времени является его необратимость.
Поскольку время — направленная величина, вектор, однозначное его определение предполагает не только систему единиц измерений (секунда, минута, час, столетие), но и постоянную отправную точку, от которой ведется счет. В этом время радикально отличается от пространства. Настоящее — отправная точка, из которой определяются и прошлое и будущее, не является в психологическом времени абстрактной точкой, а всегда — некоторым временным интервалом.
Восприятие движения.
Восприятие движения — очень сложный вопрос, природа которого еще не вполне ясна. В восприятии движения значительную роль, несомненно, играют косвенные признаки, создающие опосредованное впечатление движения — наклонное положение, меньшая отчетливость очертаний движущегося предмета и множество других. Однако нельзя все же толковать восприятие движения как лежащий за пределами собственно восприятия чисто интеллектуальный процесс: впечатление движения может возникнуть и тогда, когда мы знаем, что движения в самом деле нет. Мы, таким образом, можем не только делать умозаключения о движении, но и воспринимать его.
Теории движения разбиваются в основном на 2 группы.
Первая группа теорий выводит восприятие движения из элементарных следующих друг за другом зрительных ощущений отдельных точек, через которые проходит движение, и утверждает, что восприятие движения возникает вследствие влияния этих элементарных зрительных ощущений (В. Вундт).
Теории второй группы утверждают, что восприятие движения имеет специфическое качество, не сводимое к таким элементарным ощущениям. Представители этой теории говорят, что подобно тому, как, например, мелодия не является простой суммой звуков, а отличным от них качественно специфическим целым, так и восприятие движения не сводимо к сумме составляющих это восприятие элементарных зрительных ощущений. Из этого положения исходит теория гештальтпсихологии (М. Вертгеймер).
Преднамеренное и непреднамеренное восприятие.
Различают восприятие непреднамеренное (или непроизвольное) и преднамеренное (или произвольное).
При непреднамеренном восприятии мы не руководствуемся заранее поставленной целью или задачей — воспринят данный предмет. Восприятие направляется внешними обстоятельствами.
Преднамеренное восприятие может быть включено в какую-либо деятельность и осуществляется по ходу ее выполнения. Но иногда восприятие может выступать и как относительно самостоятельная деятельность.
Восприятие как самостоятельная деятельность особенно ясно выступает в наблюдении, которое представляет собой преднамеренное, планомерное и более или менее длительное (хотя бы с промежутками во времени) восприятие с целью проследить течение какого-либо явления или те изменения, которые происходят в объекте восприятия.
Связь ощущений и восприятий.
В предыдущей главе мы рассматривали ощущение. Суть этого процесса также состоит в отражении реально существующего мира. Понятия «ощущение» и «восприятие» взаимосвязаны между собой, однако между ними существуют и коренные различия. Когда мы говорили об ощущениях, то подчеркивали, что их содержание не выходит за пределы элементарных форм отражения, а суть процессов ощущения заключается в отражении лишь отдельных свойств объектов и явлений окружающего нас мира. Однако реальные процессы отражения внешнего мира выходят далеко за пределы элементарных форм. Человек живет не в мире изолированных световых или цветовых пятен, звуков или прикосновений, он живет в мире вещей, предметов и форм, в мире сложных ситуаций. Все, что бы человек ни воспринимал, неизменно предстает перед ним в виде целостных образов.
Отражение этих образов выходит за пределы изолированных ощущений. Опираясь на совместную работу органов чувств, происходит синтез отдельных ощущений в сложные комплексные системы. Этот синтез может протекать как в пределах одной модальности (например, когда мы смотрим кинокартину, происходит объединение отдельных зрительных ощущений в целые образы), так и в пределах нескольких модальностей (воспринимая апельсин, мы фактически объединяем зрительные, осязательные, вкусовые ощущения, присоединяя к ним и наши знания о нем). Лишь в результате такого объединения изолированные ощущения превращаются в целостное восприятие, переходят от отражения отдельных признаков к отражению целых предметов или ситуаций. Поэтому основным отличием восприятия от ощущения является предметность осознания всего, что воздействует на нас, т. е. отображение объекта реального мира в совокупности всех его свойств или, иными словами, целостное отображение предмета.
Как вы уже догадались, восприятие включает в себя ощущение и основывается на нем. При этом всякий перцептивный образ включает в себя целый ряд ощущений, так как любой предмет или явление обладают многими и различными свойствами, каждое из которых способно независимо от других свойств вызвать ощущение. Однако было бы ошибочным полагать, что такой процесс (от относительно простых ощущений — к сложному образу восприятия) является простым суммированием отдельных ощущений. На самом деле восприятие (или отражение) целых предметов или ситуаций гораздо сложнее. Помимо ощущений в процессе восприятия задействован предыдущий опыт, процессы осмысления того, что воспринимается, т. е. в процесс восприятия включаются психические процессы еще более высокого уровня, такие как память и мышление. Поэтому восприятие очень часто называют перцептивной системой человека.
В настоящее время существуют различные теории процесса распознавания образов. В этих теориях основное внимание уделено следующему вопросу: как внешние сигналы, воздействующие на органы чувств, преобразуются в осмысленные перцептивные образы? Как правило, мы опознаем окружающие нас предметы и события легко и быстро; поэтому может создаться впечатление, что связанные с распознаванием операции просты и непосредственны. Однако это совсем не так. Попытки инженеров создать машины, которые были бы способны распознавать символы и звуки, обычные для окружающей нас среды, в большинстве случаев заканчиваются неудачей. Системы восприятия животных, даже самых примитивных, по своим возможностям далеко опережают подобные машины.
Исследования психофизиологов показывают, что восприятие является очень сложным процессом, требующим значительной аналитико-синтетической работы. Прежде всего, получаемая нами информация об объектах и явлениях окружающего нас мира ни в коей мере не является результатом простого раздражения органов чувств и доведения до коры мозга возбуждения от периферических воспринимающих органов. В процесс восприятия всегда включены двигательные компоненты (ощупывание предметов и движение глаз при восприятии конкретных предметов; пропевание или проговаривапие соответствующих звуков при восприятии речи). Поэтому восприятие правильнее всего обозначать как воспринимающую (перцептивную) деятельность субъекта. Результатом этой деятельности является целостное представление о предмете, с которым мы сталкиваемся в реальной жизни.
В свою очередь, целостное отражение предмета требует выделения из всего комплекса воздействующих признаков (цвет, форма, вес, вкус и т. д.) основных ведущих признаков с одновременным отвлечением (абстракцией) от несущественных. Вероятно, мы не ошибемся, если выскажем предположение о том, что на данном этане восприятия в формировании перцептивного образа может принимать участие мышление. В то же время следующий этап восприятия требует объединения группы основных существенных признаков и сопоставления воспринятого комплекса признаков с прежними знаниями о предмете, т. е. в процессе восприятия участвует намять. Если при таком сопоставлении гипотеза о предлагаемом предмете совпадает с поступающей информацией, возникает узнавание предмета и происходит его восприятие. Если гипотеза не согласуется с реально доходящей до субъекта информацией, поиски нужного решения продолжаются до тех пор, пока субъект не найдет его, т. е. пока он не узнает предмет или не отнесет его к определенной категории. Причем следует иметь в виду, что восприятие знакомых предметов (чашка, стол), их узнавание происходит очень быстро — человеку достаточно объединить два-три воспринимаемых признака, чтобы прийти к нужному решению. Однако при восприятии новых или незнакомых предметов узнавание их протекает гораздо сложнее и в более развернутых формах. Полное восприятие таких предметов возникает как результат сложной аналитико-синтетической работы, при которой выделяются одни, существенные, признаки, тормозятся другие, несущественные, и воспринимаемые признаки объединяются в одно осмысленное целое. Поэтому скорость узнавания или отражения объекта реального мира во многом определяется тем, насколько восприятие, как процесс, активно, т. е. насколько активно идет отражение этого объекта.
Следовательно, огромную роль в восприятии играет наше желание воспринимать тот или иной предмет, сознание необходимости или обязанности воспринять его, волевые усилия, направленные на то, чтобы добиться лучшего восприятия, настойчивость, которую мы в этих случаях проявляем. Таким образом, в восприятии предмета реального мира задействованы внимание и направленность (в данном случае желание).
Говоря о роли желания воспринимать объекты окружающего нас мира, мы невольно доказываем то, что наше отношение к тому, что мы воспринимаем, имеет большое значение для процесса восприятия. Предмет может быть интересен или безразличен для нас, т. е. он может вызывать у нас различные чувства. Естественно, что интересный для нас предмет будет восприниматься нами более активно, и наоборот, безразличный для нас предмет мы можем даже не заметить.
Таким образом, необходимо сделать вывод, что восприятие — это весьма сложный, но вместе с тем — единый процесс, направленный на познание того, что в данный момент воздействует на нас.
Виды восприятия — Студопедия
Поделись с друзьями:
Можно выделить несколько подходов к классификации восприятия.
Различные виды восприятия редко встречаются в чистом виде. Обычно восприятие – результат взаимодействия ряда анализаторов. Обычно они комбинируются, и в результате возникают сложные виды восприятия. Так, восприятие учеником текста на уроке включает зрительное, слуховое и кинестетическое восприятие.
Восприятие пространства
К пространственным свойствам предмета относятся: величина, форма, положение в пространстве.
В восприятии величины предмета существенную роль играет величина его изображения на сетчатке. Чем больше изображение предмета на сетчатке, тем большим нам кажется предмет. Величина изображения воспринимаемого предмета на сетчатке глаза зависит от величины зрительного угла. Чем больше величина зрительного угла, тем больше изображение на сетчатке глаза.
Восприятие величины предмета определяется не только величиной изображения предмета на сетчатке, но и восприятием расстояния, на котором мы находимся от предмета. Данную закономерность можно выразить так:
Воспринимаемый размер = Зрительный угол х Расстояние.
Учет удаления предметов в основном осуществляется за счет нашего опыта восприятия предметов при меняющемся расстоянии до них. Существенной поддержкой восприятия величин предметов служит знание о приблизительной величине предметов. Как только мы узнаем предмет, мы сразу воспринимаем его величину такой, какая она есть на самом деле. Однако если мы находимся очень далеко от предмета, то он нам кажется меньше, чем на самом деле.
Другой особенностью восприятия предмета в пространстве является контраст предметов. Окружение, в котором находится воспринимаемый нами предмет, оказывает заметное влияние на его восприятие. Например, человек среднего роста в окружении высоких людей кажется значительно меньше своего настоящего роста.
На восприятие величины предмета может оказывать влияние и то целое, в котором находится предмет. Так, например, две совершенно равные диагонали двух параллелепипедов воспринимаются разными по длине, если одна из них находится в меньшем, а другая — в большем параллелепипеде.
На восприятие предмета в пространстве влияют и другие факторы. Например, верхние части фигуры кажутся больше нижних, так же как вертикальные линии кажутся длиннее горизонтальных. Кроме того, на восприятие величины предмета оказывает влияние цвет предмета. Светлые предметы кажутся несколько большими, чем темные. Объемные формы, например шар или цилиндр, кажутся меньше соответствующих плоских изображений.
Столь же сложным, как восприятие величины, является восприятие формы предмета. П ри восприятии формы явление константности также сохраняется. Восприятие формы в значительной степени зависит от нашего опыта. Восприятие формы предмета, находящегося на значительном удалении, может меняться. Так, мелкие детали контура по мере удаления предмета исчезают, и его форма приобретает упрощенный вид. Может меняться и форма в целом. Например, прямоугольные предметы кажутся округлыми. Восприятие формы предмета, находящегося на значительном удалении, может меняться. Так, мелкие детали контура по мере удаления предмета исчезают, и его форма приобретает упрощенный вид. Может меняться и форма в целом. Например, прямоугольные предметы кажутся округлыми.
Очень сложен процесс восприятия объемной формы. Мы воспринимаем объем формы потому, что человеческие глаза обладают способностью бинокулярного зрения. Бинокулярный эффект обусловлен тем, что человек смотрит двумя глазами. Суть бинокулярного эффекта заключается в том, что когда оба глаза смотрят на один и тот же предмет, изображение этого предмета па сетчатке левого и правого глаза будет различно, потому что одни и те же точки книги попадают не на координирующие точки сетчатки, т. е. не на такие, которые находятся на одном и том же расстоянии и в одном и том же направлении от центра сетчатки, а на диспарантные точки, расположенные в каждом глазу на различном расстоянии от центра. При бинокулярном зрении смещение изображений на сетчатке глаз вызывает впечатление одного, но объемного, рельефного предмета.
Большую роль в восприятии объемной формы предмета играет знание объемных признаков данного предмета, а также распределение света и тени на объемном предмете.
Восприятие человеком пространства имеет целый ряд особенностей. Это обусловлено тем, что пространство трехмерно, и поэтому для его восприятия необходимо задействовать целый ряд совместно работающих анализаторов. При этом восприятие пространства может протекать на разных уровнях.
В восприятии трехмерного пространства задействованы функции специального вестибулярного аппарата, расположенного во внутреннем ухе. Вестибулярный аппарат тесно связан с глазодвнгательпыми мышцами, и каждое изменение в нем вызывает рефлекторные изменения в положении глаз. Вторым аппаратом, обеспечивающим восприятие пространства, и прежде всего его глубины, является аппарат бинокулярного зрения.
Восприятие глубины главным образом связано с восприятием удаленности предметов и расположением их относительно друг друга. Существенную роль в восприятии удаления предметов, или пространственной глубины, играет конвергенция и дивергенция глаз, Под конвергенцией понимается сведение зрительных осей глаз за счет поворота глазных яблок навстречу друг другу. Например, это происходит при переходе взора с далекого предмета на близкий. При обратном переходе – с близкого на далекий предмет – наблюдается дивергенция глаз, т. е. поворот их в стороны, разведение зрительных осей. Как конвергенция, так и дивергенция вызываются сокращением и расслаблением глазных мышц.
Наряду с ощущениями от конвергенции и дивергенции глаз (при переводе взора с далекого предмета на близкий и обратно) мы получаем ощущения от аккомодации глаза. Явление аккомодации заключается в том, что форма хрусталика при удалении и приближении предметов меняется. Это достигается сокращением или расслаблением мышц глаза, что влечет за собой определенные ощущения напряжения или расслабления, которых мы не замечаем, но которые воспринимаются соответствующими проекционными полями коры головного мозга.
В восприятии пространства важную роль играет восприятие расположения предметов по отношению друг к другу. Часто бывает, что об удаленности мы судим по косвенным признакам: один предмет закрывает другой, или контуры одного предмета заметны более, чем контуры другого.
Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:
Восприятие и взаимодействие
Восприятие и взаимодействиеВосприятие и взаимодействие
Доктор К. Джордж Бори
Университет Шиппенсбурга
Восприятие
Восприятие — зрение, слух, осязание, обоняние, вкус, осязание в положение суставов и напряжение мышц, равновесие, температура, боль… — начинается со стимуляции сенсорных нейронов. Каждое чувство включает в себя высокоразвитые клетки, чувствительные к определенным стимул: боль рецепторы реагируют на определенные химические вещества, образующиеся, когда ткани поврежден. Рецепторы осязания включают клетки с волосками, которые при согнуты, вызывают сигналы путешествовать вниз по аксону клетки. Баланс, движение и даже слух вовлекать подобные волосковые клетки. Нейроны, чувствительные к температуре, реагируют на тепло и холод. Вкус и запах рецепторы реагируют на молекулы окружающей среды так же, как и другие нейроны отвечать к нейротрансмиттерам. И нейроны сетчатки реагируют на в наличие света или определенные частотные диапазоны света, которые мы воспринимаем как цвет.
Но восприятие — это больше, чем просто пассивное восприятие информация. Восприятие — это активный процесс: Прикосновение, к примеру, требует движения — то, что в наши дни мы называется «сканирование». Touch включает информацию о вас (например, о ваших мышцах, суставах), а также о том, что вы трогательный. То же самое можно сказать и о слухе. Мы действительно должны называть это слушаю! Звук сам по себе, конечно, движется — он постоянно меняется. Если бы это было не так, мы бы перестали это слышать!
То же самое и со зрением. Видение предполагает постоянное движение — наших глаз, головы и тела, или вещей, которые мы видим, или всего выше. Внешние части нашей сетчатки особенно чувствительны к движение, поэтому, когда что-то попадает в поле нашего зрения, наше внимание притягивается к этому. Даже тот факт, что у нас есть два глаза (бинокулярное зрение), является своего рода движение: два вида немного отличаются, как если бы мы переместили на несколько дюймов влево или вправо. Если бы мы смотрели и смотрели на сцену мы смотрим совершенно неподвижно, все бы все стало белым!
Мы также должны помнить, что восприятие не является чем-то сделанным. глазами, ушами или любым другим органом чувств. Это мультисенсорный, полный телом: «Годовалый ребенок стоит на пол комнаты упадет, если стены бесшумно и внезапно сдвинуть вперед несколько дюймов, хотя его ничего не касается» (Нейссер, стр. 116, ссылаясь Ли и Аронсону, 1974)
«Сырье» восприятия
Процессу восприятия предстоит многое сделать с самого начала. начало: Мы не в том положении, чтобы понимать мозаика бессмысленных точек света или несвязных звуков или запахи. Даже когда В 1890-х годах Уильям Джеймс указал, что мы не только воспринимаем вещи, но отношения такие как «и» и «или» а также.
Возьмите руки и поднимите их перед собой на расстоянии нескольких дюймы. Вы, конечно, видите свои руки, и нетрудно представить, что восприятие это вопрос определенных узоров света, за которыми следуют похожие узоры нейронных возбуждений. Но заметьте, что вы также воспринимаете свое Руки как «рядом друг с другом», тогда как на самом деле это восприятие не непосредственно представлен для вас как стимул в том, как сами ваши руки.
Многое из того, что мы переживаем, приходит «предварительно упакованным», готовым к нашему потребление. Природа дает «края» — изменения света паттернов, переходов, звуков — чтобы мы могли выбрать объекты вне их окружения. Для например, мы видим вещи выделяющимися на фоне, чем-то называется явление фигура-фон , представленное датским феноменолог Эдгар Рубин (1886-1951).
Рубин продемонстрировал феномен, создав свой классический пример ан неоднозначная ситуация фигура-фон:
По сути, мы воспринимаем один аспект события как цифру . а другой как наземный . На рисунке Рубина нет истинных фигура и фон. Это рисунок, на котором выдает себя за . объект. Двусмысленность этого вынуждает нас использовать смещающееся внимание, которое мы давать к вазе или к лицам, чтобы увидеть то или иное.
Глубина — главный пример того, что мы переживаем напрямую, без необходимость опережающего толкования. Традиционно это было предполагаемый что мы конструируем глубину по таким ключам, как перспектива и родственник размер. Но нам нужно использовать такие подсказки только тогда, когда мы смотрим на картинки, которые являются подделка глубины! На самом деле, мы видим истинной глубины потому что это есть, чтобы увидеть.
Опять же, именно тот факт, что видение включает в себя движение, показывает нам правда дела. Например, вещи, которые ближе к нам, меняются позиция быстрее, чем предметы, которые находятся дальше, и удаленные предметы форма фоны для близких. Помнишь с детства, как в луна, казалось, следовала за тобой, пока ты ехал, а телефонные столбы взбитый к со скоростью миллион миль в час?
Элеонора Гибсон заняла свое место в истории книг по психологии с ее эксперимент с визуальным обрывом. Она построили специальную таблицу: У одной половины было оргстекло с наклеенным прямо под ним шахматным рисунком. Другая половина тоже был оргстекло, но в шахматном порядке было пару футов внизу, на полу. В между ними была доска. Затем младенцев помещали на доску, и их матери просили уговорить их переползти через ту или иную сторону. Предполагать который сторона, которую они не хотели попробовать? Судя по всему, дети вполне способны видя глубина с очень небольшим, если вообще есть, опытом работы со «утесами».
Гештальты
гештальта психологов — немецких исследователей по имени Макс Вертхаймер, Курт Коффка и Вольфганг Кёлер. открыл много других способов, которыми то, что мы воспринимаем, уже организованный.
Гештальт-психология основана на наблюдении, что мы часто испытывать вещи, которые не являются частью наших простых ощущений. оригинальное наблюдение принадлежало Вертгеймеру, когда он заметил, что мы воспринимаем движение там, где ничего нет нечто большее, чем быстрая последовательность отдельных сенсорных событий. Это то, что он видел в игрушечном стробоскопе, купленном на вокзале во Франкфурте, и что он видел в своей лаборатории, когда экспериментировал с вспышками света в стремительный последовательность (как рождественские огни, которые, кажется, движутся вокруг дерево, или причудливые неоновые вывески в Лас-Вегасе, которые кажутся движущимися). Эффект называется кажущимся движением , а вообще это основной принцип позади движение изображения и телевидение.
Если мы видим то, чего нет, то что мы видим? Ты мог позвонить это иллюзия, но это не галлюцинация. Ветхеймер объяснил, что ты видят эффект всего события, не содержащийся в сумме в части. Мы видим бегущую цепочку огней, хотя только один свет огни одновременно, потому что все событие содержит отношения между индивидуальный огни, которые мы испытываем также.
Мы созданы для того, чтобы ощущать структурированное целое так же, как и индивидуальные ощущения. И мы не только имеем возможность Итак, у нас есть мощная встроенная склонность к этому. Мы даже добавляем структуру к событиям, которые не иметь структурные качества гештальта.
В восприятии есть много организующих принципов, называемых гештальтом. законы . Самый общий называется законом pragnanz . Прагнанц это Немецкий для беременных, но в смысле беременных смыслом, а не беременная с ребенком. Этот закон гласит, что мы врожденно склонны к переживанию. вещи в качестве хороший гештальт насколько это возможно. «Хорошо» может означать многое здесь, такая правильность, упорядоченность, простота, симметричность и т. д., которые затем относятся к конкретным законам гештальта.
Например, набор точек, очерчивающих форму звезды, скорее всего быть воспринимается как звезда, а не как набор точек. Мы склонны завершать рисуй, сделай так, как «должно быть», доделай. Как мы как-то суметь увидеть это как «Б»…
Закон закрытия гласит, что если чего-то не хватает в в противном случае полный рисунок, мы будем стремиться добавить его. Треугольник, для например, с небольшая часть его края отсутствует, все равно будет виден треугольник. Мы воля «закрыть» пробел.
Закон подобия говорит, что мы будем стремиться к группировке похожие предметы вместе, чтобы увидеть их как образующие гештальт в более крупной форме. Здесь является простой типографский пример:
О ХХХХХХХХХ
Х О ХХХХХХХХ
ХХ О ХХХХХХХХ
ХХХ О ХХХХХХ
ХХХХ О ХХХХХ
ХХХХХ О ХХХХХ
ХХХХХ О ХХХХ
ХХХХХХ О ХХХ
ХХХХХХХ О ХХ
ХХХХХХХХ О Х
ХХХХХХХХХ О
Для нас вполне естественно видеть буквы «о» в виде линии в поле х.
Другим законом является закон близости . Вещи, которые близки вместе, как считается принадлежащим друг другу. Например…
****************
****************
****************
Вы с гораздо большей вероятностью увидите три ряда близко расположенных звездочек *. чем 14 вертикальных коллекций по 3* в каждой.
Далее идет закон симметрии . Взгляни на это пример:
[ ][ ][ ]
Несмотря на необходимость сгруппировать скобки, ближайшие к каждой другой вместе, симметрия подавляет наше восприятие и заставляет нас видеть их как пары симметричных скоб.
Другой закон закон преемственности . Когда мы сможем увидеть линия, для например, продолжая через другую строку, а не останавливаясь и начиная, мы сделаем так, как в этом примере, который, как мы видим, состоит из двух линии, не как сочетание двух углов…:
Гештальтпсихологи также указывали, что когда мы видим утку и слон, в их характере мало такого, что могло бы заставить нас воспринимать их как принадлежащие друг другу. Но если они оба идут вместе в одинаковом направлении через поле, их общий путь немедленно воспринимается как связь между ними.
Но принципы гештальта никоим образом не ограничиваются восприятием — именно там они были впервые замечены. Возьмем, к примеру, память — что тоже похоже работает по этим законам. Если вы видите неправильный зуб пилы фигура, вполне вероятно, что ваша память немного исправит это для вас. Или, если вы испытываете что-то, что не совсем имеет для вас смысл, вы будете иметь тенденцию помнить, что это имеет значение, которого, возможно, не было. Хороший пример это сны: понаблюдайте за собой в следующий раз, когда вы расскажете кому-то сон и видеть если вы не замечаете, что немного модифицируете сон, чтобы форсировать его к смысл!
Гештальт-теория хорошо известна своей концепцией обучения прозрению . Люди склонны неправильно понимать то, что здесь предлагается: Гештальт психологи говорят не столько о вспышках интуиции, сколько о решении а проблему посредством распознавания гештальта или организации принцип.
Самый известный пример обучения прозрению связан с шимпанзе по имени Султан. Ему было поставлено множество различных практических задач (большинство включая получение труднодоступный банан). Когда, например, ему разрешили играть с палки, которые можно было сложить как удочку, он, казалось, учитывать, очень по-человечески ситуация с недосягаемым бананом задумчиво — а потом довольно внезапно вскочить, собрать жерди, и достичь банан.
В аналогичном примере пятилетняя девочка получила задачка по геометрии выше ее головы: как вычислить площадь параллелограмм? Она задумалась, а потом взволнованно попросила пару ножницы. Она отрезала треугольник с одного конца и переместил его на другую сторону, повернув в параллелограмм в простой прямоугольник. Вертхаймер назвал это продуктивное мышление.
Восприятие полезности
Многие психологи, в том числе феноменологи и гештальтологи. психологи, расскажите о непосредственном восприятии использования объекты. Некоторые вещи «предоставляют различные возможности для действия, нести последствия того, что произошло или произойдет, принадлежат связно с более широким контекстом, обладают идентичность, которая выходит за рамки их простых физических свойств». (Нейссер, п. 71)
Рубин назвал это утилитарным определением : «Мы сразу видим что молоток предназначен для того, чтобы бить молотком, карандаш — для письма, трубка — для курение.» (Из, стр. 15) Коффка назвал этот характер требования : «Каждая вещь говорит, что она есть… фрукт говорит: «Съешь меня»; вода говорит ‘Пей мне;’ гром говорит «Бойся меня…» (Коффка, стр. 7)
Дж.Дж. Гибсон назвал их возможностями: «возможностями в окружающая среда, что она предлагает животное, что оно дает или снабжает , к добру или к худу… «ценности» и «смысл» вещей в окружающая среда может быть непосредственно воспринята» (Гибсон, стр. 127)
«Удлиненный предмет среднего размера и веса позволяет владеть им. Если используется чтобы ударить или ударить, это дубинка или молоток . Если используется шимпанзе за решеткой затащить банан за пределы досягаемости, это что-то вроде грабли . В любом случае это продолжение руки. Жесткий посох также дает рычаг и это использование рычаг . Острый продолговатый предмет дает прокалывание — если большое то копье , если маленькое то игла или шило ». (Гибсон стр. 128)
А также для предметов, которыми можно резать (ножи) или метать (шарики) или связывание (веревка) или «следоведение» (ручка, кисть, карандаш…).
«Разные места обитания могут иметь разные возможности. В одних местах еда обычно есть, а в других ее нет. Есть опасные места, такие как край обрыва и районы, где хищники таиться. Есть места убежища от хищников. Среди них есть место где находятся помощник и детеныш, дом, который обычно является частичным корпус. Животные умеют то, что психологи называют обучением на месте. Они могут найти путь к важным местам» (Гибсон, стр. 136)
«Среда, вещества, поверхности, места и другие животные имеют аффордансы для данного животного. Они предлагают выгоду или вред, жизнь или смерть. Вот почему их нужно воспринимать» (Гибсон, стр. 143)
«Разные вещества окружающей среды имеют разные возможности для питания и для производства. Различные объекты среда имеет разные возможности для манипуляции. Другой животные позволяют, выше все, богатый и сложный набор взаимодействий, сексуальных, хищнических, воспитание, борьба, игра, сотрудничество и общение. Что другие лица, включает в себя всю сферу общественного значения для людей» (Гибсон, стр. 128)
Восприятие человека
Как следует из последней цитаты, эта идея прямого восприятия смысл вещей применим и к восприятию людей. Философы иногда говорить о «проблеме другого»: Откуда мы знаем, что другой человек на самом деле другой человек, как и мы, сознательный, способный мыслить и чувство? Замечаем ли мы сходство с тем, как мы себя ведем, и каким-то образом мы пришли к такому выводу? Или нам всего см. их личность?
Феноменологический психолог Франц Фром заставил людей посмотреть на разнообразие из фильмов и описывать увиденное. Он обнаружил, что «Когда мы должны описывать последовательность поведения, мы обычно делаем это, указывая на восприятие некоторый психологическое состояние у поступающего человека.» (Из, стр. 7)
«…когда мы воспринимаем человеческое поведение как действие…подразумеваемое в воспринимаемой материальной последовательности существует определенная смысл (который он написал как сенс). Тем самым я значит, что мы воспринимают поведение как управляемое психическим фактором». (Из, стр. 69) Этот психический фактор также называется намерением, цель, или значение.
Мы можем видеть смысл в поведении животных, даже насекомых: я не могу рассказывать вы, как меня впечатлили богомолы и садовые пауки. Они действительно смотреть на вас, следить за вашими движениями, реагировать с большой осторожностью… даже хотя мозги у них маленькие, как рисовое зернышко!
Это относится даже к вещам, которые на самом деле вовсе не живые — т. е. мы могу ошибаться насчет смысла! Фриц Хайдер и Марианна Зиммель провел эксперимент. с привлечением фильм о треугольниках, движущихся «целенаправленно»: люди видели треугольники как имеющие намерения! Рубин имел в виду других людей, животных и даже видимо целеустремленный треугольник как психоидных сущностей .
Когда мы наблюдаем за людьми, отсутствие смысла на самом деле специальный случай! От кого рассказывает эту историю:
«Однажды днем, когда мы с профессором Рубином уже надели наши пальто, собираясь идти домой из лаборатории, Рубин сказал: От.’ В В тот же момент он сел за стол и посмотрел прямо перед собой, пока сделал короткие резкие горизонтальные движения вправо-влево в воздухе перед ему правой рукой, держа вместе указательный и большой пальцы вместе. Мне только что удалось подумать что-то вроде «Что, черт возьми, случилось с Вбивать в голову,’ когда он раздобыл карандаш и лист бумаги, нарисовал систему маленький стрелки и пододвинул ко мне бумагу, сказав: «Вот код для в предохранитель на моем велосипеде. Не могли бы вы поехать за мной домой на велосипеде? ранее восприятие чего-то совершенно непонятного было немедленно заменены, а цель его поведения, т. е. записать код который он «держал в пальцах», стало совершенно очевидным…» (Из, стр. 13)
Ожидание
Восприятие в самом широком смысле — это вопрос взаимодействия между в мир и себя. В самом простом случае мир дает нам события; мы в свою очередь, придают смысл этим событиям, интерпретируя их и воздействуя на них.
Тут очевидные детали: у нас ощущения (вход от мир, стимулы) и действия (выход в мир, ответы). Там было время, когда психологи думали, что этого достаточно. Теперь мы знаем лучше, и добавляем еще две детали, которые называются ожидание и адаптация .
Предвкушение немного трудно объяснить. У нас есть определенное знание мира, его «модель». Эта модель включает в себя все от от мелких деталей, таких как обувь, которую вы надели первой, до сложных вещей, таких как как ты себя чувствуешь о себе и своей жизни. Мы используем эту модель, чтобы предвидеть — ожидать, предсказывать — что произойдет в следующее мгновение или в следующее десять лет.
Если я закрою глаза, я ожидаю, что когда я открою их, мой компьютер все еще быть там, комната все еще будет там, я все еще буду там и так далее. Я упал Если бы это исчезло на мне, я был бы серьезно удивлен! Мы также предвидеть на более долгосрочной основе: у нас есть ожидания относительно того, что колледж будет и не будет делать для нас, о любви, которая вечна, и о восходе солнца, и скоро.
Если я буду держать глаза закрытыми и сосредоточусь на ожидании, а не на мир «там» я могу представьте себе мой компьютер, комната, и так далее. Мы можем понять изображений и мысли как предвосхищения, временно оторвавшиеся от потока события. «Образы — это не картинки в голове, а планы получения информация из потенциальных сред… Когда у вас есть образ единорог у локтя — при этом совершенно уверен, что единороги чисто мифические животные — вы готовитесь воспринимать визуальную информацию, которая в единорог обеспечит, несмотря на то, что полностью осознает, что ваши приготовления находятся в напрасно». (Нейссер, стр. 131-132)
Мышление , говорит Нейссер, также является вопросом образов: способность разделять, отделять и манипулировать нашими собственными ожиданиями чрезвычайно важно. Я считаю, что это основная операция во всех так называемые высшие психические процессы» (Нейссер, стр. 133). далее, предполагая, что восприятие, образы, обучение, память, поведение… это всего лишь аспекты одного и того же, на что он ссылается как познание: «Познание есть деятельность познания; приобретение, организация, и использование знаний» (Нейссер, стр. 1)
Ожидание — главный фактор большей части восприятия. Например, когда мы смотрим на довольно плохой почерк, мы все еще можем сделать это из. Но мы можем интерпретировать одну и ту же чернильную каплю очень по-разному. по-разному в зависимости от контекста — то есть в зависимости от того, что мы ожидаем, что должно быть там!
Взгляните на эту фотографию:
Вы, наверное, видите молодую девушку, играющую в шахматы. Если ты
знакомы с игрой, вы будете знать названия различных фигур,
такие как кони (не кони) и ладьи (не ладьи). Вы можете
«видеть» потенциальные ходы фигур — чего другие не увидят
уведомление. Вы могли заметить, что она, должно быть, играет черными, так что
фигура в руке взята (конь — неплохой
ловить!). Вы можете заметить то, что новичок может не заметить: у нее есть
рокировка (ход с участием короля и ладьи). Я, как шахматы
Игрок, обратите внимание, что она, вероятно, могла бы сбить с меня штаны!
Обратите внимание, насколько это усложняет личность. восприятия: чтобы понять, предсказать и контролировать опыт и поведение людей, мы должны понять значения, которые они применяют к реальности. Нет легко обманывать!
Предвосхищение особенно важно для понимания языка : от момента к моменту мы предугадываем, какие звуки, скорее всего, прозвучат далее, какие грамматические конструкции, какие осмысленные сочетания… Мы можем сделать смысл даже нечеткой, несколько сумбурной беседы.
Предвкушение также помогает нам понять, как нам удается уделять внимание к одним вещам, а не к другим. Как это мы можем слушать друг в шумный бар и удается как-то «отфильтровать» все остальные разговоры и все же «впускаем» голос нашего друга? Мы не воспринимаем все что стимулирует наши чувства. Как мы «отфильтровываем» неважное (менее значимый) вещи? Мы не: Мы просто не выбираем это! Мы выбираем вещи с помощью ожидание. Мы слышим разговор, в который мы вовлечены, тот, который мы ожидание момент в момент. Остальное просто шум. Так же и с другим чувства: Мы видим то, что ищем, и не видим, что мы вместо смотрящий для.
Есть, конечно, несколько исключений, некоторые встроенные привлекающие внимание: громкие звуки, вспышки света, болезненные раздражители, внезапные движения. Эти включают врожденные реакции!
Адаптация
Адаптацию также объяснить сложнее. Иногда мы не хорошо предвидеть. Например, вы думаете, что видите, как к вам приближается друг. и вы готовитесь дать сердечное «привет!» но так же, как вы поднимаете руку махнуть и начать открой рот, ты понимаешь, что это вовсе не твой друг, а полный незнакомец. (Если возможно, вы превращаете поднятую руку в почесывание спины, и открыть рот в зевок. Если уже слишком поздно и ты уже поздоровался, просто притворяться вы их знаете. Это сведет их с ума.)
Всякий раз, когда вы делаете ошибки, вам нужно выяснить, что пошло не так, что что с этим делать, как понять. Делая это, вы совершенствуетесь твой понимание мира и своего отношения к нему; ты совершенствуешься твой «модель.» Это адаптация. В нашем примере теперь у вас может быть модель из мир, который включает в себя двойников, неловких ошибок и склонность немного повременить с будущим, прежде чем быть таким буйным с твоим приветом. Адаптация — это обучение, и мы подробно обсудим это позже.
Этот дополнительный слой к взаимодействию ожидания и адаптации является решающее значение: это означает, что наше поведение и опыт не просто функция какой-то общей реальности. Мы, мы сами, наше понимание реальности, являются неизбежно и неотъемлемо является частью нашего поведения и опыта. Без «я», реальность была бы бессмысленной.
Ссылки
От, Франц (1971). Восприятие других людей. (Эрик Кван и Брендан Махер, пер.) Нью-Йорк: Издательство Колумбийского университета.
Гибсон, Джеймс Дж. (1979). Экологический подход к визуальному Восприятие. Бостон : Хоутон Миффлин
Гибсон, Джеймс Дж. (1966). Чувства, рассматриваемые как перцептивные Системы. Бостон: Хоутон Миффлин
Хайдер, Фриц и Зиммель, Марианна (1944). Экспериментальное исследование Очевидный Поведение. Американский журнал психологии, 57 , с. 245
Джеймс, Уильям (1890 г.). Принципы психологии. Нью-Йорк: Холт.
Коффка, Курт (1936). Принципы гештальт-психологии. Новый Йорк.
Ли, Д. Н. и Аронсон, Э. (1974). Зрительный проприоцептивный контроль стояния у младенцев человека. Восприятие и психофизика, 15, 529-532.
Нейссер, Ульрик (1976). Познание и реальность. Сан-Франциско: В. Х. Фриман.
© Copyright 2002, 2009, C. George Boeree
Что такое машинное восприятие? Как искусственный интеллект (ИИ) воспринимает мир
Присоединяйтесь к топ-менеджерам в Сан-Франциско 11–12 июля, чтобы узнать, как лидеры интегрируют и оптимизируют инвестиции в ИИ для достижения успеха . Узнать больше
Содержание
- Типы машинного восприятия
- Какие человеческие чувства могут хорошо имитировать машины?
- Трудно ли машинное восприятие?
- Как крупные компании, занимающиеся искусственным интеллектом, справляются с машинным восприятием?
- Как стартапы и претенденты приближаются к машинному восприятию?
- Чего не может машинное восприятие?
Машинное восприятие — это способность компьютера воспринимать и обрабатывать сенсорную информацию таким же образом, как люди воспринимают мир. Он может полагаться на датчики, которые имитируют обычные человеческие чувства — зрение, звук, осязание, вкус, — а также воспринимают информацию способами, недоступными людям.
Для восприятия и обработки информации машиной обычно требуется специальное оборудование и программное обеспечение. Это многоэтапный процесс получения, а затем преобразования или преобразования необработанных данных в общее сканирование и детальный выбор фокуса, с помощью которого люди (и животные) воспринимают свой мир.
Восприятие также является первым этапом многих сенсорных моделей искусственного интеллекта (ИИ). Алгоритмы преобразуют данные, собранные из мира, в необработанную модель того, что воспринимается. Следующим этапом является построение более широкого понимания воспринимаемого мира, этап, который иногда называют познанием. После этого следует стратегия и выбор того, как действовать.
В некоторых случаях цель состоит не в том, чтобы заставить машины думать точно так же, как люди, а просто в том, чтобы они думали подобным образом. Многие алгоритмы медицинской диагностики могут давать лучшие ответы, чем люди, потому что компьютеры имеют доступ к более точным изображениям или данным, чем люди могут воспринимать. Цель состоит не в том, чтобы научить алгоритмы ИИ думать точно так же, как люди, а в том, чтобы предоставить полезную информацию о болезни, которая может помочь врачам и медсестрам. То есть, это нормально, а иногда даже предпочтительно, чтобы машина воспринимала иначе, чем люди.
Событие
Преобразование 2023
Зарегистрируйтесь сейчас
Типы машинного восприятия
Вот некоторые типы машинного восприятия на разных стадиях развития:
- Машинное или компьютерное зрение с помощью оптической камеры
- Машинный слух (компьютерное прослушивание) с помощью микрофона
- Машинное осязание с помощью тактильного датчика
- Машинный запах (обонятельный) через электронный нос
- Машинный вкус через электронный язык
- Трехмерное изображение или сканирование с помощью датчика или сканера LiDAR
- Обнаружение движения с помощью акселерометра, гироскопа, магнитометра или термоядерного датчика
- Тепловое изображение или обнаружение объектов с помощью инфракрасного сканера
мир — это машинное восприятие.
Многие из областей, которые обычно считаются трудностями для развития хорошего машинного восприятия, — это те, в которых люди преуспевают, но которые нелегко закодировать в виде простых правил. Например, человеческий почерк часто меняется от слова к слову. Люди могут различать закономерности, но научить компьютер точно распознавать буквы сложнее, потому что существует так много мелких вариаций.
Даже понимание печатного текста может быть проблемой из-за различных шрифтов и тонких вариаций печати. Оптическое распознавание символов требует программирования компьютера, чтобы он думал о более крупных вопросах, таких как основная форма буквы, и адаптировался, если шрифт растягивает некоторые аспекты.
Некоторые исследователи машинного восприятия хотят создать приставки к компьютеру, которые действительно смогут начать дублировать то, как люди воспринимают мир. Некоторые строят электронные носы и языки, которые пытаются имитировать или даже дублировать химические реакции, интерпретируемые человеческим мозгом.
В некоторых случаях электроника обеспечивает лучшее восприятие, чем эквивалентные человеческие органы. Многие микрофоны могут воспринимать звуковые частоты далеко за пределами человеческого диапазона. Они также могут улавливать звуки, слишком тихие для человека. Тем не менее, цель состоит в том, чтобы понять, как заставить компьютер воспринимать мир так, как это делает человек.
Некоторые ученые, занимающиеся машинным восприятием, пытаются смоделировать, как люди могут фиксировать определенные звуки. Например, человеческий мозг часто способен отслеживать отдельные разговоры в шумной обстановке. Отфильтровать фоновый шум — сложная задача для компьютеров, потому что она требует выявления характерных черт в море какофонии.
Какие человеческие чувства могут хорошо имитировать машины?
Компьютеры полагаются на множество различных датчиков, позволяющих им связываться с миром, но все они ведут себя иначе, чем человеческие органы, воспринимающие одни и те же вещи. Некоторые из них более точны и могут фиксировать больше информации об окружающей среде с большей точностью. Другие не так точны.
Машинное зрение может быть самым сильным чувством благодаря сложным камерам и оптическим линзам, которые могут собирать больше света. В то время как многие из этих камер специально настроены так, чтобы дублировать реакцию человеческого глаза на цвет, специальные камеры могут улавливать более широкий диапазон цветов, включая те, которые человеческий глаз не может видеть. Инфракрасные датчики, например, часто используются для поиска утечек тепла в домах.
Камеры также более чувствительны к незначительным изменениям интенсивности света, поэтому компьютеры могут воспринимать небольшие изменения лучше, чем люди. Например, камеры могут улавливать слабый румянец, возникающий при прохождении крови через лицевые капилляры, и таким образом отслеживать сердцебиение человека.
Звук часто является следующим наиболее успешным типом машинного восприятия. Микрофоны маленькие и часто более чувствительны, чем человеческие уши, особенно пожилые люди. Они могут обнаруживать частоты далеко за пределами человеческого диапазона, позволяя компьютерам слышать события и отслеживать звуки, которые люди буквально не могут.
Микрофоны также можно размещать массивами, при этом компьютер одновременно отслеживает несколько микрофонов, что позволяет ему оценивать местоположение источника более эффективно, чем люди. Массивы с тремя и более микрофонами могут дать более точные оценки, чем люди, имеющие только два уха.
Компьютеры могут воспринимать касание , но обычно только в особых обстоятельствах. Сенсорные экраны или тачпады на телефонах и ноутбуках могут быть очень точными. Они могут обнаруживать несколько пальцев и небольшие движения. Разработчики также поработали над тем, чтобы эти датчики могли обнаруживать разницу в длине касания, чтобы такие действия, как длинное касание или короткое касание, могли иметь разное значение.
Запах и вкус реже используются разработчиками машинного восприятия. Есть несколько датчиков, которые пытаются имитировать эти человеческие чувства, возможно, потому, что эти чувства основаны на такой сложной химии. Однако в некоторых лабораториях исследователи смогли разбить процессы на достаточно маленькие шаги, чтобы некоторые алгоритмы искусственного интеллекта могли почувствовать запах или вкус.
Сложно ли машинное восприятие?
Ученые, занимающиеся искусственным интеллектом, быстро поняли, что некоторые из самых простых задач для людей могут быть безумно трудными для компьютеров. Например, взгляд на комнату и поиск места, где можно сесть, у большинства из нас происходит автоматически. Это по-прежнему сложная задача для роботов.
В 1980-х годах Ганс Моравек описал этот парадокс следующим образом: «Сравнительно легко заставить компьютеры демонстрировать производительность на уровне взрослых в тестах на интеллект или в игре в шашки, и трудно или невозможно дать им навыки годовалого ребенка, когда речь идет о восприятии и подвижности».
Частично это происходит потому, что люди не замечают, как усердно работает их мозг, чтобы интерпретировать свои чувства. Ученые, занимающиеся изучением мозга, часто считают, что более половины мозга работает, чтобы понять, на что смотрят наши глаза. Мы склонны видеть вещи, не принимая сознательного решения искать их, по крайней мере, при нормальном освещении. Только в темноте или в тумане люди ищут визуальные подсказки об объектах и о том, где они могут находиться.
Машинное зрение — это всего лишь одна из областей машинного восприятия, и ученые продолжают бороться за то, чтобы воспроизвести даже самые простые человеческие задачи. Когда алгоритмы работают, они возвращают ответы, которые являются прямыми, в основном числовыми и часто не имеют контекста или интерпретации. Датчики могут обнаруживать красный объект в определенном месте, но идентифицировать его или даже определить, является ли он частью другого объекта, сложно.
Как крупные компании, занимающиеся искусственным интеллектом, справляются с машинным восприятием?
Все крупные компании, продающие алгоритмы искусственного интеллекта, поставляют различные инструменты для восприятия и обработки типов человеческого восприятия, от зрения до речи. Чаще всего они различаются программными алгоритмами, которые обрабатывают, анализируют и представляют сенсорные данные и прогнозы. Они предлагают необработанные инструменты для предприятий, которые хотят работать с нуля, а также специализированные инструменты, которые решают определенные проблемы, такие как поиск видеопотока на предмет аномальных действий или общение с клиентами.
IBM
IBM является лидером в улучшении способности своих алгоритмов видеть мир глазами людей. Его система искусственного интеллекта Watson, например, начинается со сложного слоя обработки естественного языка (NLP), который обеспечивает диалоговый интерфейс. Клиенты могут использовать IBM Watson Studio для анализа вопросов, предложения гипотетических ответов, а затем поиска правильных ответов в своде доказательств. Версия, которая выиграла игры Jeopardy против чемпионов-людей, является хорошим примером хорошо социализированных алгоритмов, которые могут взаимодействовать с людьми, потому что они воспринимают слова более или менее так же, как и люди.
Amazon
Amazon предлагает широкий спектр продуктов и услуг, начиная с базовых инструментов и заканчивая специализированными инструментами. Например, Amazon Comprehend извлекает информацию из естественного языка. Специализированная версия, Amazon Comprehend Medical, предназначена для автоматизированного анализа и кодирования, необходимых больницам и врачебным кабинетам. Amazon HealthLake – это продукт для хранения данных, в который встроены процедуры искусственного интеллекта, позволяющие извлекать смысл и делать прогнозы из хранимых данных.
Google предлагает ряд облачных продуктов для базового и целенаправленного решения проблем. Кроме того, компания постепенно добавляла улучшенные алгоритмы машинного восприятия к своим стандартным продуктам, делая их более полезными и зачастую интуитивно понятными. Google Диск, например, будет незаметно применять алгоритмы оптического распознавания символов для чтения текста в электронной почте или сохраненных файлах. Это позволяет пользователям успешно искать слова, которые могут быть только в изображении или меме. Google Photo будет использовать алгоритмы классификации более высокого уровня, чтобы сделать возможным поиск изображений на основе их содержания.
Microsoft
Microsoft предлагает широкий спектр услуг, помогающих клиентам создавать более чувствительные инструменты. Azure Percept предоставляет набор готовых моделей ИИ, которые можно настроить и развернуть с помощью простой интегрированной среды разработки Studio. Эти периферийные продукты предназначены для интеграции как программного обеспечения, так и специализированного оборудования в одном продукте. Инструменты разработки Microsoft ориентированы на понимание естественного языка, а также видео- и аудиопотоков, которые могут собираться устройствами Интернета вещей (IoT).
Meta
Meta также использует различные алгоритмы НЛП для улучшения своего основного продукта — социальной сети. Компания также начинает исследовать метавселенную и активно использует интерфейсы на естественном языке и алгоритмы машинного зрения, чтобы помочь пользователям создавать и использовать метавселенную. Например, пользователи хотят украсить свое личное пространство, а хорошие интерфейсы ИИ упрощают создание и изучение различных дизайнов.
Как стартапы и претенденты приближаются к машинному восприятию?
Ряд компаний, стартапов, а также известных претендентов работают над тем, чтобы их модели работали так же, как люди.
Одной из областей, где это представляет большой интерес, является автономный транспорт. Когда ИИ будут делить дорогу с людьми-водителями и пешеходами, ИИ должны будут понимать мир так же, как и люди. Такие стартапы, как Waymo, Pony AI, Aeye, Cruise Automation и Argo, являются одними из крупных компаний со значительным финансированием, которые производят автомобили, уже эксплуатируемые на улицах некоторых городов. Они интегрируют хорошо спроектированные ИИ, которые могут каталогизировать и избегать препятствий на дороге.
Некоторые стартапы больше сосредоточены на создании программного обеспечения, которое отслеживает объекты и потенциальные препятствия для автономного движения. Такие компании, как aiMotive, StradVision, Phantom AI и CalmCar, — это лишь несколько примеров компаний, которые создают «стеки восприятия», управляющие всей информацией, поступающей от различных датчиков.
Эти системы зачастую лучше людей во многих отношениях. Иногда они полагаются на набор камер, которые могут одновременно видеть вокруг автомобиля на 360 градусов. В других случаях они используют специальное управляемое освещение, вроде лазеров, для получения еще более точных данных о местоположении объектов.
Понимание слов и выход за рамки простого поиска по ключевым словам — это проблема, с которой сталкиваются некоторые стартапы. Blackbird.ai, Basis Technology и Narrative Science (теперь часть Tableau) — хорошие примеры компаний, которые хотят понять намерения человека, создающего текст. Они говорят о том, чтобы выйти за рамки простого определения ключевых слов и обнаружить нарративы.
Некоторые ищут способ прогнозирования того, что люди могут планировать делать, ища визуальные подсказки. Humanising Autonomy хочет снизить ответственность и устранить аварии, создав прогностическую модель людей на основе видеопотока.
Некоторые компании сосредоточены на решении конкретных практических задач. AMP Robotics, например, создает сортировочные машины, которые могут отделять перерабатываемые материалы от потоков отходов. Эти машины используют машинное зрение и алгоритмы обучения, чтобы делать то, что делают люди в процессе сортировки.
Некоторые просто используют ИИ для улучшения человеческого опыта за счет понимания того, что люди воспринимают. Pensa Systems, например, использует видеокамеры, чтобы осматривать полки магазинов и искать некачественные витрины. Эта «интеллектуальная полка» направлена на улучшение видимости и размещения, чтобы покупателям было легче найти то, что они хотят.
Чего не может машинное восприятие?
Компьютеры думают иначе, чем люди. Они особенно хорошо справляются с простыми арифметическими вычислениями и запоминают большие наборы цифр или букв. Но найти набор алгоритмов, позволяющих им видеть, слышать или чувствовать окружающий мир, как это делают люди, сложнее.
Уровень успеха разный. Некоторые задачи, такие как обнаружение объектов на изображении и их различение, удивительно сложны и трудны. Алгоритмы, созданные учеными в области машинного зрения, могут работать, но они все еще хрупки и допускают ошибки, которых избежал бы малыш.
Во многом это происходит из-за того, что у нас нет надежных логических моделей того, как мы воспринимаем мир. Определение такого предмета, как стул, очевидно для людей, но заставить компьютер отличить табуретку от низкого стола — непростая задача.
Наиболее успешные алгоритмы часто в основном статистические. Системы машинного обучения собирают большой объем данных, а затем вычисляют сложные адаптивные статистические модели, которые в некоторых случаях дают правильный ответ. Эти алгоритмы машинного обучения и нейронные сети являются основой для многих алгоритмов классификации, которые могут распознавать объекты на изображении.
При всем своем успехе эти статистические механизмы являются всего лишь приближениями. Они больше похожи на салонные трюки. Они напоминают то, как думают люди, но на самом деле они не думают так же. Из-за этого довольно сложно предсказать, когда они потерпят неудачу.
В целом, алгоритмы машинного восприятия полезны, но они допускают ошибки и выдают неверные результаты в непредсказуемые моменты. Во многом это происходит потому, что мы не очень хорошо понимаем человеческое восприятие. У нас есть несколько хороших логических строительных блоков из физики и психологии, но это только начало. На самом деле мы не знаем, как люди воспринимают мир, поэтому пока довольствуемся статистическими моделями.
Иногда лучше сосредоточиться на том, что машины делают лучше. Например, многие камеры и датчики изображения могут обнаруживать свет с длинами волн, недоступными человеческому глазу. Космический телескоп Уэбба, например, работает исключительно с инфракрасным излучением. Изображения, которые мы видим, модифицируются компьютером, чтобы они отображались в цветах видимого диапазона. Вместо создания чего-то, что дублировало бы то, что может делать человеческое восприятие, эти ученые создали телескоп, который расширил человеческий диапазон, чтобы видеть вещи, которые иначе нельзя было бы увидеть.