Введение
Регистрация движений глаз, или айтрекинг, видеоокулография, имеет довольно долгую историю использования в исследованиях когнитивных процессов в различных возрастных и клинических когортах. Развитие технологии айтрекинга делает этот метод более доступным; в рамках научных исследований создано много различных подходов, позволяющих оценивать те или иные когнитивные процессы, все это является предпосылкой к созданию стандартизированных методик диагностики различных когнитивных функций на основе айтрекинга. Создание таких методик является особенно актуальным для диагностики когнитивных функций у людей, не способных давать речевой или моторный ответ, например у маленьких детей, детей с нарушениями развития, взрослых с тяжелыми неврологическими нарушениями. Для таких групп использование объективных методов оценки когнитивных функций на основе айтрекинга может являться полезным диагностическим инструментарием, дополняющим трудоемкие поведенческие опросники и шкалы. Тем не менее исследований, посвященных разработке диагностического инструментария на основе айтрекинга, мало — в настоящий момент опубликованы лишь результаты пилотных апробаций таких методик.
В настоящей работе мы освещаем исследования, посвященные разработке диагностических методик на основе айтрекинга для оценки когнитивных функций у детей. Среди них можно выделить следующие основные направления: диагностика внимания, диагностика рецептивной речи и интеллекта. В заключение мы рассмотрим основные ограничения применения айтрекинговых методик и перспективы дальнейших исследований.
Прежде чем перейти к рассмотрению исследований по разработке методик диагностики, мы коротко опишем основные показатели, регистрируемые с помощью айтрекера, и их связь с теми или иными когнитивными функциями.
Основные показатели, регистрируемые с помощью айтрекера
Благодаря регистрации различных параметров движения глаз или зрачка, мы можем детектировать когнитивные процессы, которые происходят в данный момент. Одними из самых репрезентативных показателей, регистрируемых с помощью айтрекера, являются фиксации, саккады, плавное слежение (smooth pursuit), моргания и зрительный поиск, а также диаметр зрачка
[Review of Eye, 2023; Eye Movement and, 2022]
Информация о движении глаз может быть интерпретирована как последовательность фиксаций и саккад
[Toward a model, 1998]. Фиксация — это период, когда наш зрительный взор остается на определенном месте. Основные показатели фиксаций — их длительность и количество, в зависимости от экспериментального условия, могут отражать как уровень внимания к стимулу
[Zivan, 2020], так и степень сложности когнитивной обработки стимулов
[Children with Attention-deficit/Hyperactivity, 2020]. Так, например, длительность фиксаций и их количество были выше в условии, когда детям читали книгу родители, а не экспериментаторы, что авторы работы интерпретировали как более высокий интерес к тексту
[Zivan, 2020]. В то время как в работе Р. Молина и коллег
[Children with Attention-deficit/Hyperactivity, 2020] было показано, что у детей с синдромом дефицита внимания и гиперактивности (СДВГ) количество фиксаций было выше, а скорость прочтения текста ниже, чем у контрольной группы, из-за нарушенных паттернов движения глаз.
Саккада — это быстрое движение глаз между двумя последовательными фиксациями. Основные показатели саккад — их амплитуда, длительность, скорость, латентность, точность, а также частота
[Eye Movement and, 2022]. Саккады могут отражать как непроизвольное, так и произвольное внимание. Для произвольного внимания, например при выполнении когнитивных задач, анализируются просаккады (перевод взгляда в сторону целевого стимула) или антисаккады (перевод взгляда в противоположную сторону от целевого стимула), что позволяет оценить работу исполнительных функций: внимания, тормозного контроля, рабочей памяти
[Jones, 2021]. При чтении, помимо основных показателей саккад, также анализируется их тип: прогрессивные (слева направо) и регрессивные (справа налево) саккады, что позволяет оценить степень сложности понимания текста и внимания
[Rayner, 1998].
Такой параметр движения глаз, как плавные следящие движения глаз схож с саккадами, однако они более медленные по времени и позволяют нам непрерывно следить за движущимся объектом
[Rayner, 1998]. Было показано, что способность обращать внимание на движущийся объект и плавно отслеживать его движение в возрасте четырех месяцев может являться предиктором уровня когнитивного и речевого развития и внимания в возрасте 6,5 лет
[Visual tracking at, 2022].
Анализ зрительного поиска представляет собой анализ совокупности таких параметров, как фиксации, саккады и плавное слежение
[Eye Movement and, 2022]. Анализ зрительного поиска чаще всего происходит в зоне интереса (англ. area of interest, AOI) — это заранее выбранная область зрительной сцены для оценки определенных когнитивных процессов, направленности внимания. Например, время до первой фиксации в области интереса позволяет оценить речевое развитие детей. Так, в работе Е. Кушнеренко
[Brain responses and, 2013] было представлено, что дети, которые в возрасте 6—9 месяцев больше смотрели на рот, чем на глаза, в возрасте 14—16 месяцев показали хуже результат по слуховому восприятию.
Моргания — автоматическое повторяющееся закрытие и открытие век. При решении когнитивных задач частота и амплитуда морганий могут говорить о степени когнитивной нагрузки: чем выше уровень нагрузки, тем выше частота морганий
[Yoo, 2021], а также они могут являться показателем развития нервной системы
[Visual fixation development, 2007].
Следующий часто исследуемый параметр — диаметр зрачка. Он позволяет регулировать количество света, попадающего на сетчатку, и оптимизировать зрительную деятельность
[Viglione, 2023]. Его изменения могут быть также обусловлены различными когнитивными процессами, например уровнем внимания во время выполнения задач
[Benitez, 2022].
Таким образом, благодаря регистрации различных параметров движения глаз или зрачка, мы можем детектировать когнитивные процессы, которые происходят в данный момент, а также оценить степень развития нервной системы, когнитивных и речевых функций. С одной стороны, для более точной интерпретации полученных результатов желательно рассматривать одновременно несколько параметров. С другой стороны, это усложняет процесс обработки данных — для получения качественных показателей некоторых параметров необходимо использовать дорогостоящие айтрекеры с большим временным разрешением и желательно фиксировать голову ребенка, что чаще всего затруднительно. Таким образом, для создания практических методик диагностики когнитивных процессов необходимо искать комплексы наиболее информативных и легко регистрируемых показателей взгляда.
Диагностика внимания
Несмотря на то, что айтрекинг в большом числе научных исследований используется для изучения различных аспектов внимания, мы обнаружили лишь три работы одной исследовательской группы, посвященные разработке методики диагностики внимания у маленьких детей, и одно исследование, направленное на создание методики диагностики СДВГ.
Исследовательская группа из Утрехтского университета в Дании работает над созданием заданий для оценки внимания у младенцев (англ. Utrecht Tasks for Attention in Toddlers Using Eye Tracking, UTATE)
[Introduction of the, 2016; Reliability and Validity, 2020]. Данная методика основана на теории внимания Познера, согласно которой внимание можно разделить на три системы внимания: ориентирующую, предупреждающую (пробуждения) и исполнительную
[Posner, 1990]. Система ориентирования отвечает за процесс обращения внимания на цель и переключение внимания между целями, т. е. включает в себя способность направлять (англ. engage), отключать (англ. disengage) и смещать фокус внимания. Оповещение — способность активизировать и поддерживать состояние настороженного внимания
[Posner, 1990]. Исполнительное внимание определяется как целенаправленное внимание и способность подавлять поведение, оно основано на внутреннем или произвольном контроле внимания
[Posner, 1990].
UTATE состоит из четырех заданий
[Factor Structure of, 2016]. В первом задании, направленном на оценку переключения (англ. disengagement) внимания, в центре экрана предъявлялся стимул, а через 2 секунды появлялся второй стимул слева или справа и в течение пяти секунд предъявлялись оба стимула. Во втором задании предъявлялись две фотографии с одинаковыми детскими лицами, через 8,5 секунд одна из картинок менялась на новую и оставалась вместе с ранее показанной в течение 8 секунд. Третье задание — «оповещение» (англ. alerting task). В центре экрана предъявлялся мишка одного из восьми цветов, половина предъявлений сопровождалась предваряющим звуковым сигналом. Четвертое задание, «задержка ответа» (англ. delayed response task), направлено на оценку исполнительного контроля. Ребенок должен был следить за собакой на экране, которая пряталась в одну из двух будок, после чего взгляд ребенка привлекали к центру экрана; далее ребенка просили найти собаку.
Анализировались 13 различных показателей движений глаз и выполнения заданий. Система ориентирования оценивалась по следующим показателям: 1) средняя продолжительность фиксации на зоне интереса (измерялись для первого и второго задания); 2) скорость перехода (для первого и второго задания) — количество переходов взгляда от одной области интереса к другой, разделенное на общее время фиксации; 3) доля правильных рефиксаций (оценивалась в первом задании) — это количество правильных рефиксаций (фиксаций взгляда на новом стимуле), деленное на общее количество проб, в которых ребенок смотрел на центральный стимул при появлении нового стимула; 4) латентность (оценивалась в первом задании) — среднее время между появлением нового стимула и фиксацией на нем в испытаниях, в которых участник правильно рефиксировал взгляд.
Система оповещения, отражающая способность поддерживать устойчивое внимание, оценивалась во всех четырех заданиях путем определения общего времени фиксаций (англ. total dwell time), суммы продолжительности всех фиксаций. Продолжительность фиксации — это продолжительность одного посещения взглядом зоны интереса от входа до выхода. Для оценки показателя бдительности (оценивался в третьем тесте) определялась разность между латентностью в пробах, в которых слуховой сигнал предшествовал появлению стимула, и пробах, в которых стимул появлялся без сигнала.
В работе 2016 года был проведен первичный анализ валидности, надежности и способности данной методики предоставлять диагностические данные на выборке из 16 детей в возрасте 18 месяцев
[Introduction of the, 2016], а в статье 2020 года были представлены результаты дальнейшего исследования конструктивной и прогностической валидности и надежности методики UTATE в группе 95 детей в возрасте 18 месяцев и меньших выборок детей 12 и 24 месяцев
[Reliability and Validity, 2020]. В данном исследовании проводили дополнительную оценку развития и поведения детей с помощью следующих методик: оценка настойчивости при выполнении задания в свободной и структурированной игре с матерью, субшкалы концентрации переключения внимания опросника поведения в раннем детстве (англ. The Early Childhood Behavior Questionnaire, ECBQ), субтест на когнитивные способности теста Bayley-III-NL, шкала коммуникации в опроснике возрастов и стадий (англ. the Ages and Stages Questionnaires, ASQ). Баллы по 13 переменным UTATE были сведены к баллам по трем конструктам (т. е. ориентирующему, предупреждающему и исполнительному вниманию)
[Reliability and Validity, 2020]. Было выявлено, что методика UTATE предоставляет надежную информацию о движениях глаз, обладает конструктивной и прогностической валидностью. Параметры, измеряемые для оценки всех трех систем внимания, имели достаточную надежность при повторных измерениях. Было обнаружено, что система ориентации, измеренная с помощью UTATE, значимо связана с сообщением матери о переключении внимания (ECBQ), система оповещения связана с показателем настойчивости при выполнении задания в игре, однако величина эффекта была небольшой. Кроме того, низкие результаты по методике UTATE в 18 месяцев были связаны с задержкой когнитивного развития по опроснику Bayley-III-NL в 24 месяца (низкими результатами методики UTATE считался балл для каждой из систем внимания, который был более чем на одно стандартное отклонение ниже среднего по группе)
[Reliability and Validity, 2020]. В целом, исследование показало, что методика UTATE способна определять возрастные особенности внимания, что важно для понимания закономерностей развития внимания и выявления детей, которым необходима ранняя целенаправленная помощь для предупреждения проблем развития.
В работе П. Варелы Касал
[Clinical Validation of, 2019] была предложена методика диагностики СДВГ у детей 7—17 лет (43 ребенка — группа СДВГ, 30 детей — группа контроля) на основе оценки модуляции угла вергенции. Вергенция — одновременное движение обоих глаз в противоположных направлениях для получения или сохранения целостного бинокулярного зрения. Модуляция угла вергенции глаз — изменения угла между зрительными осями двух глаз в процессе фиксации на объекте. Угол вергенции глаза рассчитывался с помощью перекрестного произведения обоих векторов взгляда. Была разработана специальная задача, во время выполнения которой необходимо было удерживать взгляд на центральной лягушке и нажимать на кнопку, когда сбоку от лягушки предъявлялась рыбка и воздерживаться от нажатия при предъявлении головастика. Направление глаз лягушки в части случаев давало подсказку, с какой стороны появится стимул. Было выявлено, что дети из группы здорового контроля имели четкую модуляцию угла вергенции глаз, степень модуляции зависела от информативности «подсказки», в то время как дети с СДВГ имели слабую модуляцию угла вергенции глаз при выполнении задачи на внимание, и подсказка мало влияла на вергентность. Модели машинного обучения классифицировали пациентов с СДВГ от здоровых контрольных групп с точностью 96,3%. Результаты этого исследования свидетельствуют о том, что в сочетании с задачей на внимание реакции вергенции могут быть использованы в качестве объективного маркера для выявления СДВГ у детей.
Важной задачей дальнейших разработок айтрекерных методик диагностики внимания является поиск наиболее адекватных для разных возрастов и нарушений развития заданий. Например, основной особенностью методики UTATE является то, что большая часть заданий предъявляется без инструкции, что является важным для диагностики детей, не способных следовать инструкциям. Однако, возможно, что для детей более старших возрастов эти задания будут слишком простыми и неинтересными, что будет влиять на надежность и устойчивость результатов. Задания с оценкой угла вергенции, наоборот, могут быть слишком сложными для детей дошкольного возраста; усложняют применение данного подхода у детей младшего возраста и более высокие требования к неподвижности головы для получения интерпретируемых данных.
Необходимо отметить, что в ряде исследований айтрекинговые методики используются для оценки эффективности применения различных интервенций, направленных на развитие внимания, при сравнении различных показателей внимания до и после курса тренировок. Часто используются варианты задания на переключение внимания, например «Gap-overlap», в котором новый стимул может предъявляться совместно с предыдущим, либо после его исчезновения
[Very preterm infants, 2021]. Устойчивость внимания оценивают по показателю времени продолжительности фиксаций на скучных и интересных рисунках
[First evidence of, 2016]. Для оценки когнитивного контроля используют задачу, во время которой стимулы предъявляются в определенном порядке, а затем правило предъявления меняется
[Attention training for, 2016]. Эти задания также могут лечь в основу дальнейшей разработки методик диагностики внимания для различных возрастных групп детей.
Диагностика рецептивной речи
Следующим направлением разработки методик на основе айтрекинга является диагностика речевого развития. Одним из часто используемых подходов в оценке понимания речи является парадигма «визуального мира» (англ. Visual World Paradigm, VWP), или парадигма «смотреть во время прослушивания»
[Farris-Trimble, 2013]. Участник должен посмотреть на названный стимул из набора изображений на экране. Подбирая определенные наборы конкурирующих стимулов можно получать информацию о различных аспектах речевой обработки: фонологических, семантических и т. п. Данная айтрекерная парадигма дает достаточно стабильные результаты, по крайней мере, в выборке взрослых, что позволяет использовать ее в качестве индивидуальной меры
[Farris-Trimble, 2013]. Несмотря на перспективы использования данного подхода для оценки понимания различных аспектов речи, разрабатываемые методики оценки развития рецептивной речи детей пока нацелены на понимание существительных.
Интермодальная парадигма предпочтительного взгляда (англ. Intermodal Preferential Looking Paradigm, IPLP), основанная на принципах подхода «визуального мира», также весьма распространена при исследовании развития речи у младенцев и у детей с тяжелыми нарушениями развития. Парадигма заключается в одновременном предъявлении двух визуальных стимулов в левом и правом поле зрения и слухового стимула, который соответствует одному изображению
[The eyes have, 1987]. Ребенок должен посмотреть на названный стимул; во время выполнения задания производится видеорегистрация лица ребенка. IPLP был валидизирован в качестве метода оценки понимания слов младенцами; было показано, что младенцы обращают внимание на те слова, которые по оценке родителей ребенок знал
[Houston-Price, 2007]. Основным недостатком подхода IPLP является предъявление только двух изображений, что увеличивает вероятность случайного угадывания правильного ответа, или, наоборот, неверного заключения о том, что ребенок не знает слово, если ребенка в большей степени привлечет незнакомый объект.
В исследовании Н. Брейди и коллег
[Eye Tracking as, 2014] диагностическая айтрекерная методика разрабатывалась на основе методики IPLP и результатов «Рисуночного теста словарного запаса» Пибоди (англ. Peabody Picture Vocabulary Test Fourth Edition, PPVT-4). Участникам предлагалось делать выбор из четырех картинок, как в тесте PPVT-4. Основная цель работы состояла в том, чтобы показать, что у детей с расстройством аутистического спектра (РАС) данные, полученные при отслеживании движений глаз, соответствуют результатам традиционного теста PPVT-4. На первом этапе исследования проводился словарный тест PPVT-4, по результатам которого были отобраны 12 слов, известных ребенку, и 12 слов, не известных ребенку. Эти слова были использованы для создания индивидуальных наборов картинок для тестирования с использованием айтрекера. Было обнаружено, что и дети с РАС, и дети контрольной группы дольше просматривали целевые, чем нецелевые изображения известных ребенку слов, что подтверждает возможность оценки понимания речи по айтрекерным данным и целесообразность дальнейшей разработки методики. Ограничением подхода, использованного в данной работе, является его зависимость от результатов PPVT-4, а также 25% вероятность случайного угадывания нужного слова.
В исследовании К.М. Хаушилд с коллегами, в разрабатываемом ими «Тесте зрительного массива» (англ. Visual Array Task, VAT), предлагалось выбирать целевое изображение из восьми картинок, что должно было снизить вероятность случайного угадывания ответа
[Hauschild, 2021]. Массивы картинок содержали объекты, принадлежащие двум семантическим категориям (например, «одежда» и «транспорт»), включая 1 целевой (называемый диктором) элемент, 3 элемента из той же семантической категории, что и целевой стимул, и 4 элемента из другой семантической категории. Контраст категорий может помочь, по мнению авторов, более точно оценить рецептивный словарный запас, а также понять, в какой степени раннее понимание слов отражает знание более широких категорий. Исследование включало детей в возрасте 17 и 25 месяцев, а также лонгитюдную группу, которая проходила тестирование в возрасте 17 и 25 месяцев (всего 41 человек). В начале исследования все дети были протестированы с использованием методики диагностики раннего развития Маллен (англ. Mullen Scales of Early Learning, MSEL)
[Mullen, 1995], оценивающей визуальную рецепцию, мелкую моторику, рецептивную и экспрессивную речь. Затем дети были протестированы с помощью айтрекерной методики, состоящей из 12 наборов массивов по 8 объектов. Для каждого объекта определяли относительную продолжительность фиксаций на зоне интереса путем деления общего количества времени, которое младенцы смотрели на все зоны интереса, на общую продолжительность времени, в течение которого участники смотрели на зону интереса отдельного объекта. Затем была определена средняя относительной продолжительности фиксации на зоне интереса для целевого объекта, для объекта, принадлежащего семантической категории цели, и для объекта другой категории. Кроме того, определяли число и среднюю продолжительность посещений взглядом зоны интереса для целевых и других объектов. Результаты показали, что дети в возрасте 17 месяцев больше фиксировались на целевом объекте, чем на других типах объектов, но разницы в продолжительности фиксаций на объектах, принадлежащих той же семантической категории, что и цель, и на нецелевых объектах не было. В 25 месяцев наблюдались различия в средней продолжительности фиксации на целевом и на других объектах, а также различия в продолжительности фиксаций на объектах из той же семантической категории, что и цель, и на других объектах. Также в 17 месяцев наблюдалось более частое посещение зоны интереса целевого объекта, а в 25 месяцев большее число и большая продолжительность посещения целевой зоны интереса, чем других объектов. Не было выявлено значимой связи между результатами разрабатываемой методики и клиническими методами ни в 17 месяцев, ни в 25 месяцев, однако в 25 месяцев на уровне тенденции наблюдалась негативная корреляция между средним временем фиксации на нецелевом объекте и оценкой рецептивного языка, что говорит о том, что чем больше ребенок фиксировался на нецелевых объектах, тем хуже была оценка по рецептивной речи. Было показано увеличение времени фиксации цели с возрастом и обнаружена сильная корреляция между показателями фиксации на целевом объекте, числом и продолжительностью посещения зоны интереса в возрасте 17 месяцев и 25 месяцев, что указывает на согласованность измерений с течением времени. Данное исследование показало возможность расширения массива до восьми элементов — дети младшего возраста больше фиксировали взгляд на целевом объекте, несмотря на б
ольшую сложность задания, чем в тестах с меньшим числом элементов. Используемый подход также позволяет отслеживать более тонкие особенности развития речи, такие как формирование семантических категорий слов.
В следующей работе данного исследовательского коллектива с помощью данного метода было продемонстрировано, что у детей с высоким риском РАС в 17 месяцев средняя продолжительность фиксации на целевом объекте меньше, чем у детей с низким риском РАС, а в 25 месяцев данные различия между группами нивелируются
[Hauschild, 2022]. Таким образом, методика VAT может показывать специфику динамики развития рецептивной речи у различных подгрупп детей. Авторы полагают, что дальнейшие направления разработки методики VAT могут быть направлены на включение более сложных понятий для улучшения дифференцированной оценки детей более старшей группы
[Hauschild, 2022].
В работе Т. Фрейзер с коллегами, в разрабатываемой ими методике оценки понимания речи, для повышения надежности и предсказательной валидности несколько показателей взгляда были объединены в общий, так называемый «рецептивный языковой индекс» (англ. Receptive Language Index, RLI)
[Rapid Eye-Tracking Evaluation, 2020]. Также было изучено, какой объем массива стимулов имеет б
ольшую валидность. В рамках исследования было обследовано 172 ребенка в возрасте от 1,7 до 17,6 лет с расстройствами нервно-психического развития и 66 детей контрольной группы. Детям предъявляли шесть массивов зрительных стимулов, состоящих из нескольких пар целевых объектов и дистракторов (три массива 2 × 2 изображения, два массива 3 × 2, один массив 4 × 2); ребенка просили, как и в других подобных методиках, посмотреть на определенный объект. Результат оценивался на основе рецептивного языкового индекса, получаемого на основе усреднения стандартизованных (с использованием среднего значения и стандартного отклонения из полной клинической выборки) показателей количества фиксаций, процента времени фиксации и средней продолжительности фиксации на зоне интереса. Были выявлены сильные двумерные взаимосвязи между RLI и общим баллом по рецептивному и экспрессивному языку, полученным в результате традиционного тестирования (применяемые методики зависели от возраста ребенка: Шкалы раннего обучения Маллена (англ. Mullen Scales of Early Learning), Клиническая оценка языковых основ (англ. Clinical Evaluation of Language Fundamentals), или Шкалы дошкольного языка (англ. Preschool Language Scales)). Валидность данных была выше при предъявлении массива стимулов размером 4 × 2 изображения. Авторы считают, что дальнейшая разработка методики должна фокусироваться на использовании массивов такого или большего размера.
Хочется отметить, что в настоящее время проводится много исследований, в которых айтрекинг используется для оценки понимания не только существительных, но и более сложных языковых конструкций. Предлагаются подходы для диагностики понимания глаголов, прилагательных, местоимений, грамматических окончаний и предложений
[Key, 2020]. Хотя эти методы пока использовались лишь для решения частных исследовательских вопросов об особенностях понимания различных речевых конструктов при определенных нарушениях развития, в дальнейшем они могут лечь в основу более универсального айтрекерного инструмента оценки различных аспектов речевого развития.
Интеллектуальное развитие
Мы нашли лишь одно исследование по созданию методики скрининга интеллекта с помощью айтрекера у детей с общей задержкой развития. Исследование проводилось учеными из отделения реабилитации детской больницы Нанкинского медицинского университета Китая
[New Approach to, 2021]. В исследовании приняли участие 120 детей в возрасте от 1,5 до 4 лет: 60 типично развивающихся детей и 60 детей с задержкой развития. Этих детей также оценивали с помощью традиционных методов, таких как шкала Бэйли, тест Пибоди (PPVT) и шкала Гезелла. Задания, использованные в данном исследовании, были направлены на оценку различных когнитивных функций, включая перцептивное мышление, вербальное понимание, кратковременную память и внимание. Исследование включало 15 различных заданий, от легких до сложных. Когнитивный балл по трекингу глаз получался путем подсчета суммы продолжительности фиксации на зонах интереса по всем заданиям. Важно подчеркнуть, что анализ проводился на основе общих баллов по всем тестам, поэтому, используя этот метод, можно оценивать когнитивные способности, но не дифференцировать отдельные блоки, такие как речевой.
Результаты исследования показали сильную корреляцию между когнитивными показателями, полученными с помощью технологии отслеживания движения глаз, и показателями психологических тестов. Авторы отмечают, что, хотя данная методика не в полной мере охватывает все аспекты тестов интеллекта детей, например такие, как классификация и дедукция, и поэтому не может полностью заменить традиционные инструменты тестирования, она может использоваться для быстрого раннего выявления детей с умственной отсталостью.
Проблемы и перспективы дальнейшего развития методик
Несмотря на перспективность разработок диагностических методик на основе айтрекинга, и их важное значение для диагностики «трудных» групп детей, их применение имеет определенные ограничения. Естественное ограничение таких методик — сильные нарушения зрения, а в случае диагностики речи — нарушения слуха. В ряде случаев возникают сложности с калибровкой айтрекера из-за индивидуальных особенностей человека, например опущения век, неподходящей оправы очков и т. п. Одним из ограничений активной разработки и использования айтрекинговых методик диагностики является дороговизна оборудования и необходимость создания специальных условий для получения качественных данных. Дополнительная проблема — это зашумленность данных из-за того, что детям сложно сидеть неподвижно, поддерживать интерес к заданию. Последняя проблема часто возникает из-за того, что эти дети привыкли смотреть на экранах динамические яркие мультики, играть на мобильных устройствах. Р.С. Хесселс и И.Т.К. Хуге
[Hessels, 2019] проблему с движениями ребенка предлагают решать с помощью специальной организации места для тестирования, путем использования автомобильного кресла и фиксировании ребенка в нем ремнями безопасности, и использования специальных стоек для экрана, позволяющих легко регулировать высоту и угол его наклона. Ошибку в данные могут привносить и личностные особенности интервьюера; для решения этой проблемы рекомендуют использовать четкие протоколы обследования и обучение им специалистов
[Hessels, 2019].
Другое направление решения вышеописанных проблем состоит в разработке новых технических подходов для анализа взгляда, в определении менее чувствительных к шуму комплексов показателей взгляда. Использование методов машинного обучения
[Development of an, 2024; Identifying dyslexia in, 2023] может помочь в создании более эффективных алгоритмов анализа движений глаз, что позволит охватывать большее количество детей и производить более точную и автоматизированную диагностику. В качестве примера можно привести исследование Центра языка и мозга Национального исследовательского университета «Высшая школа экономики», в рамках которого была собрана большая база данных движений глаз при чтении, позволяющая искать наиболее эффективные модели искусственного интеллекта для ранней диагностики дислексии у детей
[Identifying dyslexia in, 2023].
Разработка более доступных и дешевых технических решений для регистрации и анализа движений глаз также может способствовать внедрению в практику айтрекинговых диагностических методик. В этой связи интерес представляют алгоритмы анализа движений глаз по записям, сделанным обычной видеокамерой компьютера, планшета и даже телефона. Так, Н. Валлиаппан с коллегами показали, что применяя машинное обучение к записям лица с фронтальной камеры смартфона, можно достичь точности в 0,46 см при отслеживании движений глаз, что сопоставимо с точностью современных мобильных трекеров, таких как очки Tobii
[Accelerating eye movement, 2020]. Кроме того, при использовании данного подхода были воспроизведены результаты предыдущих исследований движений глаз с помощью настольных трекеров.
Работа Ч.Х. Ю с коллегами
[Development of an, 2024] посвящена разработке методики диагностики СДВГ у детей с использованием методов машинного обучения на основе записи движений глаз с помощью простого цифрового устройства при выполнении заданий, направленных на оценку избирательного внимания, рабочей памяти и тормозного контроля. Использованная модель машинного обучения на основе данных движений глаз продемонстрировала довольно высокую точность (76,3%) при выявлении СДВГ, что свидетельствует о том, что такие данные могут использоваться для скрининга СДВГ.
В работе Н. Варгас-Куентас с коллегами
[Developing an eye-tracking, 2017] также была продемонстрирована возможность использования алгоритма отслеживания движений глаз по обычной видеозаписи лица для разработки инструмента ранней диагностики аутизма. Детям одновременно предъявлялись два видеоролика с социальной сценой и движущимися геометрическими фигурами. Исследование показало, что дети с РАС больше времени тратят на просмотр фигур. Также была показана эффективность использования автоматического алгоритма анализа направления взгляда для определения времени просмотра роликов каждого типа.
Разработка новых, более экологичных и интересных парадигм также может помочь развитию диагностических айтрекерных инструментов. Например, в исследовании К. Манлей
[Manley, 2022] с коллегами показана возможность использования специально разработанной натуралистической VR-среды с пространственной перспективой от первого лица для оценки функции зрительного поиска на основе параметров движений глаз. Задания на основе реалистичных сцен могут быть более интересными для детей, что может снизить процент потери данных и создать комплексные инструменты для быстрого скрининга различных когнитивных функций.
Таким образом, исследования показывают, что методики на основе данных айтрекинга позволяют оценивать внимание, рецептивную речь, по крайней мере, у детей младшего возраста (1,5—2,5 лет), а также проводить скрининговую оценку интеллекта у детей с задержкой развития. Данные, получаемые с помощью айтрекинговых методик, в целом значимо коррелировали с показателями, полученными с помощью традиционных поведенческих методик. Преимуществом айтрекинговых методик является их быстрота и, прежде всего, возможность применения у детей, не способных давать моторные ответы. Кроме того, данные айтрекинга позволяют оценивать более тонкие процессы и с большей точностью, чем поведенческие методики. Применение методов машинного обучения позволит создавать более простые и эффективные скрининговые методики оценки когнитивных процессов на основе движений глаз, а также получать данные о движении глаз с помощью простых цифровых устройств, делая применение таких методик более доступными. Все это свидетельствует о том, что разработка методик диагностики когнитивных процессов на основе движений глаз является перспективным направлением исследований, имеющих большое практическое значение.