Диагностика дислексии с использованием методов искусственного интеллекта по данным движений глаз: обзор

Грачева М.А.; Шалилех С.

doi:10.17759/cpse.2023120301

Клиническая и специальная психология
2023. Том 12. № 3. С. 1–29
doi:10.17759/cpse.2023120301
ISSN: 2304-0394 (online)

Диагностика дислексии с использованием методов искусственного интеллекта по данным движений глаз: обзор

486

Грачева М.А., Шалилех С.

Аннотация

В обзоре рассмотрены методы диагностики дислексии по данным движений глаз, реализованные на основе искусственного интеллекта. В ряде работ было показано, что движения глаз у людей с дислексией могут отличаться от движений глаз у испытуемых того же возраста с нормальными способностями к чтению. Начиная с 2015 года в литературе стали появляться исследования, в которых анализ движений глаз нормотипичных испытуемых и испытуемых с дислексией осуществлялся с использованием различных методов искусственного интеллекта. На сегодняшний день существует ряд работ, использующих как простые модели, так и более сложные — с нейросетями и глубоким обучением. В обзоре обсуждается, какого качества диагностики удалось добиться исследователям, на каких группах испытуемых и для каких языков были показаны текущие результаты, какие типы алгоритмов использовались и другие практические аспекты проведения такой диагностики. Согласно проанализированным данным, диагностика дислексии с использованием движений глаз и методов искусственного интеллекта является очень перспективной и может оказать значительное влияние на раннюю диагностику нарушений чтения.

Общая информация

Ключевые слова: айтрекинг (eyetracking), движения глаз, дислексия, искусственный интеллект, методы диагностики

Рубрика издания: Теоретические исследования

Тип материала: научная статья

DOI: https://doi.org/10.17759/cpse.2023120301

Финансирование. Данная статья является результатом исследовательского проекта, выполненного в рамках программы фундаментальных исследований Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ). Для автора М.А. Грачевой работа частично финансирована в рамках государственного задания ИППИ РАН (НИОКТР, регистрационный номер 122041100148-0 от 13 марта 2023 г.).

Получена: 03.07.2023

Принята в печать: 17.10.2023

Для цитаты: Грачева М.А., Шалилех С. Диагностика дислексии с использованием методов искусственного интеллекта по данным движений глаз: обзор [Электронный ресурс] // Клиническая и специальная психология. 2023. Том 12. № 3. С. 1–29. DOI: 10.17759/cpse.2023120301

Полный текст

Введение

Дислексия считается одной из самых частых трудностей обучения и характеризуется нарушением процесса освоения чтения. По разным данным дислексия встречается у 7–10% учащихся, однако эти оценки сильно зависят от используемых критериев диагностики и определения дислексии [Корнев, 2006; Лалаева, 2002; Русецкая, 2007; Australian Dyslexia Association; Peterson, 2012; Peterson, 2015].

Ранняя диагностика и введение коррекционных программ для детей с трудностями чтения могут существенно помогать в дальнейшем освоении учебной программы, однако большинство существующих скрининговых тестов на дислексию довольно времязатратны и требуют высокой квалификации диагноста [Ахутина, 2016; Безруких, 2009; Глозман, 2008; Рычкова, 2022]. В некоторых странах ожидание диагностики может занимать несколько месяцев (например, в статье [Smyrnakis, 2017] приводится информация о 14 месяцах ожидания для Греции и 9 месяцах — для Ирландии), а это означает, что ребенок с нарушениями позже начнет функциональную коррекцию и к тому времени может выйти из сенситивного периода развития.

Существуют разнообразные тестовые методики для диагностики дислексии, например, Comprehensive Test of Phonological Processing, Tests for Auditory Processing Disorders и тест «ЗАРЯ» для русскоязычных обследуемых [Дорофеева, 2020; Дорофеева, 2018]. Точность диагностики такими тестами зависит от обследуемой выборки, родного языка обследуемых, квалификации исследователей и многих других параметров.

С развитием методов искусственного интеллекта (ИИ) кажется перспективным автоматизировать задачи скрининга и диагностики пациентов для упрощения процедуры, ускорения получения результатов и в итоге для более быстрого начала адаптационных процедур для пациентов с дислексией.

Взгляды на понятие «искусственный интеллект» могут различаться в разных научных школах. Некоторые исследователи считают, что ИИ ограничивается только имитацией человеческого интеллекта, в то время как другие утверждают, что он также включает в себя сильно специализированные системы, не предназначенные для имитации человеческого интеллекта и способные выполнять сложные задачи, например, распознавание образов, обработку естественного языка, планирование, принятие решений и автоматизацию. Зачастую понятие ИИ используется как обобщающий термин для методов машинного обучения и глубокого обучения — и именно в таком ключе мы и будем его использовать в статье. Для более подробного ознакомления с обсуждаемыми методами мы рекомендуем обращаться к специализированным пособиям [Гудфеллоу, 2018; Миркин, 2023].

Сегодня методы ИИ для диагностики дислексии активно применяются для анализа трех типов данных [Usman, 2021]: 1) данных поведенческих тестов; 2) данных визуализации головного мозга; 3) данных о движениях глаз. Из трех перечисленных типов данных, используемых в подобных задачах, наибольший интерес представляют данные о движениях глаз.

Современные айтрекеры — приборы для записи движений глаз — позволяют регистрировать движения глаз испытуемых в комфортных условиях (часто регистрация проводится даже без фиксации головы испытуемого) и требуют мало обратной связи от обследуемого, что обеспечивает больший психологический комфорт тестируемого. Сама процедура неинвазивна, бесконтактна и абсолютно безопасна, а современные приборы относительно дешевы и доступны для исследователей [Барабанщиков, 2014]. Кроме того, движения глаз не всегда можно осознанно контролировать, поэтому обследуемым трудно симулировать лучшие или худшие результаты, то есть получаемые результаты более объективны, чем, например, данные поведенческих тестов.

Цель работы — анализ публикаций, посвященных диагностике дислексии с использованием методов ИИ и данных о движениях глаз пациентов.

Методы исследования

Поиск статей по теме производился с помощью ресурсов PubMed и Google Scholar по ключевым словам: dyslexia, reading disorders, dyslexia diagnostics, dyslexia screening в сочетании с machine learning, deep learning, artificial intelligence и eye movements, eye tracking, gaze tracking. Для обзора были отобраны все исследования, в которых использовались методы ИИ для скрининга или диагностики дислексии. Критерии включения в обзор: публикация представлена на русском или английском языках; публикация содержит указанные выше ключевые слова (хотя бы одно или сочетания); по типу — обзоры литературы и эмпирические исследования. Дополнительно статьи для анализа отбирались из списков литературы уже отобранных подходящих по теме публикаций. Критерии исключения из обзора: публикация является аннотацией докладов; опубликована на других иностранных языках, кроме английского; в публикации отсутствует описание методов исследования; содержание публикации не соответствует ключевым словам.

Особенности движений глаз у лиц с дислексией

При просмотре зрительной сцены глаза наблюдателя чаще всего двигаются скачками, от одной точки к другой. При анализе движений глаз принято выделять фиксации (остановки взгляда) и саккады (скачки между фиксациями) и оценивать их параметры, такие как длительность фиксаций, длину саккад и прочие [Барабанщиков, 2014; Ярбус, 1965].

Рядом исследователей было показано, что паттерн движений глаз у испытуемых с дислексией может отличаться от паттерна движений глаз нормотипических испытуемых того же возраста; эти отличия, вероятно, можно использовать для диагностики дислексии [Гольдина, 2021; Корнев, 2019; Оганов, 2019; Оганов, 2023; Høien, 2000; Parshina, 2022; Rayner, 1998]. Однако существует как минимум два мнения о том, в чем именно заключаются эти отличия. Некоторые авторы считают, что движения глаз у лиц с дислексией существенно нарушены; это проявляется не только в задачах чтения, но и в задачах на генерацию произвольных саккад (иногда это упоминается как гипотеза о нарушенном окуломоторном балансе). Авторы других исследований показывают, что особенности движений глаз у лиц с дислексией проявляются именно в задачах на чтение, при этом паттерн их движений похож на паттерн здоровых испытуемых, но более раннего возраста. Это соответствует гипотезе о более затрудненном анализе именно текстового материала.

Одни из первых работ о различиях в паттернах движений глаз при чтении текста нормотипичными испытуемыми и испытуемыми с дислексией были опубликованы еще в 1983 году [Rayner, 1983; Rayner, 1985]. С тех пор многими исследователями было показано, что при нарушениях чтения наблюдаются более длительные фиксации, более частые повторные фиксации на том же слове, возвратные саккады (регрессии), более короткие по длине саккады и меньшее число слов, которые испытуемый не фиксировал взглядом при первом прочтении текста (то есть слов, которые испытуемый прочитал «мимоходом», не останавливаясь на них) [De Luca, 2002; Deans, 2010; Franzen, 2021; Razuk, 2018].

Другие работы свидетельствуют об общем окуломоторном дисбалансе у наблюдателей с дислексией [Bucci, 2008], проявляющемся не только в задачах чтения. Особенно авторы выделяют произвольные саккады: управление ими кажется наиболее незрелым у испытуемых с дислексией [Biscaldi, 2000; Fischer, 2000; Pavlidis, 1981; Tiadi, 2016]. Но есть и некоторые противоположные свидетельства, не подтверждающие гипотезу общего окуломоторного дисбаланса [Hyönä, 1995].

В течение некоторого времени, примерно в 80–90-х годах прошлого века, был открытым вопрос о том, какова причинно-следственная связь нарушений движений глаз и нарушений чтения. Основаны ли нарушения чтения именно на проблемах движений глаз? Или нарушения движений глаз являются только сопутствующим симптомом более глубоких изменений, приводящих к трудностям чтения или коррелирующих с ними? Или же движения глаз при чтении просто отражают трудности анализа текста и не связаны с глазодвигательными нарушениями? Некоторые исследователи склонны считать, что особенности движений глаз могут быть обусловлены теми же особенностями строения или функционирования мозга, которые влияют на показатели чтения, но движения глаз не являются причиной дислексии [Rayner, 1998; Tinker, 1958; Tinker, 1946]. Чаще всего упоминается гипотеза, что лица с дислексией имеют проблемы именно с анализом и обработкой языка, а движения глаз просто отражают эти трудности [Rayner, 1998].

В 2013 году группа исследователей [Al-Edaily, 2013] попробовала автоматизировать диагностику дислексии по данным движений глаз. Исследователи создали компьютеризированную программу, которая позволяла отобразить получаемые параметры движений глаз относительно двух заранее собранных выборок — пациентов с дислексией и без нее. Вручную вводя пороги, разделяющие эти две выборки, авторы давали возможность оценить, насколько далеко от обоих кластеров находится тестируемый пациент. Очевидно, что такая задача являлась первым шагом на пути внедрения методов ИИ в диагностику дислексии по данным движений глаз, ведь гораздо лучше и объективнее такая процедура может быть выполнена современными алгоритмами классификации.

Методы оценки качества работы алгоритма

Для оценки качества диагностики дислексии в работах с использованием методов ИИ чаще всего указываются стандартные параметры: точность (процент правильно диагностированных пациентов как с дислексией, так и без нее, по отношению к общей группе пациентов), специфичность (доля корректно распознанных здоровых, не имеющих искомого нарушения пациентов, к общему числу обследованных) и сенситивность, или чувствительность (доля корректно распознанных случаев заболевания к общему числу обследованных).

При рассмотрении точности диагностики важно учитывать сбалансированность выборки, то есть соотношение в выборке долей пациентов с дислексией и людей без такого диагноза. В большинстве рассматриваемых в данном обзоре работ выборка была сбалансированная (за исключением сильно несбалансированной выборки в работе [Raatikainen, 2021]), поэтому параметр точности дает адекватное представление о качестве диагностики. Некоторые авторы считают, что среди специфичности и сенситивности критерий специфичности менее важен, так как лучше провести дополнительную проверку здоровому ребенку, чем пропустить ребенка с нарушением [Smyrnakis, 2017].

Не совсем корректно сравнивать значения точности алгоритма, полученные на разных наборах данных, поэтому такое сравнение в данном обзоре носит именно характер обсуждения. Однако некоторые наборы данных повторно использовались разными группами исследователей, и с использованием разных методов ИИ удавалось получать разные итоговые значения точности — такое сравнение кажется нам правомерным и тоже будет присутствовать в тексте. Помимо стандартных метрик, некоторые исследователи оценивают дополнительные параметры алгоритма, например, устойчивость к шуму [Asvestopoulou, 2019] или возможность использования алгоритма на данных из совершенно другого набора [Vajs, 2023].

Хронология использования методов ИИ на данных движений глаз для диагностики дислексии

Первая работа о применении методов ИИ к данным движений глаз для диагностики дислексии были опубликованы в 2015 году [Rello, 2015]. В этой работе авторами с использованием метода опорных векторов была получена точность диагностики, равная 80,18%. На рисунке 1 в виде линейчатой диаграммы представлены результаты всех опубликованных работ по этой теме: на нем видно, что точность 80,18% была самой низкой из всех полученных результатов. Важно понимать, что прямое сравнение точностей разных алгоритмов, оцененных на разных данных, является не совсем корректным сравнением, поэтому приводимая диаграмма носит иллюстративный характер. Тем не менее в некоторых работах использовались одни и те же данные: в таком случае столбцы диаграммы имеют одинаковый цвет. Сравнение между собой столбцов одинакового цвета более корректно.

Рис. 1. Наивысшая достигнутая точность согласно данным публикаций

Примечание: на горизонтальной оси отложены показатели точности, достигнутые авторами в работах, указанных по вертикальной оси. Прямое сравнение точностей разных алгоритмов, оцененных по разным наборам данных, не является корректным, поэтому данная диаграмма носит иллюстративный характер. В некоторых работах использовались одни и те же данные: в таком случае столбцы диаграммы имеют одинаковый цвет. Сравнение между собой столбцов одинакового цвета более корректно.

После первой опубликованной работы исследователи пробовали решать задачу автоматизированной диагностики дислексии по движениям глаз, и некоторые группы авторов публиковали серии статей. Например, в серии работ A. Jothi Prabha и R. Bhargavi [38–40] авторы, используя данные из публикации [Benfatto, 2016], от раза к разу получали точность диагностики от 95% до 96%. Сами создатели этого набора данных, применив вариант метода опорных векторов, получили точность в 95,6%. Но наилучший результат для этих данных и вообще по этой тематике был получен в работе [Nerušil, 2021], где авторы применили трехслойную сверточную нейросеть и добились точности диагностики в 99,6%. В 2023 году A. Jothi Prabha и R. Bhargavi продолжили тему анализа движений глаз при дислексии методами ИИ и опубликовали работу, в которой предлагают уже не просто метод скринингового поиска лиц с нарушениями среди здоровых пациентов, но более подробную диагностику степени выраженности нарушений по движениям глаз [Jothi Prabha, 2023].

Другой исследовательской группой, кто, как и авторы работы [Nerušil, 2021], тоже пробовал экспериментировать с нейронными сетями для диагностики дислексии по движениям глаз, была группа из Сербии: ими опубликована серия работ с использованием не только нейросетей, но и других методов ИИ, основанных на наборе данных из работы [Jakovljević, 2021]. В своих исследованиях им удавалось достигать точности от 85,6% до 94% [65–68]. При этом в одной из работ они опробовали свой алгоритм и на данных для другого языка (на описанном выше наборе данных [Benfatto, 2016]) и получили приемлемую, хотя и не самую высокую точность в 82,9%. Для набора данных из публикации [Benfatto, 2016] это самая низкая полученная точность, однако интересен тут тот факт, что обучение алгоритма проводилось на данных для сербского языка, а тестирование — на данных для шведского языка. Это также говорит в пользу того, что движения глаз у испытуемых с дислексией имеют некие ключевые особенности, вне зависимости от родного языка обследуемого и протокола сбора данных.

В работах [Asvestopoulou, 2019; Smyrnakis, 2017] представлены разные алгоритмы для данных, собранных для греческого языка. В первой работе [Smyrnakis, 2017] авторами уже была получена неплохая точность в 94,2%, но во второй работе [Asvestopoulou, 2019] для тех же данных при применении линейного метода опорных векторов точность достигла очень высокого значения в 97,1%.

Некоторые данные использовались только однократно, но в самих работах авторы часто используют несколько методов ИИ. Наилучшая точность для данных на французском языке, собранных в работе [Ward, 2020] и проанализированных методами ИИ в работе [El Hmimdi, 2021], достигла 81,25% с использованием метода логистической регрессии. Интересно, что помимо текстовых задач, авторы использовали и задания без текста, в которых требовалось совершать произвольные саккады между несколькими мишенями, и для такой задачи была получена та же точность диагностики в 81,25%, что можно рассматривать как свидетельство в пользу гипотезы об общем окуломоторном дисбалансе при дислексии, о чем говорилось выше. Для данных на финском языке в работе [Raatikainen, 2021] была получена точность в 89,7%, причем авторы считают, что их алгоритм может выделять не только пациентов с дислексией, но и пограничные случаи трудностей с чтением. Еще один набор данных, который был использован только однократно, был описан в работе [Lustig, 2016]. Автору удалось достичь наилучшей точности в 83%. Важно отметить, что в данном случае в выборке были уже взрослые испытуемые старше 20 лет: с возрастом особенности движений глаз у людей с дислексией и сами особенности чтения могут становиться менее выраженными.

Начиная с 2015 года число работ по диагностике дислексии методами ИИ с использованием движений глаз растет, при этом все чаще используются не только простые модели, но и более сложные методы, например, различные варианты нейросетей. Получаемая разными авторами для разных языков точность диагностики показывает, что данное направление довольно перспективно и может быть эффективно для раннего выявления лиц с расстройствами чтения.

Группы испытуемых

Важными параметрами при анализе работ являются состав набора данных (dataset) и особенно состав групп испытуемых, на которых были получены данные. На рисунке 2 представлено краткое описание наборов данных, фигурирующих в этом обзоре. Некоторые данные собирались в рамках того же исследования, где на них в первый раз применяли методы ИИ, то есть данные, вероятно, изначально предназначались для классификации дислексии по записям движений глаз. Но некоторые авторы использовали данные из других работ, посвященных оценке движений глаз, но не автоматической классификации получаемых данных. Например, в работе [El Hmimdi, 2021] авторы используют данные из работы [Ward, 2020].

Как было упомянуто, при оценке формальных показателей точности нужно учитывать сбалансированность выборки испытуемых: чтобы показатель точности был легитимным, в выборке испытуемых должно быть поровну как лиц с дислексией, так и лиц без нее. В обзоре обсуждаются результаты, полученные на семи разных наборах данных: в шести из них авторы постарались подобрать примерно равное число пациентов с дислексией и без дислексии. На рисунке 2 представлены сведения об обсуждаемых наборах данных, в том числе информация о соотношении общих размеров выборок и пропорции в них испытуемых с и без дислексии.

В популяции распространенность дислексии оценивается разными авторами по-разному, но чаще всего приводятся цифры 7–10%. Тем не менее при использовании методов ИИ важно использовать не то же соотношение, что в популяции, а сбалансированные доли лиц с нарушениями и без них. Корректно разработанный алгоритм будет с достаточной точностью выявлять искомые случаи при любом их соотношении в тестовой выборке.

Вероятно, важным параметром при проведении данных исследований является возраст испытуемых. Во-первых, с возрастом многие пациенты с дислексией могут постепенно улучшать показатели глазодвигательной активности, а их паттерны движений глаз, равно как и сами навыки чтения, становятся более похожими на паттерны у здоровых испытуемых. Во-вторых, наибольшую эффективность диагностика дислексии имеет в раннем возрасте, когда дети еще наиболее чувствительны к возможным коррекционным процедурам, поэтому скрининговые методы для детей, учитывающие возрастные особенности, кажутся более перспективными. На рисунке 2 помимо сбалансированности выборки представлено и распределение возрастов испытуемых в семи наборах данных. Некоторые авторы приводят неполные данные о возрасте: например, в работе [Lustig, 2016] указано, что в эксперименте принимали участие студенты, а в работе [Raatikainen, 2021] указан только средний возраст испытуемых.

Рис. 2. Данные о семи наборах данных, которые используются в работах по диагностике дислексии по движениям глаз методами ИИ

В первом столбце приведены ссылки на первую публикацию (источник) данных и год публикации. Во втором столбце приведены данные об общем числе испытуемых с дислексией и без нее; столбец дает представление об общем размере и сбалансированности набора данных. В третьем столбце приведены данные о распределении возрастов испытуемых в каждом наборе данных. В четвертом столбце приведены языки, для которых были собраны данные (то есть родной язык испытуемых данной группы). В пятом столбце указана частота регистрации движений глаз, при которой были собраны данные.

Наиболее широкий возрастной диапазон испытуемых был в самой первой работе [Rello, 2015] по данной тематике — от 11 до 54 лет (20,96±9,98 лет — в группе с дислексией, 29,20±9,03 — в группе без дислексии). Как видно из рис. 1, этими авторами была получена самая низкая точность диагностики (80,18%). В этой же работе авторы показали, что результаты классификации разработанной моделью снижаются, если убрать признак возраста из входных данных: точность снизилась с 80,18% до 76,38%. В работе [Lustig, 2016] группа испытуемых состояла из студентов, и автором тоже была получена не очень высокая точность (83%). Возможно, точность диагностики пациентов старшего возраста не может быть такой высокой, как детей.

Группы испытуемых в рассматриваемых работах делят на испытуемых с дислексией и без нее, но важно понимать, что это деление получено авторами разными диагностическими способами: в некоторых работах учитывается подробный анамнез каждого участника, то есть проводится подробное обследование, и тогда диагноз, как правило, установлен достаточно точно: например, в работах [Asvestopoulou, 2019; Rello, 2015; Smyrnakis, 2017; Ward, 2020] диагноз ставился специалистами или комиссией вне данного исследования — сами авторы статьи не проводили тестирование на дислексию. В некоторых работах авторы используют результаты разного числа тестов [Benfatto, 2016; Raatikainen, 2021]. По результатам одного теста испытуемые могут быть разделены не совсем корректно, ведь любой тест тоже имеет свою собственную сенситивность и специфичность. Кроме того, дислексия может быть выражена в разной степени, то есть наличие или отсутствие диагноза — это не совсем бинарная переменная. В работе [Raatikainen, 2021] авторы использовали беглость чтения для отбора испытуемых и в качестве группы детей с нарушением взяли всех лиц по критерию отсечки на 10-м перцентиле. В работе [Benfatto, 2016], набор данных из которой потом многократно использовался другими исследователями, взяты данные масштабного исследования чтения, проведенного в 1989–2010 годах, и в качестве уровня отсечки взят 5-й перцентиль по двум тестам. Помимо этого, специалисты обычно выделяют разные типы дислексии, которые могут по-разному проявляться в паттернах движений глаз. Однако ни в одной из цитируемых работ типы дислексии не разделялись и не обсуждались. Эта особенность отбора, то есть различие изначального представления данных о выборке, всегда должна учитываться при использовании любого автоматического алгоритма классификации.

Экспериментальные условия

Представленные в обзоре работы различаются по условиям сбора данных: какие типы айтрекеров использовались, какая длительность чтения была в задаче для испытуемых, какие типы текстов применялись.

Во всех рассматриваемых работах использовались разные айтрекеры, причем приборы различались и по частоте регистрации данных, и по типу устройства (настольные или в виде очков). Для повышения точности данных многие исследователи использовали также и фиксацию головы испытуемого. Фиксация головы, конечно, менее удобна при тестировании детей, поэтому дополнительный интерес представляют исследования, проводимые без ограничения движений испытуемого.

Чтение вслух и про себя могут отличаться по паттерну движений глаз [Levy-Schoen, 1981], поэтому при постановке эксперимента важно учитывать, какой режим чтения использовался. В рассматриваемых работах чаще использовалось чтение про себя (5 работ из 7), в одной работе тип чтения не был указан [Raatikainen, 2021], в одной работе использовалось чтение вслух [El Hmimdi, 2021].

Чаще всего данные о движениях глаз для диагностики дислексии получают при чтении испытуемым небольших текстов, однако существуют и другие типы тестовых задач. Используемые тексты, как правило, подбираются под возраст испытуемых с учетом наработок поведенческих тестовых программ для выявления дислексии. При этом из рассмотренных данных можно предположить, что для некоторых алгоритмов важно подбирать адекватные по сложности тексты с учетом возраста и когнитивного развития испытуемых. Например, в работе [Smyrnakis, 2017] авторы использовали условно сложный и условно простой тексты. Данные движений глаз на сложных текстах позволяли с высокой точностью диагностировать дислексию — 94,2%, а вот данные на легком тексте не дали такого качества классификации: точность диагностики достигла только 87,9%. Авторы считают, что даже испытуемые с дислексией легко справлялись с простым текстом и не показывали типичных паттернов движений глаз для данного нарушения. Этот результат согласуется с работами других авторов о том, что при подборе соответствующих текстов движения глаз у лиц с дислексией становятся больше похожи на движения глаз нормотипичных обследуемых, и наоборот [Olson, 1983; Pirozzolo, 1979; Rayner, 1986]. Однако в работе [Vajs, 2023] было показано, что можно обучить алгоритм, который будет давать близкую точность классификации даже при обучении на данных, собранных на одной задаче, и тестируемом на данных, собранных на другой задаче (тоже задаче чтения, но отличной как по объему прочитываемого текста, так и по языку). При этом о влиянии сложности текстов, использованных в этих задачах, авторы не упоминают.

В литературе используются различные текстовые задачи, например, задачи просто на чтение [20; 22; 44; 59; 60; 65–68], задачи чтения с ответами на вопросы [Raatikainen, 2021], задачи чтения текстов со смыслом и бессмысленных текстов [El Hmimdi, 2021]. Обычно тексты предъявляются несколькими частями, по 6–8 строк на одной странице или экране. Интересно отметить, что почти при всех задачах на чтение исследователи предупреждают испытуемых, что после прочтения нужно будет ответить на некоторые вопросы. Такая методика используется для того, чтобы стимулировать испытуемых именно читать и понимать текст, а не просто пробегать его глазами. Однако данные о правильности ответов ни в одной работе не учитывались.

Помимо задач на чтение, в одной из работ была добавлена задача на фиксацию точек (светящихся объектов), причем применялись стимулы и на фиксацию объектов в одной плоскости, и на фиксацию разноудаленных от испытуемого точек, как бы расположенных на разной глубине [El Hmimdi, 2021]. Такие задачи позволяют оценить движения глаз вне задачи чтения и также вовлечь и вергентные движения глаз (то есть сведение и разведение зрительных осей для фиксации объектов, расположенных на разном удалении от наблюдателя). До этого в нескольких работах упоминалось, что у пациентов с дислексией могут быть отличными от здоровой выборки не только паттерны фиксаций и саккад, но и паттерны вергентных движений [Bucci, 2008; Jainta, 2011]. В упомянутой работе [El Hmimdi, 2021] авторы показали, что диагностика дислексии сопоставима по точности для текстовых задач и для задачи фиксации стимулов: 81,25% и 70,2% соответственно при чтении бессмысленного текста и текста со смыслом, 81,25% при использовании данных о саккадах во фронтопараллельной плоскости, 77,3% при использовании данных вергентных движений (саккад по глубине, в саггитальном направлении). Однако общая точность диагностики в данной работе невысока, поэтому, возможно, для подтверждения выводов авторов нужны дополнительные исследования.

Наиболее часто тестовый текст в рассматриваемых работах был черного цвета на белом фоне, так как в повседневной жизни именно такой стиль используется повсеместно. В одной из работ авторы использовали не белый, а серый фон — возможно, чтобы избежать слишком сильного контраста, возникающего при тестировании в помещении и предъявлении на самосветящемся источнике — дисплее компьютера [Smyrnakis, 2017]. В еще один набор вошли данные эксперимента, в котором первым стимулом всегда был черный текст на белом фоне, а после него испытуемые читали несколько текстов с разными цветами фона [Jakovljević, 2021]: долгое время существовали различные мнения о том, может ли цвет фона помогать испытуемым с дислексией улучшать показатели чтения [Albon, 2008; Henderson, 2014]. Помимо цвета, разные авторы использовали разные размеры и начертания шрифтов и немного разные расстояния наблюдения. В одной из работ сравнивались разные варианты шрифтов, но значимых преимуществ какого-либо из шрифтов для испытуемых с дислексией показано не было [Rello, 2015].

Ни в одной из работ авторы не ограничивали длительность чтения текста, и, наоборот, почти во всех исследованиях указано, что испытуемых просили читать текст вдумчиво и внимательно, так как после прочтения будут заданы вопросы на понимание прочитанного.

Из представленных сведений видно, что рассматриваемые в обзоре данные сильно разнородны как по содержанию тестового материала, так и по условиям его предъявления. Несмотря на это во всех работах авторам удавалось добиться приемлемого качества классификации групп испытуемых. Также можно сделать вывод, что для наиболее надежного алгоритма диагностики дислексии важно подбирать корректные тексты для данной возрастной группы. Несмотря на то, что в литературе присутствуют разные мнения о том, есть ли у лиц с дислексией общие особенности движений глаз, не привязанные к обработке языка, и даже есть результаты достаточно точной диагностики по задачам без чтения, этих данных мало, они часто противоречивы.

Языки, для которых проводились исследования диагностики дислексии по движениям глаз методами ИИ

На данный момент существуют исследования, показывающие перспективность использования методов ИИ и анализа движений глаз пациентов как минимум для шести языков: шведского, греческого, сербского, финского, французского, испанского (рис. 2).

Структура и особенности языков различаются и могут влиять на проявления дислексии и точность ее диагностики. Сильнее всего влияют параметры орфографии языка (глубокая или поверхностная (deep / shallow), последовательная или непоследовательная (consistent / inconsistent)) и использование алфавита (алфавитные или неалфавитные, например, иероглифические языки). Это касается как диагностики по поведенческим тестам, так и диагностики по движениям глаз. Например, при глубокой орфографической структуре языка дислексию диагностировать легче, а при поверхностной структуре — труднее [Vellutino, 2004].

Среди рассматриваемых в данном обзоре работ шведский и французский языки имеют глубокую орфографическую структуру (то есть диагностика дислексии несколько проще), сербский и финский — поверхностную структуру (то есть диагностика заметно сложнее), а греческий и испанский — промежуточную. По данным, представленным на рис. 1, видно, что для сербского языка (желтые столбцы, данные из работы [Jakovljević, 2021]) методы диагностики с использованием ИИ в большинстве случаев давали более низкие показатели точности, чем для шведского (фиолетовые столбцы, данные из работы [Benfatto, 2016]). Однако это может быть связано и с точностью разделения самой обучающей выборки, так как для шведского диагностика любым поведенческим тестом даст более высокую точность. Несмотря на то, что диагностика дислексии методами ИИ для языков с поверхностной орфографией может давать более низкие точности, чем для языков с глубокой орфографией, такие методы имеют бóльшую практическую значимость: объективная диагностика может значимо упрощать выявление случаев дислексии в регионах, где этот язык распространен.

Исследования движений глаз лиц с дислексией для иероглифических языков показывают схожие изменения в паттернах движений глаз, несмотря на отличную структуру языка: например, для китайского языка были также показаны более короткие по дистанции саккады, менее частые фиксации и в целом большее число фиксаций и саккад на одном и том же количестве текстового материала [Wu, 2018]. Пока что нет работ об использовании методов ИИ для диагностики дислексии в иероглифических языках, но сходство паттернов движений глаз позволяет предполагать, что и для них такие исследования могут быть перспективны.

В одной из работ авторы проверили возможность переноса алгоритмов между различными языками: алгоритм обучался на одном языке и тестировался на данных другого языка (использовались сербский и шведский языки) [Vajs, 2023]. Авторы показали, что точность диагностики существенно не снижается, несмотря на различия между использованными языками. В данных работах помимо различий в языках использовались и разные тестовые задачи (тексты разной структуры), что делает результат этого межъязыкового переноса еще более вдохновляющим.

Можно предположить, что существует перспектива создания диагностического алгоритма, который будет работать с высокой точностью для разных языков, основываясь именно на особенностях движений глаз лиц с дислексией. Тем не менее для максимального качества диагностики, конечно, обучение алгоритмов ИИ лучше проводить на том языке, для носителей которого тест предназначается.

Частота регистрации движений глаз, необходимая для детекции дислексии

Одной из самых дорогостоящих частей современных айтрекеров, предназначенных для научных исследований, являются высокочастотные камеры. Современные модели позволяют регистрировать изображение глаз с частотой 1200 (SMI), 2000 Гц (Eye-link). Высокая частота регистрации необходима для исследования, например, микродвижений глаз. Но насколько она важна для диагностики дислексии?

На рис. 2 в четвертом столбце представлена информация о частотах регистрации данных движений глаз во всех цитируемых в этом обзоре наборах данных. Во многих работах по детекции дислексии по движениям глаз используются данные, собранные с условно низкой частотой регистрации: 50 Гц [Rello, 2015] и 60 Гц [20; 60; 65–68]. Точность диагностики дислексии в этих работах была в диапазоне от 80,18% [Rello, 2015] до 97,1% [Asvestopoulou, 2019]. Высокочастотные данные (1000 Гц) использовались только в одной работе, и наилучшая точность диагностики на такой частоте была 89,7% [Raatikainen, 2021]. В одном из самых часто используемых наборов данных частота регистрации была 100 Гц [Benfatto, 2016], а точность диагностики на нем колебалась от 82,9% [Vajs, 2023] до 99,6% [Nerušil, 2021]. Из этого краткого рассмотрения видно, что никакой очевидной зависимости между частотой регистрации и точностью диагностики в представленных в литературе данных не наблюдается.

В одной работе авторы даже поставили дополнительный вопрос о значимости частоты регистрации движений глаз для детекции дислексии: взяв данные с исходной частотой в 60 Гц они, децимировав и доведя обработанные данные до 30 Гц, сравнили результаты работы алгоритма на этих двух наборах [Vajs, 2023а]. Авторы показали, что точность получаемых результатов практически не снижается: 88,9% — для 60 Гц (c использованием логистической регрессии или с использованием метода опорных векторов) и 87,8% — для 30 Гц (с использованием логистической регрессии). Важно отметить, что в данной работе исходный набор данных был уже получен на низкой частоте регистрации (60 Гц), и было бы интересно исследовать, насколько отличается результат работы алгоритма при использовании, например, данных с частотой 1200 Гц и тех же данных после децимации до 60–30 Гц, поскольку до сих пор нет абсолютно однозначного мнения о том, какие именно параметры движений глаз являются диагностическим фактором дислексии. Данный вопрос может быть интересной областью для будущих исследований дислексии.

Тем не менее можно сделать вывод, что для получения хорошего качества диагностики дислексии не требуется высокая частота регистрации движений глаз, то есть вполне разумно использовать недорогие доступные айтрекеры, что, конечно, делает скрининг дислексии методами регистрации движений глаз еще более привлекательным.

Типы используемых алгоритмов ИИ в задачах диагностики дислексии по движениям глаз

В данном обзоре мы не будем детально разбирать особенности алгоритмов ИИ, поэтому заинтересованным читателям для получения более детальной информации об упоминаемых методах рекомендуем обращаться к тематическим пособиям [Гудфеллоу, 2018; Миркин, 2023].

Одним из самых популярных алгоритмов в задачах ИИ является алгоритм на основе метода опорных векторов (support vector machine, SVM) [Cortes, 1995]. Наибольшая частота использования алгоритма опорных векторов характерна не только для диагностики дислексии по движениям глаз, но и для диагностики дислексии по другим типам данных: в обзоре [Usman, 2021] приводится статистика на 2021 год, где алгоритм опорных векторов указан как главный метод для 34% публикаций по диагностике дислексии с использованием разных типов входных данных.

На рис. 3 приведены частоты использования разных алгоритмов в работах по диагностике дислексии методами ИИ с использованием движений глаз. Всего рассмотрено 15 работ, но в некоторых авторы использовали несколько методов, поэтому сумма упоминаний алгоритмов больше 15. При использовании в качестве входных данных именно записи движений глаз метод опорных векторов в разных модификациях и с разными настройками использовался в 12 работах. Другими популярными методами являются логистическая регрессия [McCullagh, 1989], метод случайного леса (random forest) [Ho, 1995], метод k-ближайших соседей (k-nearest neighbors) [Cover, 1967]. В работах последних лет все чаще используются методы глубокого обучения — различные варианты нейросетей.

Несмотря на популярность алгоритма опорных векторов в релевантных публикациях, выбор оптимального алгоритма для данной задачи остается открытым вопросом. Прогресс современных методов анализа данных, в том числе и методов глубокого обучения, дает основания полагать, что качество диагностики дислексии методами ИИ еще будет улучшаться.

Рис. 3. Частота использования разных алгоритмов в 15 рассматриваемых публикациях

Примечание: всего в обзоре рассмотрены 15 экспериментальных исследований, в некоторых из которых авторы использовали по несколько алгоритмов, поэтому суммарное число упоминаний алгоритмов превышает 15.

Предварительный отбор признаков в данных

Большинство методов ИИ требуют выделения ключевых свойств данных перед началом анализа. В обзоре [Kaisar, 2020] автор приводит данные о том, какие методы отбора признаков чаще всего применяются в работах по диагностике дислексии (см. таблицу 2 в указанном источнике).

Некоторые авторы используют и демографические данные, и данные айтрекинга (например, в работе [Rello, 2015] использовали возраст испытуемых). Другие исследователи игнорируют демографические и прочие не относящиеся к записи движений глаз данные, при этом получают довольно высокие значения точности (например, 97,1% в работе [Asvestopoulou, 2019] и 89,7% в работе [Raatikainen, 2021], в которых авторы используют только данные о движениях глаз и о тексте).

Как уже было сказано, при сборе большинства наборов данных движений глаз во время чтения текста испытуемых предупреждали, что после чтения им будут заданы вопросы на понимание прочитанного. Этот метод стимулирует испытуемых не просто бегло просматривать текст. Однако ни в одной работе ответы на эти вопросы не учитывались, то есть качество понимания ни разу не использовалось как один из признаков.

В качестве предварительной обработки данных часто используются алгоритмы выделения фиксаций и саккад, а потом для обоих этих событий считаются различные статистики (медианы, средние и разбросы для длительности, длины, частоты и других параметров). Но некоторые авторы вводят и более сложные составные признаки, оцениваемые по параметрам движений глаз. Например, в работе [Asvestopoulou, 2019] авторы составляют два набора признаков, которые они называют «word related» и «non-word related», то есть относящиеся и не относящиеся к структуре читаемого текста (например, относящиеся к тексту — число многократно фиксируемых слов, а не относящиеся к тексту — общее число фиксаций, длительность фиксаций, длина саккад и др.). Отобрав наиболее информативные признаки методом LASSO, авторы получили маленький, но комбинированный набор: длина саккады (saccade length; не относящееся к тексту), число коротких продвижений вперед по тексту (number of short forward movements; не относящееся к тексту) и число многократно фиксируемых слов (number of multiply fixated words; относящееся к тексту). При этом авторы пишут, что признаки, относящиеся к тексту, оказывались отобраны методом LASSO только при диагностике по чтению сложного текста. При использовании простого текста после отбора оставались только не относящиеся к тексту признаки.

Создание новых признаков похоже на очень плодородную почву для исследования: некоторые авторы раз за разом публикуют работы, где они, не сильно меняя набор используемых моделей ИИ и используя одни и те же данные, меняют входные признаки, придумывая все более оригинальные комбинации [38–40]. Те же авторы исследовали и влияние алгоритмов выделения саккад и фиксаций, сравнивая алгоритмы, зависящие от скорости, и алгоритмы, зависящие от дисперсии. При анализе результатов авторы говорят, что зависящие от скорости методы дают лучшие значения точности диагностики [Jothi Prabha, 2020].

Однако появляются публикации с применением методов глубокого обучения, говорящие о возможности качественной диагностики и без выделения ключевых свойств [Nerušil, 2021; Vajs, 2023]. Авторы делают вывод, что для достижения приемлемого качества можно использовать сырые данные трекинга (то есть координаты x, y, без деления входных данных на фиксации и саккады). При этом, разумеется, авторы проводят предварительную фильтрацию данных от морганий и пропущенных значений, но больше никакой обработке данные не подвергаются. Одним из существенных преимуществ такого подхода является возможность переноса алгоритма между разными устройствами и разными исследованиями, поскольку для выделения саккад и фиксаций могут применяться разнообразные алгоритмы, а в данной методике алгоритм выделения фиксаций и саккад не задействуется.

Наличие доступных наборов данных

Несмотря на расширяющийся интерес к данной области, авторы не очень активно выкладывают собранные данные. Максимально доступен набор данных 69 испытуемых (8,5–12,5 лет, родной язык — греческий), который можно легко скачать из онлайн-приложения статьи [Smyrnakis, 2017]. Еще один набор, который часто повторно используется в публикациях, но, видимо, доступен только при обращении к авторам, состоит из записей движений глаз 185 испытуемых (8–9 лет, родной язык — шведский) [Benfatto, 2016].

Заключение

Дислексия является одной из самых частых трудностей обучения, и частота ее выявления среди населения достигает порядка 10% [Корнев, 2006; Лалаева, 2002; Русецкая, 2007; Australian Dyslexia Association; Peterson, 2012; Peterson, 2015]. Ранняя диагностика дислексии и введение коррекционной терапии может существенно улучшать качество жизни ребенка и его близких, ведь трудности с чтением существенно осложняют получение информации в современном мире.

Появляющиеся начиная с 2015 года работы показывают, что для диагностики дислексии можно использовать сочетание айтрекеров и различных методов ИИ. Согласно проведенному анализу литературы, для приемлемой точности диагностики вполне пригодны айтрекеры с невысокой частотой регистрации (50–60 Гц). При этом наиболее часто используемая процедура — чтение текста про себя — может быть гораздо менее стрессовой для ребенка, чем выполнение заданий вслух.

Особенную ценность диагностика дислексии с использованием движений глаз представляет для языков с неглубокой орфографией, для которых в целом такая диагностика затруднена. Пока что не очевидно, действительно ли движения глаз лиц с дислексией имеют радикальные отличия от движений глаз нормотипичных обследуемых. Однако очевидно, что при наличии хорошо подобранной обучающей выборки и с учетом возрастной динамики показателей, с тщательным подбором тестовых текстов, можно создать алгоритм, который будет с высокой точностью выделять лиц с риском нарушений чтения. Это важно, учитывая, что доступность ранней диагностики дает возможность как можно раньше принять меры по коррекции и тренировке.

Описанные в данном обзоре результаты показывают, что использование айтрекинга и методов ИИ может быть перспективным диагностическим инструментом для раннего выявления дислексии, не требующим длительного обследования и профессионального сопровождения.

Ограничения и перспективы исследования. Диагностика дислексии связана с оценкой навыков чтения, хотя это и не синонимы. Тем не менее в данном обзоре мы в основном рассматривали те публикации, в которых авторы ставили своей целью именно диагностику случаев дислексии. Ряд других исследователей используют методы искусственного интеллекта для оценки навыков чтения, в том числе для оценки уровня освоения иностранного языка или уровня владения тем или иным языком программирования. Можно предположить, что анализ этого блока публикаций также может быть интересен для определения дальнейших направлений развития диагностических методов и методов приложения искусственного интеллекта.

Литература

Ахутина Т.В., Иншакова О.Б. Нейропсихологическая диагностика, обследование письма и чтения младших школьников. М.: В. Секачев, 2016. 180 с.
Барабанщиков В.А., Жегалло А.В. Айтрекинг: Методы регистрации движений глаз в психологических исследованиях и практике. М.: Когито-Центр, 2014. 128 с.
Безруких М.М. Трудности обучения в начальной школе. Причины, диагностика, комплексная помощь. М.: Эксмо, 2009. 464 с.
Глозман Ж.М., Потанина А.Ю., Соболева А.Е. Нейропсихологическая диагностика в дошкольном возрасте. 2-е изд. СПб.: Питер, 2008. 80 с.
Гольдина С.М., Лауринавичюте А.К., Лопухина А.А. и др. Особенности движений глаз при чтении у детей с дислексией // Первый Национальный конгресс по когнитивным исследованиям, искусственному интеллекту и нейроинформатике. Девятая международная конференция по когнитивной науке. Москва, 10–16 октября 2020 г.: Сборник научных трудов / Под ред. В.Л. Ушакова, И.И. Русака, В.В. Климова и др. В двух частях. Том. Часть 1. М.: Национальный исследовательский ядерный университет «МИФИ». 2021. С. 497–500.
Гудфеллоу Я., Курвилль А., Бенджио И. Глубокое обучение. М.: ДМК-Пресс, 2018. 652 с.
Дорофеева С.В. Речевой дефицит и дислексия: экспериментальное исследование русскоговорящих детей: автореф. дис. … канд. фил. наук. М., 2020. 68 с.
Дорофеева С.В., Решетникова В.А., Зырянов А.С. и др. Батарея тестов для выявления особенностей фонологической обработки у русскоязычных детей: данные нормы и группы детей с дислексией // Восьмая международная конференция по когнитивной науке, Светлогорск, 18–21 октября 2018 г.: тезисы докладов / Под ред. А.К. Крылова, В.Д. Соловьева. М.: изд-во «Институт психологии РАН», 2018. С. 331–333.
Корнев А.Н. Основы логопатологии детского возраста: клинические и психологические аспекты. СПб.: Речь, 2006. 380 с.
Корнев А.Н., Оганов С.Р., Гальперина Е.И. Формирование психофизиологических механизмов понимания письменных текстов: регистрация движений взора при чтении у детей с дислексией 9–11 и 12–13 лет и здоровых сверстников // Физиология человека. 2019. Том 45. № 3. С. 24–30. DOI: 10.1134/S0131164619030081
Лалаева Р.И. Нарушения чтения и пути их коррекции у младших школьников. Учебное пособие. СПб.: Союз, 2002. 224 с.
Миркин Б.Г. Введение в анализ данных: учебник и практикум. М.: Юрайт, 2023. 174 с.
Оганов С.Р., Корнев А.Н. Как глаз сканирует текст при чтении: особенности фиксаций на тексте у детей с дислексией // Медицина: теория и практика. 2019. Том 4. № 5. С. 400–401.
Оганов С.Р., Корнев А.Н. Окуломоторные референты деятельности чтения у детей с дислексией 9–11 лет // Физиология человека. 2023. Том 49. № 3. С. 34–41. DOI: 10.31857/S0131164622600872
Русецкая М.Н. Нарушения чтения у младших школьников: Анализ речевых и зрительных причин. СПб.: КАРО, 2007. 192 с.
Рычкова С.И., Лихванцева В.Г. Зрительные нарушения у пациентов с дислексией (обзор литературы) // The EYE ГЛАЗ. 2022. Том 24. № 2. С. 47–54. DOI: 10.33791/2222-4408-2022-2-47-54
Ярбус А.Л. Роль движений глаз в процессе зрения. М.: Наука, 1965. 166 с.
Albon E., Adi Y., Hyde C. The effectiveness and cost-effectiveness of coloured filters for reading disability: a systematic review. Birmingham: University of Birmingham, 2008. 121 p.
Al-Edaily A., Al-Wabil A., Al-Ohali Y. Dyslexia Explorer: A screening system for learning difficulties in the Arabic language using eye tracking // Proceedings of Human Factors in Computing and Informatics: First International Conference, SouthCHI 2013, Maribor, Slovenia, July 1–3, 2013. 2013. P. 831–834. DOI: 10.1007/978-3-642-39062-3_63
Asvestopoulou T., Manousaki V., Psistakis A. et al. DysLexML: Screening tool for dyslexia using machine learning. 2019. URL: http://arxiv.org/abs/1903.06274 (дата обращения: 10.10.2023).
Australian Dyslexia Association. Dyslexia in Australia. URL: https://dyslexiaassociation.org.au/dyslexia-in-australia/ (дата обращения: 10.10.2023)
Benfatto M.N., Seimyr G.Ö., Ygge J. et al. Screening for dyslexia using eye tracking during reading // PLoS ONE. 2016. Vol. 11 (12). Article e165508. DOI: 10.1371/journal.pone.0165508
Biscaldi M., Fischer B., Hartnegg K. Voluntary saccadic control in dyslexia // Perception. 2000. Vol. 29 (5). P. 509–521. DOI: 10.1068/p2666a
Bucci M.P., Brémond-Gignac D., Kapoula Z. Poor binocular coordination of saccades in dyslexic children // Graefe's Archive for Clinical and Experimental Ophthalmology. 2008. Vol. 246. P. 417–428. DOI: 10.1007/s00417-007-0723-1
Cortes C., Vapnik V. Support-vector networks // Machine Learning. 1995. Vol. 20. P. 273–297. DOI: 10.1007%2FBF00994018
Cover T., Hart P. Nearest neighbor pattern classification // IEEE Transactions on Information Theory. 1967. Vol. 13 (1). P. 21–27. DOI: 10.1109/TIT.1967.1053964
De Luca M., Borrelli M., Judica A. et al. Reading words and pseudowords: An eye movement study of developmental dyslexia // Brain and Language. 2002. Vol. 80. P. 617–626. DOI: 10.1006/brln.2001.2637
Deans P., O’Laughlin L., Brubaker B. et al. Use of eye movement tracking in the differential diagnosis of attention deficit hyperactivity disorder (ADHD) and reading disability // Psychology. 2010. Vol. 1 (4). P. 238–246. DOI: 10.4236/psych.2010.14032
El Hmimdi A.E., Ward L.M., Palpanas T. et al. Predicting dyslexia and reading speed in adolescents from eye movements in reading and non-reading tasks: A machine learning approach // Brain Sciences. 2021. Vol. 11 (10). Article 1337. DOI: 10.3390/brainsci11101337
Fischer B., Hartnegg K. Stability of gaze control in dyslexia // Strabismus. 2000. Vol. 8 (2). P. 119–122. DOI: 10.1076/0927-3972(200006)821-2FT119
Franzen L., Stark Z., Johnson A.P. Individuals with dyslexia use a different visual sampling strategy to read text // Scientific Reports. 2021. Vol. 11. Article 6449. DOI: 10.1038/s41598-021-84945-9
Henderson L.M., Taylor R.H., Barrett B. et al. Treating reading difficulties with colour // BMJ. 2014. Vol. 349. Article g5160. DOI: 10.1136/bmj.g5160
Ho T.K. Random decision forests // Proceedings of 3rd international conference on document analysis and recognition. IEEE, 1995. Vol. 1. P. 278–282. DOI: 10.1109/ICDAR.1995.598994
Høien T., Lundberg I. Dyslexia: From theory to intervention. Part of the Neuropsychology & Cognition book series. Vol. 18. Springer, 2000. 230 p. DOI: 10.1007/978-94-017-1329-0
Hyönä J., Olson R.K. Eye fixation patterns among dyslexic and normal readers: Effects of word length and word frequency // Journal of Experimental Psychology: Learning, Memory, and Cognition. 1995. Vol. 21 (6). P. 1430–1440. DOI: 10.1037/0278-7393.21.6.1430
Jainta S., Kapoula Z. Dyslexic children are confronted with unstable binocular fixation while reading // PLoS ONE. 2011. Vol. 6 (4). Article e18694. DOI: 10.1371/journal.pone.0018694
Jakovljević T., Janković M.M., Savić A.M. et al. The relation between physiological parameters and colour modifications in text background and overlay during reading in children with and without dyslexia // Brain Sciences. 2021. Vol. 11 (5). Article 539. DOI: 10.3390/brainsci11050539
Jothi Prabha A., Bhargavi R. Eye movement feature set and predictive model for dyslexia: Feature set and predictive model for dyslexia // International Journal of Cognitive Informatics and Natural Intelligence. 2021. Vol. 15 (4). P. 1–22. DOI: 10.4018/IJCINI.20211001.oa28
Jothi Prabha A., Bhargavi R. Prediction of dyslexia from eye movements using machine learning // IETE Journal of Research. 2019. Vol. 68 (2). P. 814–823. DOI: 03772063.2019.1622461
Jothi Prabha A., Bhargavi R. Predictive model for dyslexia from fixations and saccadic eye movement events // Computer Methods and Programs in Biomedicine. 2020. Vol. 195. Article 105538. DOI: 10.1016/j.cmpb.2020.105538
Jothi Prabha A., Bhargavi R. et al. Prediction of dyslexia severity levels from fixation and saccadic eye movement using machine learning // Biomedical Signal Processing and Control. 2023. Vol. 79. Article 104094. DOI: 10.1016/j.bspc.2022.104094
Kaisar S. Developmental dyslexia detection using machine learning techniques: A survey // ICT Express. 2020. Vol. 6(3). P. 181–184. DOI: 10.1016/j.icte.2020.05.006
Levy-Schoen A. Flexible and/or rigid control of oculomotor scanning behavior / Eye movements: Cognition and visual perception / Fisher D.F., Monty R.A., Senders J.W. (eds.). Hillsdale (NJ): Lawrence Erlbaum, 1981. P. 299–314. DOI: 10.4324/9781315437415
Lustig J. Identifying dyslectic gaze pattern. Comparison of methods for identifying dyslectic readers based on eye movement patterns. PhD Thesis. KTH Royal Institute of Technology. 2016. URL: https://www.diva-portal.org/smash/record.jsf?pid=diva2%3A955646&dswid=-7506 (дата обращения: 21.10.2023)
McCullagh P. Generalized linear models. New York: Routledge. 1989. 532 p. DOI: 10.1201/9780203753736
Nerušil B., Polec J., Škunda J. et al. Eye tracking based dyslexia detection using a holistic approach // Scientific Reports. 2021. Vol. 11. Article 15687. DOI: 10.1038/s41598-021-95275-1
Olson R.K., Kliegl R., Davidson B.J. Dyslexic and normal readers’ eye movements // Journal of Experimental Psychology: Human Perception and Performance. 1983. Vol. 9 (5). P. 816–825. DOI: 10.1037/0096-1523.9.5.816
Parshina O., Lopukhina A., Goldina S. et al. Global reading processes in children with high risk of dyslexia: A scanpath analysis // Annals of Dyslexia. 2022. Vol. 72. P. 403–425. DOI: 10.1007/s11881-021-00251-z
Pavlidis G.T. Do eye movements hold the key to dyslexia? // Neuropsychologia. 1981. Vol. 19 (1). P. 57–64. DOI: 10.1016/0028-3932(81)90044-0
Peterson R.L., Pennington B.F. Developmental dyslexia // Lancet. 2012. Vol. 379. P. 1997–2007. DOI: 10.1016/S0140-6736(12)60198-6
Peterson R.L., Pennington B.F. Developmental dyslexia // Annual Review of Clinical Psychology. 2015. Vol. 11. P. 283–307. DOI: 10.1146/annurev-clinpsy-032814-112842
Pirozzolo F.J., Rayner K. The neural control of eye movements in acquired and developmental reading disorders // Studies in Neurolinguistics. 1979. Vol. 4. P. 97–123. DOI: 10.1016/B978-0-12-746304-9.50009-4
Raatikainen P., Hautala J., Loberg O. et al. Detection of developmental dyslexia with machine learning using eye movement data // Array. 2021. Vol. 12. Article 100087. DOI: 10.1016/j.array.2021.100087
Rayner K. Eye movements and the perceptual span in beginning and skilled readers // Journal of Experimental Child Psychology. 1986. Vol. 41 (2). P. 211–236. DOI: 10.1016/0022-0965(86)90037-8
Rayner K. Eye movements in reading and information processing: 20 years of research // Psychological Bulletin. 1998. Vol. 124 (3). P. 372–422. DOI: 10.1037/0033-2909.124.3.372
Rayner K. Eye movements, perceptual span, and reading disability // Annals of Dyslexia. 1983. Vol. 33. P. 163–173. DOI: 10.1007/BF02648003
Rayner K. The role of eye movements in learning to read and reading disability // Remedial and Special Education. 1985. Vol. 6. P. 53–60. DOI: 10.1177/074193258500600609
Razuk M., Barela J.A., Peyre H. et al. Eye movements and postural control in dyslexic children performing different visual tasks // PLoS ONE. 2018. Vol. 13. Article e0198001. DOI: 10.1371/journal.pone.0198001
Rello L., Ballesteros M. Detecting readers with dyslexia using machine learning with eye tracking measures // Proceedings of the 12th International Web for All Conference. 2015. Article 16. DOI: 10.1145/2745555.2746644
Smyrnakis I., Andreadakis V., Selimis V. et al. RADAR: A novel fast-screening method for reading difficulties with special focus on dyslexia // Plos ONE. 2017. Vol. 12 (8). Article e0182597. DOI: 10.1371/journal.pone.0182597
Tiadi A., Gérard C.L., Peyre H. et al. Immaturity of visual fixations in dyslexic children // Frontiers in Human Neuroscience. 2016. Vol. 10. Article 58. DOI: 10.3389/fnhum.2016.00058
Tinker M.A. Recent studies of eye movements in reading // Psychological Bulletin. 1958. Vol. 55 (4). P. 215–231. DOI: 10.1037/h0041228
Tinker M.A. The study of eye movements in reading // Psychological Bulletin. 1946. Vol. 43 (2). P. 93–120. DOI: 10.1037/h0063378
Usman O.L., Muniyandi R.C., Omar K. et al. Advance machine learning methods for dyslexia biomarker detection: A review of implementation details and challenges // IEEE Access. 2021. Vol. 9. P. 36879–36897. DOI: 10.1109/ACCESS.2021.3062709
Vajs I., Kovic V., Papic T. et al. Dyslexia detection in children using eye tracking data based on VGG16 network // Proceedings of European Signal Processing Conference (EUSIPCO). 2022. P. 1601–1605. DOI: 10.23919/EUSIPCO55093.2022.9909817
Vajs I., Ković V., Papić T. et al. Spatiotemporal eye-tracking feature set for improved recognition of dyslexic reading patterns in children // Sensors. 2022. Vol. 22 (13). Article 4900. DOI: 10.3390/s22134900
Vajs I.A., Kvascev G.S., Papic T.M. et al. Eye-tracking image encoding: Autoencoders for the crossing of language boundaries in developmental dyslexia detection // IEEE Access. 2023. Vol. 11. P. 3024–3033. DOI: 10.1109/ACCESS.2023.3234438
Vajs I., Papić T., Ković V. et al. Accessible dyslexia detection with real-time reading feedback through robust interpretable eye-tracking features // Brain Sciences. 2023. Vol. 13(3). Article 405. DOI: 10.3390/brainsci13030405
Vellutino F.R., Fletcher J.M., Snowling M.J. et al. Specific reading disability (dyslexia): What have we learned in the past four decades? // Journal of Child Psychology and Psychiatry. 2004. Vol. 45 (1). P. 2–40. DOI: 10.1046/j.0021-9630.2003.00305.x
Ward L.M., Kapoula Z. Differential diagnosis of vergence and saccade disorders in dyslexia // Scientific Reports. 2020. Vol. 10. Article 22116. DOI: 10.1038/s41598-020-79089-1
Wu Y.J., Yang W.H., Wang Q.X. et al. Eye-movement patterns of Chinese children with developmental dyslexia during the Stroop test // Biomedical and Environmental Sciences. 2018. Vol. 31 (9). P. 677–685. DOI: 10.3967/bes2018.092

Информация об авторах

Грачева Мария Александровна, кандидат биологических наук, старший научный сотрудник лаборатории 11 «Зрительные системы», Институт проблем передачи информации им. А.А. Харкевича РАН (ИППИ РАН), младший научный сотрудник научно-учебной лаборатории моделирования зрительного восприятия и внимания, Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ), Москва, Российская Федерация, ORCID: https://orcid.org/0000-0003-0196-148X, e-mail: mg.iitp@gmail.com

Шалилех Соруш, кандидат технических наук, заведующий научно-учебной лабораторией моделирования зрительного восприятия и внимания, Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ), Москва, Российская Федерация, ORCID: https://orcid.org/0000-0001-6226-4990, e-mail: sr.shalileh@gmail.com

Метрики

Просмотров web

За все время: 851
В прошлом месяце: 52
В текущем месяце: 34

Скачиваний PDF

За все время: 486
В прошлом месяце: 38
В текущем месяце: 21

Всего

За все время: 1337
В прошлом месяце: 90
В текущем месяце: 55

PlumX

Метрики публикации