Опыт изучения нейросетевого моделирования в программе ДПП на примере детекции R-пиков кардиограммы

4

Аннотация

В России в настоящее время реализуется национальная программа «Цифровая экономика Российской Федерации», которая направлена на развитие цифровых технологий и инфраструктуры. В рамках этой программы проводится подготовка специалистов для ИТ-сферы и смежных отраслей, владеющих цифровыми компетенциями. Важность цифровых компетенций для современного специалиста заключается в повышении его эффективности и производительности труда, умении адаптироваться к изменяющимся условиям, способности находить новые способы решения задач. Московский государственный психолого-педагогический университет (ФГБОУ ВО МГППУ) предлагает студентам программу ДПП «Средства программной разработки для решения задач в психологии и образовании», включающую освоение программирования на языке Python и решение с его помощью прикладных задач анализа данных психологических исследований, в том числе с использованием машинного обучения и нейросетей. В статье приводится описание одного из кейс-заданий, выполненного студентами ДПП и включающего обработку сигнала электрокардиограммы с целью детекции в нем R-пиков. Выполнение задания включает самостоятельный сбор данных ЭКГ с помощью комплекса BiTronics LAB и построение модели анализа данных с помощью Python. Приведено описание используемой нейросетевой модели на основе рекуррентных слоев LSTM, показана надежная работа этой модели при обработке сигналов ЭКГ.

Общая информация

Ключевые слова: нейронные сети , LSTM, анализ данных, физиология, электрокардиограмма, BiTronics

Рубрика издания: Интеллектуальные технологии в гуманитарной сфере и образовании

Тип материала: материалы конференции

Для цитаты: Алексейчук А.С. Опыт изучения нейросетевого моделирования в программе ДПП на примере детекции R-пиков кардиограммы // Цифровая гуманитаристика и технологии в образовании (DHTE 2024): сб. статей V международной научно-практической конференции. 14—15 ноября 2024 г. / Под ред. В.В. Рубцова, М.Г. Сороковой, Н.П. Радчиковой М.: Издательство ФГБОУ ВО МГППУ, 2024. С. 340–350.

Полный текст

Введение

Цифровые компетенции стали одной из ключевых составляющих успеха современного специалиста, поскольку технологии играют все более значимую роль во всех сферах экономики и жизни общества. Эти компетенции включают не только базовое владение компьютером, но и умение эффективно работать с информационными системами, понимать и применять новые технологии, в том числе программирование и интеллектуальный анализ данных, чтобы быть конкурентоспособными на рынке труда [5, 6].

Студенты психологических специальностей ФГБОУ ВО «Московский государственный психолого-педагогический университет» (далее – МГППУ) знакомятся с основами программирования и применением технологий машинного обучения и нейросетевых моделей в рамках программы дополнительного профессионального образования – программы профессиональной переподготовки «Средства программной разработки для решения задач в психологии и образовании» (далее – ДПП).

В курсе происходит знакомство с основами программирования, обработкой табличных данных, построением моделей машинного обучения и нейронных сетей. Дисциплина «Практикум по программированию», входящая в программу курса, включает построение моделей обработки электрофизиологических данных (например, полученных с помощью датчиков регистрации ЭЭГ, ЭКГ, миографии, кожно-гальванической реакции и др.), самостоятельный сбор этих данных с помощью учебной аппаратуры и решение кейс-заданий с применением средств программирования в командах по 2-5 человек. Сбор экспериментальных данных производится в Технопарке универсальных психолого-педагогических компетенций МГППУ «Кванториум», созданном в 2021 г. и оборудованном для проведения экспериментов по химии, физиологии, физике, робототехнике [4].

Для снятия экспериментальных данных по электрофизиологии используется цифровая лаборатория «BiTronics LAB». Она представляет собой лабораторный комплекс для изучения нейротехнологий в рамках учебной проектно-исследовательской деятельности [2]. BiTronics LAB включает в себя набор датчиков для исследования электрофизиологических показателей тела человека: электрическая активность мозга (ЭЭГ), электрическая активность мышц (электромиография), кожно-гальваническая реакция, электрокардиограмма (ЭКГ), данные датчиков пульса, дыхания, артериального давления.

Анализ данных, записанных с помощью BiTronics LAB, может включать очистку и предобработку данных, визуализацию данных в виде графиков и спектрограмм, сравнительный анализ данных, собранных разными датчиками в разных состояниях испытуемого. Для более подготовленных студентов предлагается реализовать модели машинного обучения. Примеры таких задач включают детектор R-пиков на ЭКГ при помощи рекуррентных нейросетей, построение модели классификации ЭЭГ по типу прослушиваемой музыки (приятная/неприятная), распознавание вида прослушиваемого музыкального аккорда по ЭЭГ, определение интенсивности нагрузки по ЧСС и частоте дыхания.

Приведем подробное описание учебного группового проекта, выполненного студентами ДПП и включающего построение нейронной сети глубокого обучения, позволяющей обнаруживать R-зубцы на электрокардиограмме.

Методы

Первая часть проекта – экспериментальная, она включает посещение группой студентов Технопарка «Кванториум» МГППУ, где им выдается аппаратура «BiTronics LAB» для снятия ЭКГ. Датчики подключаются к центральному модулю аппаратного комплекса, который в свою очередь подключается к компьютеру и передает данные для дальнейшей обработки. Сигнал ЭКГ снимается с запястий двух рук, и центральный модуль вычисляет разность потенциалов между двумя датчиками.

Таким образом, исследуемый сигнал представляет собой одномерный временной ряд из последовательных измерений напряжения, где частота дискретизации составляет 250 Гц. При длительности записи около 2 минут итоговый сигнал включает в себя около 30000 отсчетов. Записанные данные могут быть экспортированы в файлы в формате CSV для дальнейшей программной обработки.

Вторая часть проекта – исследовательская, она выполняется группой самостоятельно с помощью средств программирования. Эта часть включает в себя предобработку и визуализацию записанного сигнала, построение нейросетевой модели глубокого обучения и анализ полученных результатов. Для обработки данных используется язык программирования Python, имеющий большую экосистему библиотек анализа данных и достаточно простой синтаксис. В качестве среды разработки используется облачная среда Google Colaboratory [7], а для построения нейронных сетей используется широко распространенная Python-библиотека TensorFlow.

Для обработки временного ряда ЭКГ и обнаружения на ней R-пиков разработано множество алгоритмов [3]. Одним из способов решения этой задачи является применение нейронных сетей, обрабатывающих последовательную информацию, например, нейросетей рекуррентной архитектуры LSTM [8]. С их помощью можно анализировать комплексы PQRST кардиограммы и, в частности, определять, есть ли R-пик в конце заданного фрагмента ЭКГ. Детектирование пиков можно рассматривать как задачу бинарной классификации, где класс 1 соответствует наличию R-пика в конце фрагмента, 0 – его отсутствию.

Обучающая выборка формируется путем нарезки дискретизированного сигнала ЭКГ на частично пересекающиеся фрагменты фиксированной длины небольшой длины, не превосходящей минимального интервала между соседними пиками. Для разметки выборки можно произвести пороговую детекцию пиков с помощью функции find_peaks() библиотеки scipy.signal. Для лучшей балансировки выборки и большей устойчивости процесса обучения следует отметить как сам пиковый отсчет, так и несколько идущих вслед за ним отсчетов (см. рис. 1).

 

Рис. 1. Разметка фрагмента обучающей выборки

Для построения нейросетевого детектора была использована трехслойная архитектура LSTM, схема которой приведена на рис. 2.

 

Рис. 2. Архитектура нейронной сети детектора R-пиков ЭКГ

Описываемая нейронная сеть включает в себя три последовательных слоя LSTM с внутренним циклом. Каждый из них обрабатывает последовательную информацию, сохраняя свое внутреннее состояние и долговременную память и передавая последовательность выходных векторов на вход следующего слоя. Входной информацией служит последовательность фрагментов ЭКГ заданной длины. На выходе сети находятся два полносвязных слоя, осуществляющих итоговую классификацию на два класса, соответствующие наличию или отсутствию R-пика.

Результаты

На рис. 3 показаны графики обучения построенной нейросети. Слева показана динамика метрики точности, справа – график изменения функции потерь (бинарная кросс-энтропия). Обучение производилось в течение 20 эпох с использованием алгоритма оптимизации Adam. Точность при кросс-валидации достигает более 99%, что является высоким показателем даже с учетом несбалансированности выборки.

 

Рис. 3. Графики точности и функции потерь

Для независимой валидации модели проверяется ее работа на зарезервированной выборке, снятой с другого испытуемого и не участвовавшей в обучении. Валидационная выборка разбивается на фрагменты, аналогично обучающей выборке, и для каждого фрагмента с помощью обученной модели строится прогноз – есть пик в конце фрагмента или нет. Объединенный график работы модели в процессе валидации показан на рис. 4, где сплошная линия – сигнал кардиограммы, а пунктирная – работа детектора пиков. Восходящий фронт детектора соответствует моменту R-пика.

Как видно из графика, построенная модель надежно фиксирует каждый R-пик, несмотря на сильную зашумленность сигнала.

 

 

Рис. 4. Работа нейросетевого детектора на валидационной выборке

Нейросетевая модель детекции пиков значительно надежнее простого порогового детектора, поскольку она не полагается на абсолютное значение пикового напряжения, а учитывает только относительные изменения формы сигнала.

Полученную модель можно использовать также для подсчета частоты сердечных сокращений и анализа вариабельности сердечного ритма путем подсчета разности во времени между соседними пиками. В частности, на достаточно длинных выборках можно заметить, что вариабельность ритма изменяется синхронно с ритмом дыхания, поскольку пульс испытуемого ускоряется на вдохе и замедляется на выдохе.

Полученные в ходе исследования результаты оформляются группой студентов в виде файла для среды Colaboratory в формате .ipynb и отдельной презентации, включающей анализ и интерпретацию результатов. С этими материалами студенты выходят на демонстрационный экзамен, по результатам которого им выставляется итоговая оценка за практикум.

Обсуждение

Дисциплина «Практикум по программированию» в рамках ДПП помогает сформировать компетенции по применению средств программирования для решения прикладных задач психофизиологии и нейронаук, в том числе анализа электрофизиологических показателей, с использованием алгоритмов машинного обучения. Примеры подобных исследований могут включать анализ миограмм мышц гортани при произнесении фраз вслух и про себя, анализ ЭЭГ в разных состояниях (покой, умственная работа, прослушивание музыки, чтение, воздействие раздражителя и т.п.), исследование окулограмм (миограмм мышц глаз) при слежении за предметом и поворотах головы, анализ ЭКГ в разных состояниях (покой, глубокое дыхание, физическая нагрузка), анализ кожно-гальванической реакции при воздействии различных раздражителей. Студенты могут самостоятельно выбрать наиболее интересный для себя вариант исследования и объединяться в группы для совместной работы, причем формирование групп позволяет реализовывать индивидуальную траекторию обучения каждого студента ДПП [1].

Полученные студентами компетенции позволяют производить исследовательские работы и проекты, связанные с обработкой больших массивов данных, их анализом средствами программирования и машинного обучения. Например, приведенный выше пример проекта с детекцией R-пиков может служить основой для дальнейших исследований в области анализа ЭКГ, включая анализ многомерных данных с нескольких отведений, обнаружение аномалий и автоматическую выдачу рекомендаций для диагностики заболеваний. Кроме того, выполнение проектов в командах способствует развитию «soft skills» студентов, в частности, навыков работы в команде, оформления и публичной презентации результатов исследований.

Литература

  1. Алексейчук А. С. Математическое и программное обеспечение системы дистанционного обучения на базе веб-конференций: Автореф. дис. ... канд. физ.-мат. наук. М., 2017. 22 с.
  2. Возможности использования учебно-методического комплекса Bitronics Studio и профессиональных комплексов «Кардивар» и «Кардиовизор» для регистрации изменений показателей сердечно-сосудистой системы подростков при просмотре видеофрагментов различных жанров кино / В.А. Марахова, В.Е. Горшкова, М.Е. Шевченко, Н.И. Хорсева // Нейронаука для медицины и психологии: Материалы XIX Международного междисциплинарного конгресса, Судак, 30 мая – 10 июня 2023 года. Москва: ООО «МАКС Пресс», 2023. С. 194-195. DOI 10.29003/m3305.sudak.ns2023-19/194-195.
  3. Свидетельство о государственной регистрации программы для ЭВМ № 2021662114 Российская Федерация. Программа для поиска координат R-пиков комплекса PQRST электрокардиограммы: № 2021661071: заявл. 13.07.2021: опубл. 22.07.2021 / Т. Бергалиев, Ю.С. Ковалев, С.В. Сахно; заявитель Общество с ограниченной ответственностью «Битроникс».
  4. Семенова М.В., Ефимова Н.В., Шилкова Т.В. Междисциплинарное учебно-методическое сопровождение медико-биологических дисциплин с использованием ресурсов «Технопарка универсальных педагогических компетенций» // Перспективы науки и образования. 2024. № 1(67).  С. 258-284.  DOI 10.32744/pse.2024.1.14.
  5. Сорокова М.Г., Одинцова М.А., Радчикова Н.П. Оценка цифровых образовательных технологий преподавателями вузов // Психологическая наука и образование. 2023. Том 28. № 1. С. 25–39. DOI:10.17759/pse.2023280101.
  6. Сорокова М.Г., Одинцова М.А., Радчикова Н.П. Образовательные результаты студентов в электронных курсах при смешанном и онлайн-обучении // Моделирование и анализ данных. 2021. Т. 11, № 1. С. 61–77. DOI:10.17759/mda.2021110105.
  7. Google Colaboratory [Электронный ресурс] // URL: https://colab.research.google.com (дата обращения 11.09.2024 г.)
  8. Kłosowski G., Skowron S., Cieplak T. et al. The use of time-frequency moments as inputs of LSTM network for ECG signal classification // Electronics. 2020. Vol. 9, No. 9. P. 1-22. DOI 10.3390/electronics9091452.

Информация об авторах

Алексейчук Андрей Сергеевич, кандидат физико-математических наук, доцент кафедры «Математическая кибернетика», Московский авиационный институт (национальный исследовательский университет) (МАИ), доцент кафедры «Цифровое образование», Московский государственный психолого-педагогический университет (ФГБОУ ВО МГППУ), Москва, Россия, ORCID: https://orcid.org/0000-0003-4167-8347, e-mail: alexejchuk@gmail.com

Метрики

Просмотров

Всего: 14
В прошлом месяце: 11
В текущем месяце: 2

Скачиваний

Всего: 4
В прошлом месяце: 2
В текущем месяце: 2