Депрессия – распространенное, но часто неправильно понимаемое состояние. По большинству оценок, от него страдают более 5% населения земного шара. Депрессия характеризуется стойким чувством печали, потерей интереса и изменениями настроения и поведения; его влияние носит личный характер, но оно распространяется на семьи и даже на общество в целом. Часто депрессию неправильно понимают и не диагностируют, поэтому ранняя диагностика депрессии так важна.
Имея это в виду, исследователи из Дартмута разработали первое приложение для смартфонов, которое объединяет искусственный интеллект и программное обеспечение для обработки изображений лица для надежного обнаружения начала депрессии. По предварительным результатам, это может сработать еще до того, как пользователь поймет, что что-то не так.
Депрессия – это больше, чем просто чувство грусти. Это серьезное заболевание, обычно характеризующееся мрачными эмоциями и множеством как эмоциональных, так и физических проблем. Клиническая депрессия может длиться месяцами или даже бесконечно, значительно ухудшая способность человека функционировать и наслаждаться жизнью.
Исследователи из Дартмута предположили, что некоторые признаки этого могут быть в выражениях лиц людей. Учитывая недавнее появление программного обеспечения для обработки лиц и искусственного интеллекта (ИИ), это казалось хорошей ставкой.
Поэтому они приступили к исследованию с участием 177 человек с диагнозом «большое депрессивное расстройство».
Признаки депрессии
Приложение под названием MoodCapture основано на предыдущих исследованиях, начатых в 2015 году. Оно использует переднюю камеру телефона, чтобы фотографировать выражения лиц людей. Это происходит, когда люди регулярно пользуются своим телефоном, специального использования не требуется. Фактически, участники даже не знали, когда приложение фотографировало (на что они дали согласие).
«Наш переход к проекту MoodCapture был вдохновлен первоначальными открытиями, полученными в результате изучения использования повседневных взаимодействий со смартфоном для оценки психического здоровья», — рассказал ZME Science соавтор исследования Субигья Непал.
Сначала исследователи наблюдали искренние эмоции, передаваемые смартфонами во время рутинных разблокировок. Это породило идею проанализировать эти выражения для оценки состояния психического здоровья. Пока MoodCapture не анализирует изображения непосредственно на устройстве, но может передавать их для внешнего анализа.
В целом приложение сделало 125 000 изображений участников за 90 дней. После обучения приложение правильно определяло симптомы депрессии с точностью 75%.
«Это первый случай, когда естественные образы «в дикой природе» используются для прогнозирования депрессии», — сказал Эндрю Кэмпбелл, автор-корреспондент статьи и профессор компьютерных наук Альберта Брэдли из Дартмута в 1915 году. «Существует движение за цифровые технологии психического здоровья, которые в конечном итоге позволят создать инструмент, который сможет прогнозировать настроение у людей с диагнозом большая депрессия надежным и ненавязчивым способом».
Приложение анализирует такие вещи, как взгляд, движение глаз и положение головы, чтобы выявить признаки депрессии.
«Мы определяем признаки депрессии следующим образом. Сначала мы извлекаем черты, которые количественно определяют конкретные черты лица. Например, некоторые ориентиры указывают координаты краев губы пользователя. Затем мы используем эти функции для обучения модели машинного обучения (случайный лес) прогнозированию депрессии. Наконец, мы заметили, что черты лица на правой стороне лица более характерны для депрессивных симптомов. Эта асимметрия связана с тем, как пользователь держит телефон и взаимодействует с ним», — добавил Непал в электронном письме.
Но для заключения он использует не только анализ лица. Он коррелирует сигналы анализа лица с самоотчетами о чувстве депрессии или подавленности, а также с факторами окружающей среды на фотографиях (такими как цвет, освещение и количество людей на изображении).
Доктор у тебя в кармане
Это исследование является частью растущего движения в медицинской науке, фокусирующегося на смартфонах или других устройствах, с которыми мы ежедневно взаимодействуем, для ранней диагностики. Несмотря на то, что это не устройство медицинского назначения, у смартфона есть другое преимущество: мы часто им пользуемся.
«Люди используют программное обеспечение для распознавания лиц, чтобы разблокировать свои телефоны сотни раз в день», — сказал Кэмпбелл, чей телефон недавно показал, что он делал это более 800 раз за неделю.
«MoodCapture использует аналогичный технологический конвейер технологии распознавания лиц с аппаратным обеспечением глубокого обучения и искусственного интеллекта, поэтому существует огромный потенциал для масштабирования этой технологии без каких-либо дополнительных затрат или нагрузки на пользователя», — сказал он. «Человек просто разблокирует свой телефон, а MoodCapture знает динамику его депрессии и может предложить ему обратиться за помощью».
Николас Джейкобсон, соавтор исследования также из Дартмута, говорит, что это дает еще одно преимущество, особенно для диагностики депрессии. Симптомы депрессии приходят и уходят, и врачи могут упустить лучшее время для постановки диагноза. А наши смартфоны всегда с нами.
«Многие из наших терапевтических вмешательств при депрессии сосредоточены на более длительных периодах времени, но эти люди испытывают приливы и отливы в своем состоянии. Традиционные оценки упускают большую часть того, что такое депрессия», — сказал Джейкобсон, руководитель лаборатории искусственного интеллекта и психического здоровья: инновации в сфере здравоохранения, управляемой технологиями (AIM HIGH).
«Наша цель — зафиксировать изменения в симптомах, которые люди с депрессией испытывают в своей повседневной жизни», — сказал Джейкобсон. «Если мы сможем использовать это, чтобы предсказать и понять быстрые изменения симптомов депрессии, мы в конечном итоге сможем предотвратить их и лечить. Чем больше мы можем быть в данный момент, тем менее глубоким будет воздействие депрессии».
Еще несколько лет до клинической практики
Новое исследование служит доказательством концепции и демонстрирует замечательные перспективы. Уровень ошибочного диагноза депрессии огромен: по данным некоторых исследований, он достигает 66%. Даже несовершенное приложение может стать настоящей находкой для ранней диагностики депрессии. Кроме того, приложение можно настроить с использованием личных данных пользователей, чтобы еще больше повысить производительность.
«На данный момент MoodCapture — это общая модель, которая не адаптируется под конкретного пользователя. Однако мы работаем над последующим исследованием, которое персонализирует MoodCapture для конкретного пользователя. Наши предварительные результаты предполагают улучшение производительности примерно на 15% по сравнению с текущими показателями и потенциал для повышения справедливости и конфиденциальности, что решает многие проблемы наших участников. Дополнительная информация об этом скоро появится», — говорит Непал.
По оценкам исследователей, прежде чем технология появится на рынке, может пройти до 5 лет.
Однако Непал заявляет, что уже есть хороший прогресс. Наука существует — речь идет лишь о том, чтобы максимально эффективно использовать данные.
«Вам не придется начинать с нуля — мы знаем, что общая модель имеет точность на 75 %, поэтому для точной настройки модели можно использовать данные конкретного человека. Устройства в ближайшие несколько лет должны легко справиться с этим», — заявил Непал. «Мы знаем, что выражение лица указывает на эмоциональное состояние. Наше исследование является подтверждением концепции, согласно которой, когда дело доходит до использования технологий для оценки психического здоровья, они являются одним из самых важных сигналов, которые мы можем получить».
На данный момент исследователи работают над улучшением MoodCapture тремя способами: персонализация, справедливость и конфиденциальность.
«В наших следующих шагах мы расширим модели MoodCapture, включив в них персонализированные модели смс, аналогичные распознаванию лиц на смартфонах. Наши предварительные результаты предполагают улучшение примерно на 15% по сравнению с текущими показателями. Использование персонализированных моделей позволяет нам сосредоточиться на индивидуальной справедливости, т. е. мы стремимся разрабатывать модели, которые имеют минимальные различия в производительности среди наших пользователей. Чтобы улучшить конфиденциальность, мы будем изучать интегрированное обучение, при котором изображения лиц пользователей не покидают свои мобильные устройства», — заключает Непал.
Команда опубликовала свою статью о базе данных препринтов arXiv перед ее представлением на конференции CHI 2024 Ассоциации вычислительной техники в мае.
Спасибо за ваш отзыв!