Главная | Новости | Продукция/Цены | Публикации | About | Контакты


Применение ICA декомпозиции для картирования регистрируемых данных от источников с гладким пространственным распределением.

Кисельгов Е.Н.

В статье рассмотрен способ применения технологии ICA декомпозиции к одной из задач визуализации регистрируемых данных - картированию. Данный подход позволяет минимизировать ошибку интерполяции данных в межсенсорных областях в задаче картирования сложнораспределенного сигнала, сведя её к задаче картирования "источников" с гладким пространственным распределением и последующему построению карты суммарной мощности. Таким образом, становится возможным значительно повысить качество картирования регистрируемых данных. Данный способ рассмотрен на примере картирования электроэнцефалографических сигналов.

У статі запропонован метод застосування ICA декомпозиції записаного сигналу до однієї з задач візуалізації сигналу - картирування. Цей підхід дозволяє зменшити похибку інтерполяції даних у межсенсорних областях у задачі картирування сигналу з негладким розподіленням, зводячи її до задач картирування "джерел" з гладким розподіленням та побудови карти сумарної потужності. Завдяки чому, стає можливим значне підвищення якості картирування даних. Даний метод розглянт у статті на прикладі картирування електроенцефалографічних даних.

This article shows the ICA decomposition technology application to one of the data visualization methods - the mapping. This technology allows minimize the data interpolation error with data complex spatial distribution. It leads the problem to mapping of the sources with smooth distribution and to the summary power map generation task. Thanks to this fact, it's possible to increase the data mapping quality. This technology is showed on the EEG data mapping example.


1. Введение

В некоторых случаях, при большом объеме регистрируемых данных, определяющих распределение информационного сигнала в заданной пространственной области, бывает затруднительным представить полную картину распределения сигнала без дополнительных методов визуализации. Одним из таких методов, активно применяющийся в компьютерных комплексах обработки информации, является картирование, т.е. способ пространственно-амплитудного представления. К сожалению, во многих случаях, данный способ визуализации бывает трудно реализуемым и требует большого объема исходных данных для получения требуемого качества картирования, либо требует введения дополнительных моделей, упрощающих задачу, но снижающих качество отображения данных. В данной статье предложен способ, позволяющий получить достаточно высокое качество картирования при неизменном объеме входных данных. Этот способ основан на применении свойств разложения сигнала методом Independent component analysis (ICA), предложенным А.Д. Беллом и Т.Д. Сейновским в 1995 г., как метод решения задачи "слепого" разделения сигнала [1].

2. Интерполяционное картирование регистрируемого сигнала

Задача картирования представляет собой метод трехмерного представления сигнала в ортогональной пространственно-амплитудной системе координат. Во многих случаях, для облегчения восприятия, амплитудная координата заменяется цветовой шкалой, и т.о. 3-х мерная картина преобразуется в многоцветную двумерную карту. Пространственно распределенные данные или регистрируемый сигнал, используемый в качестве исходных данных для построения карты, задаются как наборы данных регистрируемых сенсорами. Задача картирования представить не только эти данные, но также и данные в межсенсорных областях, т.е. интерполировать значения исходных данных, учитывая пространственное расположение сенсоров. Использовать простейшие методы интерполяции (векторизация или полиномы низших порядков) возможно только в крайне редких случаях и только лишь для отображения распределения мощности процессов. Попытки отображения распределения, например, потенциалов требуют использовать более сложные методы интерполяции данных, однако и в этом случае результат, как правило, оказывается неадекватный имеющемуся исходному распределению. Не приводят к повышению точности отображения данных в межсенсорных областях и попытки использования априорной информации, связанной со знанием модели источников сигналов и среды распространения. Большинство интерполяционных методов имеют разную погрешность на всем заданном пространстве координат, некоторые из них хорошо интерполируют данные в области узлов, другие на краях заданного набора исходных данных. Некоторые методы требуют равномерно заданную сетку узлов, другие могут работать и с произвольно заданной сеткой, но требуют гладкость распределения функции или какой-либо из ее производных в пространстве координат, например, интерполяционный сплайн. В реальных задачах данные, регистрируемые сенсорами, имеют негладкое пространственное распределение, сенсоры расположены не виде равномерной сетки и т.д. Выполнить все требования очень тяжело - приходится идти на компромисс и использовать эти методы ценой увеличения погрешности интерполяции, в результате на изображении карты появляются артефакты не свойственные исходным данным (см. рис. 2) и мешающие дальнейшей обработке сигнала. Однако, во многих задачах регистрируемые данные являются смесью сигналов, генерируемых множеством отдельных "источников". Эти сигналы, смешиваясь неизвестным нам образом, образуют тот набор данных, который регистрируется сенсорами - т.н. вектор наблюдения X. В противовес наблюдаемому распределению исходных данных, в большинстве случаях, отдельные источники имеют четкую пространственную локализацию и достаточно гладкое пространственное распределение. Под гладкостью распределения сигнала источника в пространстве понимается непрерывность первой производной закона распределения сигнала источника. Соответственно законы распределения сигналов отдельных источников в межсенсорных областях могут определяться сплайн интерполяцией с достаточно высокой точностью. Остается вопрос о нахождении сигналов отдельных источников и матрицы их смешивания.

3. Использование свойств ICA декомпозиции исходного сигнала в картировании

Итак, метод Independent Component Analysis (ICA) решает задачу представления вектора наблюдения X в виде некоторого вектора источников S и соответствующей матрицы преобразования A, таким образом, чтобы:
X = AЧS (1)
Т.е. используются предположения, что вектор X образован линейным смешиванием источников S с неизвестными весовыми коэффициентами A и кроме того, что источники si обладают свойством статистической независимости, т.е.:
(2)
где p(S) – многомерная плотность распределения вектора источников S, а p(si) – маргинальная плотность распределения источника si. Представление вектора X через вектор S методом ICA подразумевает нахождение некой матрицы W инвертирующей процесс смешивания, т.е. являющейся обратной к матрице А [2].
W = A-1 (3)
WЧX=S (4)
В результате такой декомпозиции матрицы X, получаем матрицу источников S и матрицу разложения (декомпозиции) W, из которой по соотношению (3) можно получить матрицу композиции A. Допустим, что число сенсоров N, а число отчетов наблюдаемого многомерного процесса X - M, тогда матрица A имеет размер NxN, матрицы S и X – MxN. Матрицу источников S можно представить: S = ( S1 + S2 + … + SN ),   (5)
где - вектор i-го источника. Произведение матрицы композиции A на вектор источника Si примет вид:Матрица Ai – матрица весовых коэффициентов источника Si, т.е. закон распределения сигнала i-го источника в пространстве, регистрируемый N сенсорами. С учетом вышесказанного выражение (1) примет вид:
AЧS = A1ЧS1 + A2ЧS2 + … + ANЧSN= X1 + X2 + … + XN (6)
где Xi – матрица исходных данных, регистрируемых сенсорами от i-го источника. Как отмечалось выше, все источники, как правило, имеют гладкое пространственное распределение, т.е. каждая матрица Ai, выражающая закон распределения в пространстве сигнала от i-го источника, может с достаточно высокой точностью интерполироваться кубическим сплайном. Если проводить картирование исходных данных для какого-либо j наблюдения (всего их M), тогда каждая матрица Si вырождается в константу sij, представляющую то состояние, в котором находился источник i в момент времени, когда проводилось наблюдение j. Следовательно, каждая матрица Xi в выражении (6) будет представлена как: Xi = AiЧsij, и, следовательно, также как и матрица Ai может интерполироваться кубическим сплайном. Таким образом, для построения интерполяционной карты от исходных данных для j-го наблюдения достаточно построить карты для каждой матрицы Xi в момент времени j и затем, т.к. источники складываются по аддитивному закону, сложить все полученные карты. Т.е. если представить процесс построения интерполяционной карты как оператор M, то:
M (Xj) =  M(X1j) + M (X2j) + ... + M (XN) (7)
Итак, представим теперь весь процесс в виде некоторого алгоритма:

  1. Проведение ICA декомпозиции, с целью определения сигналов «источников» S и закона их смешивания A;
  2. Построение матриц Xi для каждого наблюдения в соответствии с выражением Xi  = AЧSi = AiЧSi;
  3. Построение карт от каждого вектора наблюдения Xi как M(Xi);
  4. Определение суммарной карты M(X) по выражению (7).
Следует также отметить, что данный алгоритм применим только в кругу задач, удовлетворяющих условиям, описанным в начале статьи и условиям возможности проведения ICA декомпозиции исходного сигнала:
  1. Число источников меньше или равно числу сенсоров N;
  2. Источники Si взаимнонезависимы (выполняется выражение (2));
  3. Максимум один источник имеет нормальное (Гауссовское) распределение;
  4. Сенсорные шумы отсутствуют или присутствует небольшой аддитивный шум;
  5. Источники S имеют гладкое пространственное распределение

4. Пример практического применения картирования, основанного на свойствах ICA декомпозиции

Выше изложенный метод реализован в аппаратно-программном комплексе “NeuroCom”, который разработан в НТЦ РЭМПТ ХАИ, содержащий модуль ICA обработки и модуль картирования, способный проводить построение карт как классическим способом, так и с использованием свойств ICA декомпозиции. Данный комплекс разработан для обработки электроэнцефалографических данных (ЭЭГ). ЭЭГ данные регистрируются как биопотенциалы головного мозга электродами, исполняющими роль сенсоров (датчиков), расставленными на поверхности скальпа в виде неравномерной узловой сетки. Результирующее распределение потенциала на поверхности скальпа, в общем, случае не имеет гладкого пространственного распределения. С этой точки зрения ЭЭГ потенциалы не являются наилучшими данными для картирования, и достаточно высокое качество картирования до сих пор достигалось только лишь за счет увеличения числа сенсоров. В некоторых источниках приводятся данные о применении 256 сенсоров и более. С другой стороны, благодаря дипольной модели, и возможности использования технологии ICA разложения [2] [3] – достаточно высокое качество картирования может быть получено и при малом числе сенсоров. Для демонстрации метода картирования был выбран участок ЭЭГ записи длительностью 6 с. и частотой дискретизации 250 Гц (рис. 1). Данная ЭЭГ запись проводилась с фотостимуляцией (затемненные участки сигнала), как правило, сигналы в такой записи имеют сложную форму (комбинация фонового сигнала с откликами вызванных потенциалов (ВП) и чередующимися всплесками активности в спектральной области от 8 до 13 Гц) и сложны в картировании. Для верификации результата в ЭЭГ, согласно дипольной модели, был добавлен дополнительный источник малой амплитуды, что позволило заранее определить закон распределения потенциала на скальпе. На рисунке 2 видно, что классический алгоритм картирования результирующей ЭЭГ, несмотря на применяемый в программе метод сферической интерполяции, дал амплитудный провал потенциального поля в межэлектродной зоне Cz-Pz-P3 (обведенная область). На рисунке 4 представлена аналогичная карта, но построенная в соответствии с изложенным выше методом. Как видно, данная карта повторяет карту на рис 2., но не имеет эффекта межэлектродного артефакта в зоне Cz-Pz-P3.

Исходный ЭЭГ сигнал и результат построения карт от ICA источников
Рисунок 1. Исходный ЭЭГ сигнал (вектор X) Рисунок 3. Результат построения карт от источников, найденных при ICA декомпозиции.

Краты построенные классическим и описанным выше методами
Рисунок 2. Классическое картирование результирующей ЭЭГ. Артефакт построения карты в межэлектродной зоне Cz-Pz-P3 Рисунок 4. Суммарная карта источников ICA декомпозиции по ЭЭГ данным, представленным на рис 1. Карта более точно отражает пространственное распределение потенциалов головного мозга и не имеет артефакта межэлектродной зоне Cz-Pz-P3.

5. Заключение

Как мы смогли убедиться, предлагаемый метод картирования способен значительно улучшить качество визуализации исходных данных, сохранив неизменное (малое) количество используемых сенсоров, и не прибегать к чрезмерно сложным алгоритмам интерполяции, все равно не позволяющим воссоздать картину реального распределения наблюдаемого информационного параметра. Естественно, прежде чем применять данный метод, необходимо убедиться в возможности использования технологии ICA разложения для данной конкретной задачи, а также в том, что пространственное распределение сигналов источников действительно имеет гладкий закон распределения. Однако, класс исходных задач, для которых возможно применение технология ICA может быть значительно расширен подбором соответствующей модификации алгоритма ICA. Остается добавить, что в системе “NeuroCom” используется метод eICA (Extended ICA), как наиболее приемлемый к задачам обработки ЭЭГ данных.

6. Литература

  1. Te-Won Lee, M. Girolami, A.J. Bell and T.J. Sejnowski, “A Unifying Information-Theoretic Framework for Independent Component Analysis”, Computers & mathematics with application 39, 1-21p. (2000).
  2. Е.Н. Кисельгов «Независимый компонентный анализ и его применение к задачам выделения статистически независимых сигналов» Технология приборостроения 1-2, стр. 142-147. Харьков. 2001.
  3. D. Gharhremanit, S. Makeigo, T.-P. Hung A.J. Bell, T.J. Sejnowski “Independent Component Analysis of Simulated EEG Using Three-Shell Spherical Head Model”. Institute of Neural Computation. Technical Report No. INC-9601

Кисельгов Е.Н.
E-mail: medic@xai.kharkov.ua