Машинное обучение, потоковый Интернет вещей и подключенные медицинские устройства. Часть 3
Построение модели с кластеризацией
Кардиологи определили шаблон волны нормальной ЭКГ. Мы используем этот повторяющийся шаблон для обучения модели на предыдущей активности сердцебиение, чтобы потом сравнивать последующие наблюдения с этой моделью для оценки аномального поведения.
Чтобы построить модель типичной активности сердцебиение, обрабатываем ЭКГ (на основе конкретного пациента или группы многих пациентов), разбиваем ее на части, перекрываются, которые длятся примерно 1/3 секунды, а затем применяем алгоритм кластеризации для группировки подобных фигур. Кстати, если вам нужна замена тачскрина на Iphone 7, рекомендуем это сделать здесь по очень низкой цене.
Кластеризованные алгоритмы обнаруживают группы, встречаются в собранных данных. При кластеризации алгоритм классифицирует входа в категории, анализируя сходство между входными примерами. Алгоритм k-means объединяет наблюдения в k-кластеры, в которых каждое наблюдение относится к кластера с ближайшим средним из центра этого кластера.
В следующем коде Spark Apache мы:
• Разбираем данные ЭКГ в вектор.
• Создаем объект k-means и устанавливаем параметры, чтобы определить количество кластеров и максимальное количество итераций для определения кластеров.
• Обучаем модель на входных данных.
• Сохраняем модель для использования позже.
Результатом этого является каталог шаблонов, который может быть использован для реконструкции того, как должен выглядеть ЭКГ.