Sciact
  • EN
  • RU

Формирование признаков машинного обучения на основе топологического анализа данных Научная публикация

Журнал Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии
ISSN: 1995-5499
Вых. Данные Год: 2022, Номер: 3, Страницы: 115-126 Страниц : 12 DOI: 10.17308/sait/1995-5499/2022/3/115-126
Ключевые слова симплициальный комплекс, персистентные гомологии, персистентный ландшафт, машинное обучение, RKHS, гильбертово пространство
Авторы Чуканов С.Н. 1 , Чуканов И.С. 2
Организации
1 Институт математики им. Соболева С.Л. СО РАН, ул. Певцова, 13, 644043 Омск, Российская Федерация
2 Уральский федеральный университет им. первого президента России Б. Н. Ельцина, ул. Мира, 32, 620078 Екатеринбург, Российская Федерация

Информация о финансировании (2)

1 Российский научный фонд 22-21-00035
2 Омский филиал ФГБУН «Институт математики им. С.Л. Соболева СО РАН». 0314-2019-0020

Реферат: В настоящее время возрос интерес к использованию методов алгебраической топологии для топологического анализа данных и применению топологического анализа данных в различных областях знаний. Целью топологического анализа данных является определение информативных топологических свойств и использование их в качестве дескрипторов при машинном обучении. Применение методов машинного обучения для сложных систем большой размерности затруднено из-за методов адекватного представления функций. Метод персистентной гомологии из вычислительной топологии обеспечивает баланс между уменьшением размерности данных и характеристикой внутренней структуры объекта. Совмещению персистентной гомологии и машинного обучения препятствуют топологические представления данных, метрики расстояния и представление объектов данных. В работе используется метод персистентной гомологии, основанный применении фильтрации для присвоения каждому топологическому признаку геометрической размерности. Процесс фильтрации генерирует серии симплициальных комплексов, кодируемых со структурной информацией различных масштабов. Персистентная гомология может быть представлена персистентным баркодом или персистентной диаграммой. В работе рассматриваются математические модели и функции представления объектов персистентного ландшафта на основе метода персистентной гомологии. Рассмотрены персистентные функции Бетти и функции персистентного ландшафта. Функции персистентного ландшафта позволяют отображать персистентные диаграммы и персистентные баркоды в гильбертово пространство. Рассмотрены представления топологических характеристик в различных моделях машинного обучения. Рассмотрена структура ядра для анализа персистентных диаграмм и персистентное взвешенное ядро Гаусса. Метод персистентного взвешенного ядра позволяет контролировать персистентность при анализе данных. Расстояния между персистентными ландшафтами определяются с помощью нормы пространства Lp. Приведены примеры нахождения расстояния между изображениями. В приложениях приведены основные понятия алгебраической топологии и метод воспроизводящего ядра гильбертова пространства для целей машинного обучения.
Библиографическая ссылка: Чуканов С.Н. , Чуканов И.С.
Формирование признаков машинного обучения на основе топологического анализа данных
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2022. №3. С.115-126. DOI: 10.17308/sait/1995-5499/2022/3/115-126 РИНЦ OpenAlex
Даты:
Поступила в редакцию: 1 июн. 2022 г.
Принята к публикации: 1 окт. 2022 г.
Опубликована в печати: 2 нояб. 2022 г.
Опубликована online: 2 нояб. 2022 г.
Идентификаторы БД:
РИНЦ: 49612809
OpenAlex: W4313011669
Цитирование в БД:
БД Цитирований
OpenAlex 1
Альметрики: