Sciact
  • EN
  • RU

Быстрый состоятельный сеточный алгоритм кластеризации Доклады на конференциях

Язык Русский
Тип доклада Секционный
Конференция IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН.
06-11 авг. 2024 , Санкт-Петербург
Авторы Тарасенко А.С. 1,2 , Бериков В.Б. 1,2 , Пестунов И.А. 3 , Рузанкин П.С. 1,2 , Рылов С.А. 3
Организации
1 Институт математики им. С.Л. Соболева СО РАН
2 Новосибирский государственный университет
3 ФИЦ информационных и вычислительных технологий

Реферат: Предлагается быстрый и состоятельный сеточный алгоритм, который оценивает ко- личество кластеров для наблюдений в $R^d$ и строит их приближения. Временная сложность алгоритма может быть сведена к линейной без потери свойства состоятельности. Несмотря на то, что сеточные алгоритмы демонстрируют впечатляющую производительность, обеспечивая эффективную обработку больших наборов данных, их эвристическая природа часто оставляет место для неопределенности относительно достоверности их результатов. Теоретическая состоятельность, однако, обозначает способность алгоритма, при определенных условиях, давать корректные оценки как количества кластеров, так и их состава. Помимо теоретического доказательства состоятельности, мы проводим численные симуляции и тесты на реальных наборах данных, чтобы сравнить производительность нового алгоритма с устоявшимися сеточными методами.
Библиографическая ссылка: Тарасенко А.С. , Бериков В.Б. , Пестунов И.А. , Рузанкин П.С. , Рылов С.А.
Быстрый состоятельный сеточный алгоритм кластеризации
IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН. 06-11 авг. 2024