Sciact
  • EN
  • RU

Быстрый состоятельный сеточный алгоритм кластеризации Conference attendances

Language Русский
Participant type Секционный
Conference IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН.
06-11 Aug 2024 , Санкт-Петербург
Authors Тарасенко А.С. 1,2 , Бериков В.Б. 1,2 , Пестунов И.А. 3 , Рузанкин П.С. 1,2 , Рылов С.А. 3
Affiliations
1 Sobolev Institute of Mathematics
2 Novosibirsk State University
3 Federal Research Center for Information and Computational Technologies

Abstract: Предлагается быстрый и состоятельный сеточный алгоритм, который оценивает ко- личество кластеров для наблюдений в $R^d$ и строит их приближения. Временная сложность алгоритма может быть сведена к линейной без потери свойства состоятельности. Несмотря на то, что сеточные алгоритмы демонстрируют впечатляющую производительность, обеспечивая эффективную обработку больших наборов данных, их эвристическая природа часто оставляет место для неопределенности относительно достоверности их результатов. Теоретическая состоятельность, однако, обозначает способность алгоритма, при определенных условиях, давать корректные оценки как количества кластеров, так и их состава. Помимо теоретического доказательства состоятельности, мы проводим численные симуляции и тесты на реальных наборах данных, чтобы сравнить производительность нового алгоритма с устоявшимися сеточными методами.
Cite: Тарасенко А.С. , Бериков В.Б. , Пестунов И.А. , Рузанкин П.С. , Рылов С.А.
Быстрый состоятельный сеточный алгоритм кластеризации
IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН. 06-11 авг. 2024