Быстрый состоятельный сеточный алгоритм кластеризации Conference attendances
Language | Русский | ||||||
---|---|---|---|---|---|---|---|
Participant type | Секционный | ||||||
Conference |
IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН. 06-11 Aug 2024 , Санкт-Петербург |
||||||
Authors |
|
||||||
Affiliations |
|
Abstract:
Предлагается быстрый и состоятельный сеточный алгоритм, который оценивает ко- личество кластеров для наблюдений в $R^d$ и строит их приближения. Временная сложность алгоритма может быть сведена к линейной без потери свойства состоятельности. Несмотря на то, что сеточные алгоритмы демонстрируют впечатляющую производительность, обеспечивая эффективную обработку больших наборов данных, их эвристическая природа часто оставляет место для неопределенности относительно достоверности их результатов. Теоретическая состоятельность, однако, обозначает способность алгоритма, при определенных условиях, давать корректные оценки как количества кластеров, так и их состава. Помимо теоретического доказательства состоятельности, мы проводим численные симуляции и тесты на реальных наборах данных, чтобы сравнить производительность нового алгоритма с устоявшимися сеточными методами.
Cite:
Тарасенко А.С.
, Бериков В.Б.
, Пестунов И.А.
, Рузанкин П.С.
, Рылов С.А.
Быстрый состоятельный сеточный алгоритм кластеризации
IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН. 06-11 авг. 2024
Быстрый состоятельный сеточный алгоритм кластеризации
IV Конференция математических центров России, посвященная 300-летию СПбГУ и РАН. 06-11 авг. 2024