Кластеризация по методу к-средних.
Центроиды генерируются случайным образом.
На 10000 точек и 100 кластерах сходится примерно за 15 сек.
Что можно улучшить:
- изменить алгоритм так, чтобы в кластерах было примерно равное число точек;
- учесть границы районов;
- выбирать центроиды из входных точек, а не генерить рандомные;
- проверить алгоритм на реальных данных.