Про кластеры запросов ВБ

Решил посмотреть кластеры запросов ВБ. Выяснить из-за чего сыр-бор.😊 Взял базу запросов из ЛК (1 млн. ключевых запросов) и скачал для анализа, какие у них кластеры. Вот что получилось:

На ~900 тыс. скачанных запросов (часть запросов - артикулы и запрещенные) - кластеров 566827 шт. В большинстве кластеров - 1 запрос. Кластеров, где больше одного запроса - 170395 шт.

Самые больше кластеры: “сигарета электронный” (187 запросов), “для_женщина для_зима куртка” (150 запросов), “вейп” (122 запроса).

В “вейп” и подобным им кластерам - основные запросы, составляющих его, это различные варианты названий брендов и близких запросов (“aegis hero 2”, “geekvape”, “картридж на бруско” и т.д.). Судя по всему таких кластеров не очень много. Пока не знаю, как ВБ программно определяет какие запросы туда включить, но было бы интересно😊 И из-за программных ошибок, некоторые запросы приклеиваются к неправильным кластерам.

Основная масса кластеров - подобны “для_женщина для_зима куртка”, они состоят из перестановок слов, опечаток и вариантов слов. Например: “куртка женская зимняя”, “куртка зимняя женская”, “зимняя куртка женская”, “женская куртка зимняя”, “куртки женские зима” и т.п.

ВБ они нужны, просто чтобы упросить поисковую выдачу, т.е. вместо 900 тыс различных поисковых выдач, ему нужно хранить в кэше 566 тыс. Я, для seo-анализа, давным-давно сделал тоже самое, только что бренды не склеивал. И у меня получилось ~600 тыс. кластеров. Поэтому когда у меня в разборах карточек написано “В карточке Х запросов”, это теперь у ВБ кластеры😃