На что обратить внимание при использовании любых текстовых анализаторов

То, что сравнивать себя нужно с сайтами своего типа, об этом я уже успел сказать.
Ни в коем случае не нужно сравнивать коммерческие сайты с Википедией. Это самый банальный пример. Или, например, коммерческий сайт, коммерческую страницу со страницей статьи на коммерческом сайте. Т.е. тоже сайт вроде бы коммерческий, тот же магазин, но вытаскивается статья из блога или из раздела статей, и нельзя сравнивать вхождение коммерческой страницы листинга, если мы у себя двигаем листинг, с информационной страницей на другом сайте-магазине. Это первый момент.

Второй момент. Если вы сравниваете и увидели, что в ТОПе все хорошо, все сайты вашего типа, но возникает вопрос: открываете какие-то данные и видите, что у некоторых сайтов по 5-6 товаров, а у некоторых – по 50. Что делать в этом случае? В этом случае – либо менять так, как у большинства в ТОПе, либо сравнивать себя с теми, кто в ТОПе, и кто максимально похож на вас.

Хорошо бы, помимо того, что я рассказал, еще и собирать возраст сайтов, доменов из ТОПа, чтобы знать, кто близок к вам. Возраст страниц, чтобы знать, кто близок к вам. Объем страниц и общую видимость сайта, чтобы понимать, что у сайта не один запрос в ТОПе, по какой-то случайности он
вышел. Но пока текстовые анализаторы этого не делают.