Как создать свой блог, вести его и зарабатывать в интернете. Советы практикующего блогера и SEO-специалиста
Раскрутка
Можно ли доверять данным сервиса xmlriver.com

Можно ли доверять данным сервиса xmlriver.com

В этой заметке будет не обзор сервиса, а именно попытка выяснить, можно ли доверять данным сервиса xmlriver.com, который поставляет данные о поисковой выдаче Google в формате, схожем с Яндекс.XML.

Автор статьи
Антон Шабан
Частный SEO-специалист (стаж 8 лет), занимаюсь своими проектами и специализируюсь на SEO-консалтинге: SEO-аудиты, консультации, обучение специалистов
Написано статей
10

Выводы и результаты

Решил разместить вывод в начале, а не в конце, чтобы сэкономить вам время.

На выборке в 150 запросов (1500 страниц в результатах выдачи) сервис показал в 81% случаев точное совпадение как страницы, так и позиции с «живой» выдаче в городе.
Без учета точного совпадения позиции страницы

  • совпадение топ10 на 100% наблюдается в 62% случаев (то есть если все 10 URL реальной выдачи совпадают с 10 URL сервиса — показатель будет 100%, если только 9 из 10 — 90%),
  • на 90% — в 31% случаев,
  • на 80% — в 7%,
  • менее 80% — в 0% случаев.
  • Средний процент совпадения ТОПа — 96%.

То есть в 96% случаев вы получите в ТОП10 те же 10 страниц сайтов, что в реальной выдаче. А точное соответствие и позиции и URL с реальной выдачей составляет 81%. В целом, такие результаты позволяют делать выводы, анализировать конкурентов, но при оценке реальных точных позиций сайта стоит учитывать имеющуюся погрешность и возможную разбежку.

Что вообще за сервис и зачем это делать

Сам сервис позволяет получать данные о поисковой выдаче Google в формате Яндекс.XML, то есть хорошо подходит для использования в программах или для собственных решений. На текущий момент интеграция с ним есть в программах:

  1. KeyAssort
  2. Key Collector (4 версия, которая сейчас на этапе альфа-тестирования)
  3. SERP Parser
  4. и пр.

Собственно я как активный пользователь программы Key Collector после начала тестирования 4-той версии обнаружил, что там есть возможность получать данные о поисковой выдаче Google с помощью сервиса, что означает отсутствие проблем с капчей, прокси.

Можно ли доверять данным XMLRiver?

Все хорошо: данные получаем, достаточно быстро и дешево, но тут возник вопрос: а можно ли доверять данным сервиса? Ведь если мы получаем некорректные данные, то все выводы о позициях, результаты группировки и пр. будут искажены. Безусловно, у Яндекс.XML тоже есть погрешность и результаты отличаются от «живой» выдачи, но вопрос — насколько.

Чтобы получить максимально достоверные данные о поисковой выдаче Google в нужном городе, нужно отправлять запросы с соответствующего IP и в режиме инкогито (чтобы история посещений не влияла на поисковую выдачу).

XMLRiver предлагает данные о поисковой выдаче любого города и региона, поэтому я усомнился, что данные действительно будут точны. Получил от техподдержки такой вот ответ:

Это означает следующее:

  1. Сервис не использует IP нужных городов (очевидно, это бы достаточно дорого стоило для такого набора локаций).
  2. Сервис использует какие-то параметры для формирования выдачи.

Скорее всего имеется в виду параметр UULE, про который писали ранее, например, на Серче. Это параметр, который используется для формирования выдачи нужного региона. Для формирования используется справочник геотаргетинга Google, и есть, кстати, удобный генератор этого параметра.

Однако, лучше всего проверить данные сервиса на тестовой выборке и сравнить выдачу с реального регионального IP с данным сервиса. Что мы и сделаем.

Эксперимент: сравниваем реальную выдачу с данными XMLRiver

Для эксперимента я взял из своей тестовой выборки 150 частотных коммерческих запросов, связанных с услугами или покупкой товаров (по по ним наиболее ярко выражена геозависимость и хорошо будут видны отличия в случае несовпадения региональной выдачи).

По этим запросам снял топ10 живой выдачы по городу Минск: у меня местный IP и проще сравнить с ним.

Параллельно с этим получил данные с помощью XMLRiver (данные собирались в одно и то же время).

Эти данные получил с помощью КейКоллектор 4. Крайне важно его правильно настроить, а именно в самих настройках программы указать только ссылку для получения данных по API (которая дается в аккаунте XMLRiver), можно также указать тип устройства.

А уже потом запускаем сбор данных из ПС Google:

И там указываем обязательно Локацию, Домен, параметры Страна и Язык (я дополнительно обсуждал корректный настройки с техподдержкой XMLRiver). Если настроить по-другому (например, не указав страну или язык), можно получить очень низкую точность.

Полученные данные сравнил между собой.

Меня интересовали следующие показатели:

  1. точные совпадения как URL страницы, так и позиции этой страницы . Всего таких совпадений 1215 из 1500, что составляет 81%. То есть в 81% случаев сервис отдал ту же самую позиций той же самой страницы, что я получил по реальной выдаче.
  2. Совпадения страниц ТОПа. Тут я решил проверть, будут ли в целом показываться те же самые URL в ТОП10, пусть даже без учета позиции, просто те же страницы. В 62% случаев это так и было, все 10 страниц совпадали. Еще в 31% случаев совпадали только 9 из 10 страниц (1 страница отличалась), а в 7% случаев было 2 страницы, которых у меня не было в реальной выдаче. Случаев, когда отличалось 3 страницы не было.
  3. В целом, средний процент совпадения всех URL в ТОПе составил 96%. То есть риски, что ваша страница есть в ТОП10, но XMLRiver этого не покажет все же есть, но вероятность небольшая.

Вот скриншот итоговых данных, которые я получил.

В общем, пользоваться сервисом можно, понимая возможную погрешность. Опираться на эти данные как на точные данные о позициях я бы не стал, но как быстрый источник получения данных о поисковой выдаче Гугл XMLRiver с целью анализа конкурентов, группировки запросов, примерного анализа позиций и видимости сервис однозначно рекомендую.

Автор статьи
Антон Шабан
Частный SEO-специалист (стаж 8 лет), занимаюсь своими проектами и специализируюсь на SEO-консалтинге: SEO-аудиты, консультации, обучение специалистов
Написано статей
10
Понравилась статья? Сохраните в соцсети:

Похожие статьи

4 комментария

  1. Александр Арсёнкин

    04.11.2019 at 15:21

    Не сравнивал адекватность данных из моего сервиса?

    Ответить

    • Антон Шабан

      04.11.2019 at 16:05

      Саша, привет! Сравнивал, получилось хуже, 42% точных совпадений( А ты сам сравнивал? Как данные по МСК у тебя получились?

      Ответить

  2. Александр Арсёнкин

    05.11.2019 at 09:56

    Да, мы сравнивали, точность по Москве была высокая, 90-94%.

    По остальным регионам на уровне 80-85% в среднем.

    Ответить

    • Антон Шабан

      05.11.2019 at 13:36

      Значит мне надо будет перепроверить еще разок)

      Ответить

Оставить отзыв

Ваш email не будет опубликован.Обязательные поля помечены *

Скоро в блоге:
  • – Контентная аналитика в Яндекс.Метрике
  • – Обзор сервиса SEO-аналитики SEOwork
  • – Как за 5 минут проверить скорость загрузки всех страниц блога?
  • – Как работать с Гугл Мой Бизнес
  • – Как составить убойный title для статьи блога

Подписывайтесь, чтобы не пропустить!

Старый добрый RSS

Удобнее RSS, а не личные письма от меня? У нас свобода подписки =)