Предыдущий ролик

Видео урок: Выборки для отчетов

Основы платформы Google Analytics

Выборка данных в отчетах (Report sampling) - это аналитический метод, который формирует отчеты на основании не всех возможных данных, а на основании небольшого произвольного подмножества данных. Выборка данных позволяет таким программам, как Google Analytics, быстрее рассчитывать данные для отчетов, чем если бы каждый фрагмент данных включался в отчет на этапе формирования. На этапе обработки данных система Google Analytics подготавливает данные для стандартных отчетов, заново рассчитывая данные и сохраняя их в агрегированные таблицы. Благодаря этому система Google Analytics быстро извлекает данные из запроса, не применяя выборку данных. Однако возможны ситуации, когда вам нужно будет модифицировать один из стандартных отчетов Google Analytics, добавив сегмент, дополнительный параметр или внеся какое-то другое изменение. Или вы захотите создать персонализированный отчет с совершенно новой комбинацией параметров и показателей. Когда вы либо с помощью интерфейса отчетов, либо посредством API отчетов выполняете один из этих персонализированных запросов, система Google Analytics осматривает совокупность агрегированных таблиц, чтобы понять, можно ли удовлетворить запрос с помощью уже обработанных и находящихся в этих таблицах данных. Если сделать это нельзя, то система Google Analytics снова обращается к необработанным данным о сеансах, чтобы оперативно обработать ваш запрос. В таких ситуациях система Google Analytics определяет, сколько сеансов необходимо включить в запрос. Если количество сеансов довольно небольшое, то Google Analytics может рассчитать необходимые данные на основании всех сеансов. Если количество сеансов слишком велико, то для выполнения запроса Google Analytics использует выборку данных. Предположим, например, что вы создали персонализированный отчет, содержащий параметры "Город" (City) и "Кампания" (Campaign), а также показатели "Посещения" (Visits) и "Коэффициент конверсии" (Conversion Rate). Эта комбинация показателей и параметров в агрегированных таблицах еще не рассчитывалась. Поэтому если вы для отчета укажете диапазон дат, включающий огромное количество сеансов, то данные вашего отчета будут вычисляться на основании выборки данных. Количество сеансов, используемое при расчете данных отчета, называется "размером выборки" (sample size). Изменить размер выборки можно с помощью ползунка в интерфейсе отчетов или, указав размер при запросе API. Если вы увеличите размер выборки, то в ваши расчеты будет включено больше сеансов, но при этом для формирования отчета потребуется больше времени. Если вы уменьшите размер выборки, то в ваших расчетах будет использоваться меньше сеансов, но при этом отчет будет формироваться быстрее. В системе Google Analytics устанавливается максимальное количество сеансов, которое можно использовать в расчетах. Если вы превысите этот лимит, то данные ваших отчетов будут строиться на основании выборки. Один из способов непревышения лимита - сокращение в отчете диапазона дат, что приведет к уменьшению количества сеансов, необходимых Google Analytics для расчета данных запроса. В премиум-аккаунтах Google Analytics есть такая возможность, как "отчеты без выборки" (Unsampled Reporting), позволяющая получать полные данные (т.е. данные, к которым еще не была применена выборка) даже для больших отчетов, превышающих лимит выборки. Применение выборки данных позволяет сократить латентность и получить более точные данные. Эта возможность позволяет системе Google Analytics эффективно обрабатывать пользовательские запросы данных, поэтому вы получаете своевременные ответы на вопросы, касающиеся вашего бизнеса.