Предыдущий ролик Следующий ролик  

Видео урок: Фильтры, которые нужно использовать, если вы хотите получить чистые данные

Советы по Google Analytics

В предыдущем видео мы ознакомили вас с понятием постоянных фильтров, применяемых к представлениям. Теперь я хочу окунуться поглубже и выйти за рамки встроенных фильтров. Мы направим свое внимание на пользовательские фильтры. Кроме того, мы рассмотрим небольшой трюк, помогающий убедиться в том, что фильтры работают так, как и предполагалось. Поэтому вам не придется ждать две недели, чтобы понять, что фильтр работает не так, как вам нужно. Давайте выйдем из этого интерфейса и перейдем в раздел "Администратор" (Admin). Перейдем к представлениям и рассмотрим находящиеся в них фильтры. У вас всегда будет хотя бы одно необработанное и неотфильтрованное представление.

В этом случае я перейду к списку представлений и выберу то тестовое представление, которое я уже настроил. Можно рассмотреть примененные к нему фильтры. Перейдем к опции выбора варианта создания фильтра - на основе существующего или новый фильтр. Выберем создание нового фильтра и установим признак "Пользовательский фильтр" (Custom Filter). В результате мы получим совершенно новый набор опций. Мы можем что-то исключать, включать, приводить к нижнему регистру, к верхнему, искать, перемещать или использовать дополнительный вариант. В этом видео мы не будем рассматривать дополнительные варианты. Рассмотрим сначала опции "Исключить" (Exclude) и "Включить" (Include). Как вы помните, мы говорили о том, что исключение подразумевает, что что-то не попадет в ваше представление.

Я думаю, что это имеет смысл. Вот с вариантом "Включить" все сложнее, поскольку, когда я говорю что-то включить, это не означает, что в отчет будет включено то, что мы скажем. Это означает, что из него будет исключено все остальное. Т.е. в действительности мы включаем в отчет только эту информацию, потому что, как только я выберу этот вариант и применю фильтр, в отчете отобразятся только те данные, которые мы включили в фильтр. А это всегда вызывает интерес у людей. Пожалуйста, не забывайте об этом. В предыдущем видео мы показали, как можно получить IP-адрес, а затем использовать его для исключения внутреннего трафика.

Давайте предположим, что вам нужно совершенно противоположное. Вам нужно включить в отчет только внутренний трафик, чтобы посмотреть, как ваши сотрудники используют сайт. Давайте создадим фильтр под названием "include internal traffic" (включить внутренний трафик). Нам доступно множество различных опций. Мы можем применить фильтр к любому из этих полей, но в нашем случае мы ищем IP-адрес. Хочу отметить, что IP-адрес - это то, что вы можете получить только с помощью фильтров. Вы знаете, что мы не можем создавать расширенные сегменты на основании IP-адресов.

Мы можем использовать их здесь, прежде всего, потому что мы узнали об этом досрочно. Нам придется применить фильтр досрочно. Будет нарушена некоторая конфиденциальность, но это действительно один из единственных способов работы с IP-адресами в Google Analytics. Я не собираюсь сейчас вдаваться в детали регулярных выражений, но должен отметить, что в этом шаблоне фильтра используются именно регулярные выражения. Поэтому, если вы вводите IP-адрес вот таким образом, то вам нужно убедиться, что вы не пропустили эти точки. Это ничего для вас не значит, просто знайте, что вам нужно поставить перед каждой точкой обратный слэш так, как показано ниже.

Сохраним фильтр и получим наш внутренний трафик. Давайте рассмотрим еще пару возможностей, которые можно здесь применить. Одна из опций - приведение нашего трафика к нижнему регистру, и это на самом деле полезно. Это один из тех нескольких фильтров, которые, по моему мнению, пользователи должны всегда применять, поскольку этот фильтр приводит в порядок ваши данные перед тем, как они поступают в аккаунт. Поэтому давайте посмотрим, как работает этот фильтр. Если мы выбираем вариант "Нижний регистр" (lowercase), то в основном применяем его к таким вещам, как "Источники кампаний" (Campaign Sources), "Каналы кампаний" (Campaign Mediums) и тому подобное.

Перед тем как сделать это, давайте разберемся, почему мы применяем этот вариант именно к этим полям. Что продемонстрировать это, воспользуемся довольно глупым примером. Давайте предположим, что мы переходим на наш сайт и нам нужно ввести некоторые параметры кампаний. Мы можем понаблюдать за тем, как поступают эти данные. Мы ненадолго вернемся к отчетам режима реального времени. Я считаю, что это хороший способ убедиться в том, что наши фильтры работают. Система Google Analytics совсем недавно начала применять фильтры к отчетам реального времени. Поэтому здесь может возникнуть масса проблем.

Если я перейду к отчетам режима реального времени, то увижу тех посетителей, которые заходят на сайт. Кроме того, я могу рассмотреть здесь данные о кампаниях. Допустим, что я ввел бы здесь параметр "utm_medium", в значении его использовал бы заглавные и строчные буквы. Далее ввел бы параметр "utm_source", значение его тоже в смешанном регистре. Видите, я поменял здесь регистр, и если я похожу по сайту, то мы должны увидеть это в отчетах. Возвращаемся к отчетам режима реального времени, видим этот вход.

Переходим к отчету "Источники трафика" и видим в нем эти данные. Это введенное мной значение в смешанном регистре. Проблема заключается в том, что, если я введу такое значение, или такое, или такое, в действительности это все равно будет один и тот же канал и источник. Однако если я посмотрю в свои отчеты, то увижу что здесь эти входы воспринимаются как разные каналы и источники. Итак, если я перейду к своим отчетам, то увижу в них "Corey Koberg" в одной форме. После этого я открою совсем другой браузер в режиме "инкогнито" и введу другой параметр. Я получаю два одновременных входа - в обычном браузере и в браузере, работающем в режиме "инкогнито". Как видите, два разных источника, появившиеся в результате использования разного регистра, отображаются как два разных источника. Теперь я вижу, что с каждого из этих источников сделано по одному посещению. Я начинаю отфильтровывать все свои статистические данные. Конечно, мы знаем, что, с точки зрения источника кампании, эти источники должны рассматриваться как один и тот же источник. Пусть будет так, но я не могу постоянно контролировать, как пользователи находят мой сайт, что они используют. Они могут вводить здесь заглавные буквы или начинать с заглавной, некоторые всегда используют только строчные буквы. Как аналитику в большинстве случаев мне хочется, чтобы эти параметры вводились строчными буквами, поскольку я хочу объединить эти два источника и показать, что было 2 посетителя, воспользовавшихся этой комбинацией канала и источника. Меня не должно волновать, в каком регистре вы вводите эти значения. Хорошая новость - сделать это довольно просто. Перейдем в раздел "Администратор". Снова перейдем к списку фильтров. Я хочу установить, что мы будем приводить канал к нижнему регистру. Пользовательский фильтр, выбираем опцию "Нижний регистр" (Lowercase), будем применять ее к полю "Канал кампании" (Campaign Medium). Сохраним этот фильтр. Вернемся к отчетам. Перейдем к одному из отчетов режима реального времени - отчету "Источники трафика".

А теперь я обновлю эти данные. Здесь, а также в окне режима "инкогнито". Запущу новый сеанс "инкогнито". И если мы вернемся к нашим отчетам, то увидим, что для обоих случаев там, где канал был записан в верхнем регистре, теперь название канала отображается в нижнем регистре. Т.е. я привел эти названия к нижнему регистру. Если бы я проделал то же самое и для канала, и для источника, то они отображались бы в нижнем регистре и объединились бы в одно целое. Поэтому мы хотим применить этот фильтр не только к каналам, но и к источникам.

Перейдем сюда, введем "lower case source" (источник в нижнем регистре), выберем "пользовательский фильтр" и "нижний регистр". В списке найдем "Источник кампании". Сохраним этот фильтр. Будут применяться оба фильтра. Обновим обе страницы, запустим новое окно в режиме "инкогнито". Вернемся к источникам. Теперь мы видим, что эти источники объединились. Итак, мы видим, что в этой таблице осталась информация обо всех тех посещениях, которые были выполнены за последние несколько минут. Но все последние отображаемые здесь посещения приведены к нижнему регистру, "cory koberg", и объединены в одну строку.

Я сделал так, чтобы название канала и название источника приводились к нижнему регистру, поэтому все такие посещения будут отслеживаться в одной строке. А это то, чего мы и хотели. Итак, мы видим, что фильтр работает так, как мы и хотели, т.е. объединяет соответствующие источники и каналы независимо от регистра. Я настойчиво рекомендую вам при работе с любым из ваших профилей применять фильтр нижнего регистра к названиям каналов, источников и кампаний, поскольку в большинстве случаев нам не важно, какие буквы в них используются, строчные или заглавные. Но если вы этого не сделаете, система Google Analytics будет рассматривать их как разные категории.

Email с заглавной "E", email с маленькой "e", не важно, приводите их к нижнему регистру. Применяйте к названиям кампаний, каналов и источников фильтр нижнего регистра. Помимо этого в рамках функциональности пользовательских фильтров мне хотелось бы рассмотреть еще возможность включения и исключения данных. Мы уже рассматривали эту возможность ранее для встроенных фильтров. Мы рассмотрели возможность применения ее к подкаталогам и к названию хоста. А теперь давайте посмотрим, как можно настроить эту возможность для пользовательского фильтра, если нам нужно включить данные только об определенном хосте.

Итак, предположим, что у нас есть субдомен, например, "blog". Выберем в списке пункт "Название хоста" (hostname) и заполним поле "Шаблон фильтра" (Filter Pattern). Допустим, в названии хоста должно присутствовать слово "blog". Если бы этот фильтр был включающим и мы сохранили бы его, то в моих отчетах присутствовали бы данные только о таком хосте. Но давайте предположим, что в этом случае нам нужны сведения только о "beta" сайте. Включить только "beta". Итак, у меня есть фильтр, применив который, я хочу включить только данные о бета-сайте.

Таким образом, он выполняет то же самое, что и фильтр из предыдущего примера, где мы рассматривали только подкаталог блога. Но теперь делается это для названия хоста. Надеюсь, вы начали понимать, насколько полезны эти фильтры профилей, фильтры представлений. Только с помощью них мы можем решать вопросы, связанные с IP-адресами. Это не только способ исключения внутреннего трафика, но также и возможность привести данные в порядок еще до того, как они поступят в аккаунт, в частности, благодаря использованию фильтров нижнего регистра. Рекомендую применять этот фильтр для всех переменных кампаний. Также советую создавать здесь тестовое представление, чтобы тестировать фильтры, а также использовать отчеты режима реального времени, чтобы убедиться, что эти фильтры работают так, как надо.

А затем использовать эти фильтры для того, чтобы приводить в порядок данные, и благодаря этому делать систему Google Analytics еще более мощной. В следующий раз мы посмотрим, как можно использовать дополнительные опции для задания еще более мощных фильтров профилей. А пока с помощью рассмотренных сегодня опций вы можете сделать не так уж и мало.