Для изучения мобильности по заработной плате необходимы так называемые лонгитюдные, или панельные, данные. Такие данные должны содержать полные сведения о всех годовых заработках для одной и той же репрезентативной группы работников за достаточно продолжительный промежуток времени. Поэтому зарубежные исследователи все чаще обращаются к административным источникам данных, таким как данные налоговых служб и фондов социального страхования (см., например: [Hofer, Weber, 2002; Raferzeder, Winter-Ebmer, 2007; Cardoso, Neuman, Ziderman, 2010]). Такие данные содержат большое количество наблюдений и имеют меньше искажений, связанных с ошибками измерения, хотя и включают, как правило, очень ограниченный набор индивидуальных переменных. К сожалению, российским исследователям административные базы недоступны. Единственным источником панельных данных о заработной плате является РМЭЗ ВШЭ, представляющий собой обследование домохозяйств. Данные РМЭЗ ВШЭ ранее уже использовались для анализа мобильности по заработной плате [Лукьянова, 2009] и неоднократно – для анализа мобильности по доходам [Jovanovic, 2001; Luttmer, 2000; Denisova, 2007; Gorodnichenko et al., 2008; Lukiyanova, Oshchepkov, 2012]. Данные РМЭЗ ВШЭ несовершенны: Лутмер [Luttmer, 2000] отмечает, что около половины вариаций доходов в этом обследовании связаны с ошибками измерения и краткосрочными шоками, и различить их между собой не представляется возможным. Поэтому данные РМЭЗ ВШЭ, скорее всего, дают завышенные оценки мобильности, и при межстрановых сравнениях следует использовать лишь те оценки по другим странам, которые также рассчитаны по данным обследований населения. Вместе с тем ошибки измерения могут быть не столь значительны: в фундаментальном обзоре исследований по мобильности по доходам и заработным платам авторы работы [Jantti, Jenkins, 2015] приходят к выводу о том, что во многих странах использование обследований населения и административных данных дает очень близкие оценки показателей мобильности.
Используемая в исследовании выборка ограничена работающими респондентами в возрасте от 24 лет до возраста выхода на пенсию (54 года для женщин и 59 лет для мужчин), по которым имеются данные о заработной плате. Выбор нижней границы в 24 года связан с желанием отсечь подрабатывающих учащихся и студентов, так как многие из них заняты на временных работах, нередко с режимом неполной занятости и не соответствующих их уровню образования и способностям. Следуя распространенной практике, для основной массы расчетов мы не учитываем перемещения из состояния занятости в состояние безработицы или неактивности. Между тем риск перейти в разряд незанятых и, соответственно, потерять заработки существенно выше для низкооплачиваемых работников. В связи с этим масштабы восходящей мобильности для представителей нижних децилей могут быть завышены. Кроме того, мы исключили получателей трудовых пенсий по старости, военных пенсий и других досрочных пенсий (пенсии по инвалидности и потере кормильца не учитываются), а также тех, у кого отсутствует информация по ключевым социально-демографическим переменным (пол, возраст, уровень образования).
В большинстве зарубежных работ, посвященных мобильности – хотя это не является обязательным правилом, – при расчетах используется сбалансированная панель, т. е. такая выборка, которая состоит из респондентов, опрошенных во всех без исключения раундах в течение рассматриваемого периода. Для изучения мобильности по данным РМЭЗ ВШЭ целесообразность использования сбалансированной выборки вызывает серьезные вопросы с точки зрения репрезентативности. Лишь 1629 человек (из числа отвечающих критериям отбора в выборку) имеют ненулевые значения среднемесячных заработков в каждом из раундов РМЭЗ ВШЭ в 2003–2007 гг., 2961 человек – в 2007–2009 гг. и 1943 человека – в 2009–2013 гг. Это составляет 15–20 % от общего числа респондентов для пятилетних периодов, и около 40 % – для кризисного трехлетнего периода. Для всего одиннадцатилетнего периода сбалансированная панель включает всего 582 респондента, т. е. примерно 3,4 % от общего числа респондентов, удовлетворяющих условиям отбора. Столь сильное истощение выборки связано с масштабным ремонтом выборки в 2006 и 2010 гг.
Чтобы извлечь максимум информации из имеющихся данных, в настоящей работе мы используем частично сбалансированные данные, совмещая отдельные годовые выборки. Эта процедура позволяет включить в расчеты максимальное число респондентов, указавших заработные платы в каждой паре совмещенных выборок. Таким образом, основным объектом изучения являются изменения заработной платы за один год. В отдельных таблицах, а также для проверки робастности результатов приводятся результаты расчетов по сбалансированным панелям, в том числе по скользящим сбалансированным панелям.