Центр демографических исследований

Российской экономической школы

Курс “Основы статистического анализа в демографии”

Курс "Основы статистического анализа в демографии", 4-15 февраля 2013

С 4 по 15 февраля 2013 года на базе РЭШ прошел курс повышения квалификации «Основы статистического анализа в демографии», организованный Центром демографических исследований РЭШ и Институтом демографических исследований Макса Планка.  Было получено более 60 заявок на участие.  На курс были отобраны 15 человек: студенты магистратуры, аспиранты и молодые исследователи из НИУ ВШЭ, МГУ им. М.В. Ломоносова, Федеральной службы государственной статистики, Пенсионного фонда Российской Федерации, Государственного центра профилактической медицины, Белорусского государственного университета, Центра экономических и финансовых исследований и разработок РЭШ.

Список участников курса

Основную часть занятий по курсу проводил Трифон И. Мисов (Институт демографических исследований Макса Планка, Росток, Германия). Вводные занятия по основам программирования в R для слушателей, не являвшихся пользователями данной программы, провел Дмитрий Жданов (РЭШ, Москва, Россия; Институт демографических исследований Макса Планка, Росток, Германия).

Содержание курса

Цель данного курса – ознакомить слушателей с наиболее часто применяемыми методами для статистического анализа демографических данных.

Как статистически правильно сравнить режимы смертности разных лет? Как исследовать динамику неплодовитости по времени? Как оценить вероятность зачатия для курящих и некурящих женщин? Как оценить интенсивность заболевания раком в зависимости от различных факторов? Какова вероятность вступить в брак в том или ином возрасте? Ответы на эти и другие важные вопросы – как на теоретические, так и прикладные темы – даются после корректного применения статистических методов, которым посвящен данный курс.

Курс состоял из трех частей. Первая из них - введение в анализ демографических данных. В первой части курса давались ответы на вопросы о том, какие бывают демографические данные, как проводить их предварительный описательный анализ, какие параметры необходимо оценивать.

Вторая часть была посвящена методам классической математической статистики, с помощью которой оцениваются вероятности наступления и интенсивности демографических событий. Основной акцент был сделан на разъяснении применения метода максимального правдоподобия (ММП).

Третья часть курса была посвящена анализу выживаемости (Survival Analysis), с помощью которого оценивается наступление демографических событий во времени. Было рассказано об особенностях данных типа выживаемости и о том, почему для их анализа нужно применять методы неклассической статистики. Были представлены методы параметрического и непараметрического оценивания режимов выживания и их практическое применение. В конце курса было разобрано статистическое оценивание с учетом ненаблюдаемой неоднородности и его применение при изучении смертности.

Основная литература

1. Agresti A., and B. Finlay (2009). Statistical Methods for the Social Sciences. 4th edition. Pearson Prentice Hall.

2. Rodriguez, G.. Lecture Notes: http://data.princeton.edu/wws509/notes/

3. Klabfleisch, J.D., and R.L. Prentice (1980). The Statistical Analysis of Failure Time Data. New York: Wiley.

Программа курса «Основы статистического анализа в демографии»

I. Введение: демографические данные и общая постановка их статистического анализа

II. Статистический анализ вероятности наступления и интенсивности демографических событий

1. Дескриптивная статистика в R: предварительный анализ данных

2. Статистические модели как механизмы генерирования данных. Применение теории вероятностей в задачах демографии и эпидемиологии

3. Параметрические статистические модели: оценивание методом  максимального правдоподобия

4. Примеры применения метода максимального правдоподобия в демографических моделях:

            a) возрастные коэффициенты смертности: биномиальная модель

            b) плодовитость: геометрическая модель

            c) число смертей: пуассоновская модель

5. Регрессионные параметрические статистические модели:

            a) использование противозачаточных средств: логистическая регрессия

b) заболеваемость раком: пуассоновская регрессия

III. Введение в статистический анализ данных типа времени жизни (анализ выживаемости)

            1. Особенности данных типа времени жизни: цензурирование

            2. Примеры параметрических моделей:

                       a) модель Вейбулля

                       b) человеческая смертность: модель Гомперца

            3. Непараметрические модели: оценка Каплана-Майера и регрессия Кокса.

            4. Ненаблюдаемая неоднородность в данных по смертности: модели уязвимости