Курс “Основы статистического анализа в демографии”
Курс "Основы статистического анализа в демографии", 4-15 февраля 2013
С 4 по 15 февраля 2013 года на базе РЭШ прошел курс повышения квалификации «Основы статистического анализа в демографии», организованный Центром демографических исследований РЭШ и Институтом демографических исследований Макса Планка. Было получено более 60 заявок на участие. На курс были отобраны 15 человек: студенты магистратуры, аспиранты и молодые исследователи из НИУ ВШЭ, МГУ им. М.В. Ломоносова, Федеральной службы государственной статистики, Пенсионного фонда Российской Федерации, Государственного центра профилактической медицины, Белорусского государственного университета, Центра экономических и финансовых исследований и разработок РЭШ.
Основную часть занятий по курсу проводил Трифон И. Мисов (Институт демографических исследований Макса Планка, Росток, Германия). Вводные занятия по основам программирования в R для слушателей, не являвшихся пользователями данной программы, провел Дмитрий Жданов (РЭШ, Москва, Россия; Институт демографических исследований Макса Планка, Росток, Германия).
Содержание курса
Цель данного курса – ознакомить слушателей с наиболее часто применяемыми методами для статистического анализа демографических данных.
Как статистически правильно сравнить режимы смертности разных лет? Как исследовать динамику неплодовитости по времени? Как оценить вероятность зачатия для курящих и некурящих женщин? Как оценить интенсивность заболевания раком в зависимости от различных факторов? Какова вероятность вступить в брак в том или ином возрасте? Ответы на эти и другие важные вопросы – как на теоретические, так и прикладные темы – даются после корректного применения статистических методов, которым посвящен данный курс.
Курс состоял из трех частей. Первая из них - введение в анализ демографических данных. В первой части курса давались ответы на вопросы о том, какие бывают демографические данные, как проводить их предварительный описательный анализ, какие параметры необходимо оценивать.
Вторая часть была посвящена методам классической математической статистики, с помощью которой оцениваются вероятности наступления и интенсивности демографических событий. Основной акцент был сделан на разъяснении применения метода максимального правдоподобия (ММП).
Третья часть курса была посвящена анализу выживаемости (Survival Analysis), с помощью которого оценивается наступление демографических событий во времени. Было рассказано об особенностях данных типа выживаемости и о том, почему для их анализа нужно применять методы неклассической статистики. Были представлены методы параметрического и непараметрического оценивания режимов выживания и их практическое применение. В конце курса было разобрано статистическое оценивание с учетом ненаблюдаемой неоднородности и его применение при изучении смертности.
Основная литература
1. Agresti A., and B. Finlay (2009). Statistical Methods for the Social Sciences. 4th edition. Pearson Prentice Hall.
2. Rodriguez, G.. Lecture Notes: http://data.princeton.edu/wws509/notes/
3. Klabfleisch, J.D., and R.L. Prentice (1980). The Statistical Analysis of Failure Time Data. New York: Wiley.
Программа курса «Основы статистического анализа в демографии»
I. Введение: демографические данные и общая постановка их статистического анализа
II. Статистический анализ вероятности наступления и интенсивности демографических событий
1. Дескриптивная статистика в R: предварительный анализ данных
2. Статистические модели как механизмы генерирования данных. Применение теории вероятностей в задачах демографии и эпидемиологии
3. Параметрические статистические модели: оценивание методом максимального правдоподобия
4. Примеры применения метода максимального правдоподобия в демографических моделях:
a) возрастные коэффициенты смертности: биномиальная модель
b) плодовитость: геометрическая модель
c) число смертей: пуассоновская модель
5. Регрессионные параметрические статистические модели:
a) использование противозачаточных средств: логистическая регрессия
b) заболеваемость раком: пуассоновская регрессия
III. Введение в статистический анализ данных типа времени жизни (анализ выживаемости)
1. Особенности данных типа времени жизни: цензурирование
2. Примеры параметрических моделей:
a) модель Вейбулля
b) человеческая смертность: модель Гомперца
3. Непараметрические модели: оценка Каплана-Майера и регрессия Кокса.
4. Ненаблюдаемая неоднородность в данных по смертности: модели уязвимости