Моделирование эпидемий: история развития

Социологи питерской Вышки — студенты и преподаватели — ведут наукометрический блог Pandemic Science Maps. В нем публикуются обзоры и подборки литературы и препринтов о коронавирусе и текущей пандемии, а также рекомендуются важные статьи из смежных областей.

Наукометрия обычно упоминается в связи с оценкой цитируемости, но базы Web of Science и Scopus ученые всего мира используют не для этого, а для информационного поиска. По итогам такого поиска строятся карты науки — наглядное отражение того, как устроены исследовательские области, и какие работы в них центральные. Блог Pandemic Science Maps показывает, как устроена наука об эпидемиях в отдельных ее разделах. Редакторы блога — Даниил Александров и Алла Лосева.

Эпидемиологическая модель — это математический способ предсказать ход эпидемии. Модели помогают оценить скорость распространения инфекции, характеристики уязвимых групп населения, оптимальный возраст вакцинации и другие связанные с заболеванием социальные и экономические факторы. Выводами таких исследований пользуются организации общественного здравоохранения, чтобы успешно бороться с распространением инфекции.

В предыдущих материалах серии про моделирование эпидемий мы рассказывали, в каких случаях используются простые и более сложные модели. Сегодняшний обзор посвящён этапам развития эпидемиологического моделирования и разных подходов к нему.

Для обзора мы выполнили систематический поиск литературы в базе данных Web of Science и построили карту публикаций на основе их списков литературы. Карта отображает «деревья цитирования», где самые ранние работы (вверху) цитируются более поздними (внизу). Таким образом, она отражает динамику исследовательской области. Принадлежность к одному кластеру на этой карте означает, что публикации цитируют одни и те же «классические» работы, продолжая одну исследовательскую традицию. Карта выполнена в программе CitNetExplorer.

Исследования про моделирование эпидемий разбиваются на четыре кластера:

  • жёлтый: как распространяется корь,
  • цвета морской волны: модели на обычных дифференциальных уравнениях и стохастические модели,
  • оранжевый: моделирование на сетях,
  • фиолетовый: модели новых эпидемий.
 
Карта прямого цитирования публикаций про эпидемиологические модели

Цвет присвоен узлам в соответствии с автоматически выделенными кластерами. Расположение узлов по вертикали соответствует году публикации: чем выше работа на карте, тем раньше она была написана. Связи означают, что верхняя, более ранняя, публикация цитируется нижней, более поздней. Близость на карте и принадлежность к одному кластеру отражают вероятность, что работы выполнены в одной исследовательской традиции. В карту включены самые популярные работы из списков литературы изначально полученной подборки публикаций — как правило, это ранние работы вверху карты. На карте отображены только наиболее цитируемые статьи (N = 100).

В научном поле моделирования эпидемий как главные классики цитируются врачи-учёные начала XX века: сэр Рональд Росс, Уильям Хамер, Андерсон Маккендрик и Уильям Кермак. Они заложили основы математического подхода в эпидемиологии, построенного на компартментальных моделях (Brauer 2017). 

Следующий этап развития эпидемиологических моделей начался на рубеже 1950–60-х гг. Авторы того времени, на которых чаще всего ссылаются эпидемиологи — это профессор тропической медицины Джордж Макдональд, статистики Норман Бейли и Морис Бартлетт и математик Пал Эрдёш. Макдональд ведёт исследования о малярии, начатые Россом, и вводит понятие основного репродуктивного числа. Бартлетт развивает стохастическую аналогию модели Кермака-Маккендрика. Эрдёш появляется на карте — как соавтор модели генерации случайных графов — в связи со становлением нового подхода к изучению эпидемий, моделирования на сетях.

С 1970-х появляются основные публикации в сфере эпидемиологического моделирования, в том числе пространственные и вероятностные модели и исследования о распространении новых вирусов в условиях глобализации.

Жёлтый кластер: как распространяется корь

 
Карта прямого цитирования публикаций про эпидемиологические модели, жёлтый кластер

Этот кластер начинается статьями на тему моделирования распространения кори. В более поздних публикациях предыдущие модели совершенствуются через включение новых факторов и распространяются на различные заболевания. 

Hamer (1906) подчёркивает, что на распространение инфекции влияет не только заразительность возбудителя. Он выдвигает гипотезу, что ход эпидемии зависит от числа заражённых и числа уязвимых людей — по аналогии с открытым незадолго до этого законом действующих масс в химии, где скорость реакции зависит от концентрации реагентов. Эта идея стала базовой для компартментальных моделей.

Основная часть кластера наследует Хамеру и Бартлетту. С работ Бартлетта в целом начинается развитие стохастических моделей эпидемических процессов. Bartlett (1957, 1960) использует стохастический вариант компартментальной модели Кермака-Маккендрика, чтобы найти критическое значение размера общества, при котором инфекция перестает распространяться.

В последующий период в модели включаются дополнительные факторы, например, фактор сезонности, чтобы оценить колебания больших и маленьких вспышек болезни (Aron and Schwartz 1984; Fine and Clarkson 1982; Schwartz 1985). Bolker and Grenfell (1995) включают в модель эпидемии кори пространственный компонент, который позволяет сравнить географические регионы и установить связь между передвижениями людей и вспышками инфекций.

Затем модели усложняются. Keeling and Rohani (2002) проверяют стандартный способ моделировать связь между регионами и модель, основанную на точных данных о перемещениях людей. Bjørnstad, Finkenstädt, and Grenfell (2002) включают в модель временные ряды, которые позволяют фиксировать как эндемические циклы, так и эпизодические вспышки кори. Keeling and Grenfell (1997) также развивают идею критического размера сообщества, объясняя колебания в количестве зараженных корью.

В левой части кластера находятся работы, ссылающиеся на Macdonald (1957). Эта группа публикаций ближе кластеру цвета морской волны, поскольку Макдональд — прямой продолжатель исследований Росса о малярии, и именно в его работе вводится понятие основного репродуктивного числа, уже применявшееся Россом, Кермаком и Маккендриком.

Кластер цвета морской волны: модели на обычных дифференциальных уравнениях и стохастические модели

 
Карта прямого цитирования публикаций про эпидемиологические модели, кластер цвета морской волны

Кластер цвета морской волны показывает динамику исследовательских подходов от обычных дифференциальных уравнений к моделям, включающим вероятности и нелинейные закономерности распространения вируса.

Классика этого кластера — эпидемиологическая модель передачи малярии (Ross 1911). В 1902 году Росс получил Нобелевскую премию по медицине за то, что продемонстрировал динамику передачи малярии между популяциями комаров и людей (Brauer 2017). До этого считалось, что малярию нельзя победить, если не истребить всех комаров. Однако Росс на простой компартментальной модели показал, что достаточно будет опустить численность насекомых ниже критического уровня, чтобы прекратить распространение болезни. 

Публикация Kermack and McKendrick (1927) стала следующим шагом в развитии компартментальных моделей. Исследователи обнаружили, что существуют специальные пороговые значения плотности населения для различных комбинаций инфекционности, выздоровления и смертности, и при превышении этих критических точек число инфицированных людей будет увеличиваться. Разработанная авторами теория стала базовой для моделирования SIR.

Центральные исследования кластера посвящены разработке и применению нелинейных моделей. Hethcote (1976, 1978) развивает компартментальные модели, учитывая пространственное распределение людей в популяции. В ряде работ используется бифуркация Хопфа, когда находится критическое значение — точка бифуркации, в которой математическая модель имеет несколько путей развития (Hethcote and Driessche 1991; Hethcote, Stech, and Driessche 1981; Huang, Cooke, and Castillo-Chavez 1992; Liu, Levin, and Iwasa 1986). 

Группа исследований посвящена переносчикам болезней — насекомым и животным (Anderson et al. 1981; Anderson and May 1981, 1982; May and Anderson 1979; Murray, Stanley, and Brown 1986). Еще одна важная тема в этом кластере — инфекции, передаваемые половым путем (Dietz and Hadeler 1988; Hadeler and Castillo-Chavez 1995; Hyman and Stanley 1988; May and Anderson 1987). 

В более современных работах обсуждается основное репродуктивное число R0, способы его подсчёта и варианты использования в эпидемиологических моделях (Driessche and Watmough 2002; Heesterbeek 2002; Heffernan, Smith, and Wahl 2005; Hethcote 2006). Кроме этого, исследователи выводят пороговые значения, позволяющие контролировать распространение заболеваний по модели SEIRS, где учитывается инкубационный период болезни (Cooke and Driessche 1996; Li et al. 1999).

Оранжевый кластер: моделирование на сетях

 
Карта прямого цитирования публикаций про эпидемиологические модели, оранжевый кластер

Оранжевый кластер посвящён сетевому подходу к моделированию эпидемий. Население представлено как сеть, где узлы сети — люди, а связи между ними — контакты. От заражённого индивида вирус передаётся тем, кто с ним контактирует, а от них — дальше по сети. В этом кластере часто ссылаются на теорию случайных графов, разработанную Erdös and Rényi (1959, 1960, 1961). 

Крупная доля кластера посвящена передаче ВИЧ/СПИДа по сетям социальных контактов (Gupta, Anderson, and May 1989; Jacquez et al. 1988; Klovdahl et al. 1994; May and Anderson 1988).

В некоторых исследованиях разрабатываются модели, где учитывается пространственная неоднородность населения (Ball 1983; Ball 1986; Longini 1988; May and Anderson 1984). 

Более современные работы тоже пользуются случайными графами, при этом считают началом эпидемии не появление первого заражённого, а первую передачу вируса (Callaway et al. 2000; Newman 2002; Newman, Strogatz, and Watts 2001). В других работах анализ производится на безмасштабных сетях (Dezső and Barabási 2002), многоуровневых сетях (Sahneh, Scoglio, and Mieghem 2013; Watts et al. 2005), а также обобщается для разных типов сетей (Chakrabarti et al. 2008).

Фиолетовый кластер: модели новых эпидемий

 
Карта прямого цитирования публикаций про эпидемиологические модели, фиолетовый кластер

Фиолетовый кластер объединяет работы, в которых сложные сетевые модели используются для симуляции эпидемий, в том числе пандемий гриппа в эпоху глобализации, когда из-за дальних путешествий инфекции быстро распространяются по миру (см. напр. Hufnagel, Brockman, and Geisel 2004).

Кластер открывается работами о Гонконгском гриппе 1968–1969 гг., его распространении и эффективности вакцинации (Elveback et al. 1976; Longini, Ackerman, and Elveback 1978; Longini et al. 1982).

Ряд публикаций про пандемии гриппа с помощью стохастических моделей оценивают эффективность различных мер сдерживания эпидемии: вакцинации и социального дистанцирования (Ferguson et al. 2005; Longini 2004; Longini et al. 2005). Другие работы включают такие факторы, как мутация вируса и его устойчивость перед лекарствами, путешествия как катализатор распространения (Ferguson, Galvani, and Bush 2003; Grais, Ellis, and Glass 2003; Stilianakis, Perelson, and Hayden 1998). 

Разрабатывались также модели распространения и контроля над распространением оспы (Bauch, Galvani, and Earn 2003; Ferguson et al. 2003) и тяжёлого острого респираторного синдрома SARS, эпидемия которого разворачивалась в те годы (Chowell et al. 2003; Lipsitch et al. 2003). 

Важным направлением было изучение мобильности населения как одного из факторов распространения вирусных инфекций с помощью пространственных моделей, в том числе на сетях (Bajardi et al. 2011; Balcan et l. 2009; Gonzalez, Hidalgo, and Barabasi 2008; Riley 2007).