Йиран Э. Лю из Стэнфордского университета в Калифорнии и его коллеги объединили 11 открытых наборов данных, профилирующих транскриптомы крови 365 больных денге из семи стран. Были выявлены дифференциально экспрессированные гены (ДЭГ) между нетяжелыми пациентами и теми, кто прогрессирует до СД. Модель машинного обучения XGBoost была обучена на открытых данных с использованием только этих ДЭГ для прогнозирования прогрессирования СД. Модель была проверена на проспективной когорте из 377 пациентов с денге в Колумбии.
Исследователи выявили восемь ДЭГ, связанных с СД, в открытом наборе данных и построили восьмигенную модель XGBoost. В независимой валидной когорте модель точно предсказала прогрессирование СД с чувствительностью и специфичностью 86,4 и 79,7 процента соответственно. Восьмигенная модель имела положительную и отрицательную предсказательную ценность 20,9 и 99,0 процентов, соответственно, учитывая 5,8-процентную долю случаев СД в когорте.
Чувствительность и специфичность клинических предупреждающих признаков при поступлении составляли 77,3 и 39,7 процента соответственно; для сравнения, восьмигенная модель позволила на 80 процентов снизить число, необходимое для прогнозирования (с 25,4 до 5,0). Точное предсказание последующего СД было обеспечено восьмигенной моделью в первые три дня после начала лихорадки и до трех дней до прогрессирования СД.
Несколько авторов раскрыли финансовые связи с биофармацевтической промышленностью; один автор имеет патент, а набор из восьми генов был раскрыт для возможной патентной защиты.