Ответы к тестам НМО: "Применение логистической регрессии и ROC-анализа в медицинских исследованиях"

Содержание

1. В качестве предикторов в модель логит-регрессии могут включаться переменные следующих типов
2. Валидация модели проводится
3. Выберите верное утверждение, касающееся метрик при оценке качества модели
4. Для коэффициентов логистической регрессии справедливы следующие высказывания
5. Для отбора предикторов в модель логит-регрессии необходимо, чтобы
6. Для отношения шансов в логистической регрессии справедливы следующие высказывания
7. Для оценки статистической значимости предиктора используют
8. Для подсчета отношения шансов в модели логит-регрессии используют формулу
9. Для теста Хосмера-Лемешоу справедливо утверждение
10. Индекс Юдена
11. Качество модели по ROC-анализу признается хорошим, если
12. Классификация объектов означает
13. Коэффициент Вальда в лог-регрессионной модели
14. Коэффициент корреляции Мэтьюса
15. Кривая «точность-полнота»
16. Кривая «точность-полнота» демонстрирует удачный классификатор, если
17. Критерий Хи-квадрат в лог-линейной регрессионной модели
18. Логистическая регрессия может быть описана следующими характеристиками
19. Матрица ошибок содержит информацию
20. Необходимым допущением логистической регрессии является
21. Переменные модели бинарной логистической регрессии таковы, что
22. Применение логистической регрессии оправдано в случае, если
23. Роль логистической регрессии в машинном обучении сводится к
24. Свойства ROC-кривой
25. Сила связи между предиктором и исходом установлена верно в следующих высказываниях
26. Специфичность по матрице ошибок — это
27. Уровни отсечения в бинарной логит-регрессии – это
28. Целью классификации является
29. Чтобы определить оптимальное количество пациентов для модели логит-регрессии, необходимо применить правило
30. Чувствительность по матрице ошибок

1. В качестве предикторов в модель логит-регрессии могут включаться переменные следующих типов

1) только бинарные переменные;
2) количественные и качественные, заранее преобразованные в фиктивные (бинарные) переменные; +
3) качественные в исходной кодировке, количественные;
4) качественные, количественные и даты;
5) переменные любых типов с исходным кодированием.

2. Валидация модели проводится

1) на всех полученных моделях в ходе анализа;
2) с целью проверки ее работоспособности на тестовой выборке; +
3) на обучающей выборке с целью ее обучения;
4) только на проверенных данных.

3. Выберите верное утверждение, касающееся метрик при оценке качества модели

1) точность чувствительна к дисбалансу классов;
2) AUC-ROC не завышает качество модели в условиях нарушения балансировки классов;
3) специфичность характеризует способность модели распознавать только один класс, и это является недостатком; +
4) AUC-PR «учитывает» отрицательные классификации.

4. Для коэффициентов логистической регрессии справедливы следующие высказывания

1) значение коэффициента логит-регрессии определяет его статистическую значимость;
2) отношение шансов для непрерывной и категориальной переменных интерпретируются одинаково;
3) для проверки статистической значимости коэффициентов логит-регрессии используется критерий Стьюдента;
4) они связаны с отношением шансов событий в группах, поэтому для вывода используется отношение шансов; +
5) они никак не интерпретируются. +

5. Для отбора предикторов в модель логит-регрессии необходимо, чтобы

1) все количественные непрерывные предикторы имели нормальное распределение;
2) после проведения юнивариантного ROC-анализа у отобранных предикторов уровень значимости был p<0,1; +
3) после проведения юнивариантного лог-регрессионного анализа у отобранных предикторов уровень значимости был p<0,05; +
4) после проведения юнивариантных лог-регрессионных, либо ROC-анализов уровень значимости должен быть p<0,05.

6. Для отношения шансов в логистической регрессии справедливы следующие высказывания

1) статистическая значимость ОШ проверяется по уровню статистической значимости р; +
2) отношение шансов (OШ) представляет собой отношение шансов события, происходящего в группе с исходом, к его шансам в другой группе (без исхода); +
3) для оценки влияния предиктора на исход используют сравнение отношение шансов с 0;
4) величина ОШ указывает на силу связи между предиктором и исходом. +

7. Для оценки статистической значимости предиктора используют

1) разницу остатков между фактическими и предсказанными по модели для каждого предиктора;
2) логарифм отношения шансов для каждого предиктора;
3) значение р для каждого предиктора в модели; +
4) 95% доверительный интервал ОШ. +

8. Для подсчета отношения шансов в модели логит-регрессии используют формулу

1) ширину интервала 95% ДИ ОШ, деленного пополам;
2) ОШ=p/(1-p), где р – вероятность наступления исхода; +
3) ОШ=EXP(Bi), где Bi – коэффициент предиктора в модели; +
4) P=1/(1+exp(-Z))).

9. Для теста Хосмера-Лемешоу справедливо утверждение

1) для оценки статистической значимости разницы частот используется точный критерий Фишера;
2) если p>0,05, то наблюдаемые и предсказанные частоты событий статистически значимо не различаются, и модель является хорошим классификатором; +
3) если p>0,05, то наблюдаемые и предсказанные частоты событий статистически значимо не различаются, и поэтому модель является плохим классификатором;
4) тест оценивает, соответствует ли наблюдаемая частота событий ожидаемой частоте в обеих классах. +

10. Индекс Юдена

1) объединяет чувствительность (способность теста правильно идентифицировать людей с заболеванием) и специфичность (способность правильно идентифицировать людей без заболевания) в одно значение; +
2) это разница между долей истинно положительных результатов (чувствительностью теста) и долей ложноположительных результатов; +
3) значение индекса Юдена выше 0,5 обычно считается неприемлемым;
4) указывает на идеальную чувствительность классификатора.

11. Качество модели по ROC-анализу признается хорошим, если

1) площадь под кривой ROC-AUC выше 0,7, а 95% ДИ ROC-AUC может быть любым;
2) нижняя граница 95% ДИ ROC-AUC будет выше 0,7; +
3) если AUC−ROC=0.5;
4) если AUC−ROC < 0.5.

12. Классификация объектов означает

1) произвольное распределение объектов на классы до начала исследования;
2) разделение признаков на несколько категорий и объединение похожих;
3) прогнозирование вероятности бинарного исхода;
4) моделирование, при котором объекты или наблюдения распределяются по одной из нескольких заранее определенных категорий на основе входных данных. +

13. Коэффициент Вальда в лог-регрессионной модели

1) может быть выше 0,05, что говорит об отсутствии статистической значимости предиктора, и тогда его нельзя включать в модель;
2) определяет статистическую значимость коэффициентов предикторов регрессии; +
3) определяет статистическую значимость отношения шансов;
4) может быть выше 0,05, что говорит об отсутствии статистической значимости предиктора, тем не менее его можно включить в модель. +

14. Коэффициент корреляции Мэтьюса

1) оценивает силу связи между зависимой и независимыми переменными;
2) изменяется в диапазоне от -1 до 1; +
3) используется для анализа мультиколлинеарности между предикторами;
4) применяется для оценки корреляции между фактическими и предсказанными моделью бинарными классификациями. +

15. Кривая «точность-полнота»

1) это график зависимости между точностью и полнотой классификатора при различных порогах принятия решения; +
2) позволяет получить адекватные результаты только на сбалансированных классах;
3) PR-кривая фокусируется только на том, как модель работает с отрицательным классом;
4) измеряет общую эффективность модели; +
5) PR-кривая фокусируется только на том, как модель работает с положительным классом. +

16. Кривая «точность-полнота» демонстрирует удачный классификатор, если

1) стремится занять положение, при котором точка перегиба близка к точке с координатами (0;1) (верхний левый угол 1-й четверти координатной плоскости);
2) стремится занять положение, при котором точка перегиба близка к точке с координатами (1;1) (верхний правый угол 1-й четверти координатной плоскости); +
3) совпадает с биссектрисой угла 1-й четверти координатной плоскости;
4) располагается немного выше, чем биссектриса угла 1-й четверти координатной плоскости.

17. Критерий Хи-квадрат в лог-линейной регрессионной модели

1) помогает определить, насколько эффективно добавление новых предикторов улучшает модель; +
2) позволяет оценить, улучшает ли добавление определённых предикторов модель предсказательную способность по сравнению с базовой моделью (которая содержит только константу) и насколько значимо это улучшение; +
3) проверяет нулевую гипотезу о том, что уравнение в целом статистически незначимо;
4) используется для проверки статистической значимости влияния предикторов на зависимую переменную. +

18. Логистическая регрессия может быть описана следующими характеристиками

1) моделирует вероятности двух и более категориальных исходов; +
2) используется, когда целью является оценка вероятности только двух исходов событий;
3) определяет, какие из независимых переменных статистически значимо связаны с категориальным результатом; +
4) описывается одним линейным уравнением, которое прогнозирует количественную зависимую переменную.

19. Матрица ошибок содержит информацию

1) об истинном положительном результате классификации; +
2) о параметрах, по которым можно оценивать метрики качества модели; +
3) о прогнозе, полученном в ходе работы модели классификации; +
4) о причинно-следственных связях между зависимым и независимыми предикторами;
5) об истинном отрицательном результате классификации. +

20. Необходимым допущением логистической регрессии является

1) наличие мультиколлинеарности;
2) наличие выбросов;
3) отсутствие выбросов; +
4) независимость признаков в наборе данных; +
5) отсутствие мультиколлинеарности. +

21. Переменные модели бинарной логистической регрессии таковы, что

1) хотя бы одна из независимых переменных должна быть бинарная;
2) независимых предикторов может быть только два;
3) независимые и зависимая переменные должны быть категориальными, у которых должно быть всего по два исхода;
4) зависимая переменная является бинарной категориальной. +

22. Применение логистической регрессии оправдано в случае, если

1) зависимая переменная является категориальной и имеет три и более упорядоченных исхода; +
2) зависимая переменная является категориальной и имеет только два исхода; +
3) зависимая переменная является количественной;
4) зависимая переменная является категориальной и имеет три и более неупорядоченных исхода. +

23. Роль логистической регрессии в машинном обучении сводится к

1) разработке решающего правила для принятия решений с оценкой вероятностей исхода; +
2) установлению порогового значения предикторов; +
3) прогнозированию количественной зависимой переменной;
4) разработке бинарной классификации объектов. +

24. Свойства ROC-кривой

1) ROC-кривая определяет частоту верных отнесений к классу с отрицательным исходом;
2) ROC-кривая сравнивает частоту истинных и ложных положительных результатов при различных пороговых значениях; +
3) кривая, характеризующая качество бинарного классификатора; +
4) кривая зависимости истинно-положительной частоты от ложноположительной. +

25. Сила связи между предиктором и исходом установлена верно в следующих высказываниях

1) нет связи между предиктором и исходом, если ОШ=0;
2) более высокие значения предиктора увеличивают шансы на исход, если ОШ>1; +
3) более высокие значения предиктора увеличивают шансы на исход, если ОШ<1;
4) нет связи между предиктором и исходом, если ОШ=1. +

26. Специфичность по матрице ошибок — это

1) общая доля правильных прогнозов (как положительных, так и отрицательных);
2) доля истинно отрицательных результатов;
3) доля истинно положительных результатов;
4) доля истинных отрицательных значений среди всех отрицательных прогнозов. +

27. Уровни отсечения в бинарной логит-регрессии – это

1) пороговые значения уровня значимости;
2) это пороговые значения расчетной вероятности, определяющей принадлежность к одному из двух классов; +
3) количество потенциальных предикторов;
4) объем выборки, достаточный для того, чтобы построить лог-линейную модель.

28. Целью классификации является

1) предсказание значений зависимой переменной на основе значений независимых переменных (предикторов);
2) предсказание разницы между исходным классом и предсказанным;
3) выявление закономерности в размеченном наборе данных, где для каждого наблюдения уже известна правильная категория; +
4) расчет вероятности появления конечного события.

29. Чтобы определить оптимальное количество пациентов для модели логит-регрессии, необходимо применить правило

1) объем выборки должен быть в 10–20 раз больше, чем количество предикторов в модели; +
2) объем выборки может быть любым, это не влияет на результат;
3) объем выборки должен быть в 5 раз больше, чем количество предикторов в модели;
4) пациентов должно быть не менее 500.

30. Чувствительность по матрице ошибок

1) определяется долей истинно положительных результатов; +
2) определяется суммарной долей истинно правильных прогнозов, как положительных, так и отрицательных;
3) показывает, насколько хорошо предсказаны истинные положительные результаты; +
4) определяется долей истинно отрицательных прогнозов.

Ответы к тестам НМО: «Применение логистической регрессии и ROC-анализа в медицинских исследованиях»