- 1. В качестве предикторов в модель логит-регрессии могут включаться переменные следующих типов
- 2. Валидация модели проводится
- 3. Выберите верное утверждение, касающееся метрик при оценке качества модели
- 4. Для коэффициентов логистической регрессии справедливы следующие высказывания
- 5. Для отбора предикторов в модель логит-регрессии необходимо, чтобы
- 6. Для отношения шансов в логистической регрессии справедливы следующие высказывания
- 7. Для оценки статистической значимости предиктора используют
- 8. Для подсчета отношения шансов в модели логит-регрессии используют формулу
- 9. Для теста Хосмера-Лемешоу справедливо утверждение
- 10. Индекс Юдена
- 11. Качество модели по ROC-анализу признается хорошим, если
- 12. Классификация объектов означает
- 13. Коэффициент Вальда в лог-регрессионной модели
- 14. Коэффициент корреляции Мэтьюса
- 15. Кривая «точность-полнота»
- 16. Кривая «точность-полнота» демонстрирует удачный классификатор, если
- 17. Критерий Хи-квадрат в лог-линейной регрессионной модели
- 18. Логистическая регрессия может быть описана следующими характеристиками
- 19. Матрица ошибок содержит информацию
- 20. Необходимым допущением логистической регрессии является
- 21. Переменные модели бинарной логистической регрессии таковы, что
- 22. Применение логистической регрессии оправдано в случае, если
- 23. Роль логистической регрессии в машинном обучении сводится к
- 24. Свойства ROC-кривой
- 25. Сила связи между предиктором и исходом установлена верно в следующих высказываниях
- 26. Специфичность по матрице ошибок — это
- 27. Уровни отсечения в бинарной логит-регрессии – это
- 28. Целью классификации является
- 29. Чтобы определить оптимальное количество пациентов для модели логит-регрессии, необходимо применить правило
- 30. Чувствительность по матрице ошибок
1. В качестве предикторов в модель логит-регрессии могут включаться переменные следующих типов
1) только бинарные переменные;
2) количественные и качественные, заранее преобразованные в фиктивные (бинарные) переменные; +
3) качественные в исходной кодировке, количественные;
4) качественные, количественные и даты;
5) переменные любых типов с исходным кодированием.
2. Валидация модели проводится
1) на всех полученных моделях в ходе анализа;
2) с целью проверки ее работоспособности на тестовой выборке; +
3) на обучающей выборке с целью ее обучения;
4) только на проверенных данных.
3. Выберите верное утверждение, касающееся метрик при оценке качества модели
1) точность чувствительна к дисбалансу классов;
2) AUC-ROC не завышает качество модели в условиях нарушения балансировки классов;
3) специфичность характеризует способность модели распознавать только один класс, и это является недостатком; +
4) AUC-PR «учитывает» отрицательные классификации.
4. Для коэффициентов логистической регрессии справедливы следующие высказывания
1) значение коэффициента логит-регрессии определяет его статистическую значимость;
2) отношение шансов для непрерывной и категориальной переменных интерпретируются одинаково;
3) для проверки статистической значимости коэффициентов логит-регрессии используется критерий Стьюдента;
4) они связаны с отношением шансов событий в группах, поэтому для вывода используется отношение шансов; +
5) они никак не интерпретируются. +
5. Для отбора предикторов в модель логит-регрессии необходимо, чтобы
1) все количественные непрерывные предикторы имели нормальное распределение;
2) после проведения юнивариантного ROC-анализа у отобранных предикторов уровень значимости был p<0,1; +
3) после проведения юнивариантного лог-регрессионного анализа у отобранных предикторов уровень значимости был p<0,05; +
4) после проведения юнивариантных лог-регрессионных, либо ROC-анализов уровень значимости должен быть p<0,05.
6. Для отношения шансов в логистической регрессии справедливы следующие высказывания
1) статистическая значимость ОШ проверяется по уровню статистической значимости р; +
2) отношение шансов (OШ) представляет собой отношение шансов события, происходящего в группе с исходом, к его шансам в другой группе (без исхода); +
3) для оценки влияния предиктора на исход используют сравнение отношение шансов с 0;
4) величина ОШ указывает на силу связи между предиктором и исходом. +
7. Для оценки статистической значимости предиктора используют
1) разницу остатков между фактическими и предсказанными по модели для каждого предиктора;
2) логарифм отношения шансов для каждого предиктора;
3) значение р для каждого предиктора в модели; +
4) 95% доверительный интервал ОШ. +
8. Для подсчета отношения шансов в модели логит-регрессии используют формулу
1) ширину интервала 95% ДИ ОШ, деленного пополам;
2) ОШ=p/(1-p), где р – вероятность наступления исхода; +
3) ОШ=EXP(Bi), где Bi – коэффициент предиктора в модели; +
4) P=1/(1+exp(-Z))).
9. Для теста Хосмера-Лемешоу справедливо утверждение
1) для оценки статистической значимости разницы частот используется точный критерий Фишера;
2) если p>0,05, то наблюдаемые и предсказанные частоты событий статистически значимо не различаются, и модель является хорошим классификатором; +
3) если p>0,05, то наблюдаемые и предсказанные частоты событий статистически значимо не различаются, и поэтому модель является плохим классификатором;
4) тест оценивает, соответствует ли наблюдаемая частота событий ожидаемой частоте в обеих классах. +
10. Индекс Юдена
1) объединяет чувствительность (способность теста правильно идентифицировать людей с заболеванием) и специфичность (способность правильно идентифицировать людей без заболевания) в одно значение; +
2) это разница между долей истинно положительных результатов (чувствительностью теста) и долей ложноположительных результатов; +
3) значение индекса Юдена выше 0,5 обычно считается неприемлемым;
4) указывает на идеальную чувствительность классификатора.
11. Качество модели по ROC-анализу признается хорошим, если
1) площадь под кривой ROC-AUC выше 0,7, а 95% ДИ ROC-AUC может быть любым;
2) нижняя граница 95% ДИ ROC-AUC будет выше 0,7; +
3) если AUC−ROC=0.5;
4) если AUC−ROC < 0.5.
12. Классификация объектов означает
1) произвольное распределение объектов на классы до начала исследования;
2) разделение признаков на несколько категорий и объединение похожих;
3) прогнозирование вероятности бинарного исхода;
4) моделирование, при котором объекты или наблюдения распределяются по одной из нескольких заранее определенных категорий на основе входных данных. +
13. Коэффициент Вальда в лог-регрессионной модели
1) может быть выше 0,05, что говорит об отсутствии статистической значимости предиктора, и тогда его нельзя включать в модель;
2) определяет статистическую значимость коэффициентов предикторов регрессии; +
3) определяет статистическую значимость отношения шансов;
4) может быть выше 0,05, что говорит об отсутствии статистической значимости предиктора, тем не менее его можно включить в модель. +
14. Коэффициент корреляции Мэтьюса
1) оценивает силу связи между зависимой и независимыми переменными;
2) изменяется в диапазоне от -1 до 1; +
3) используется для анализа мультиколлинеарности между предикторами;
4) применяется для оценки корреляции между фактическими и предсказанными моделью бинарными классификациями. +
15. Кривая «точность-полнота»
1) это график зависимости между точностью и полнотой классификатора при различных порогах принятия решения; +
2) позволяет получить адекватные результаты только на сбалансированных классах;
3) PR-кривая фокусируется только на том, как модель работает с отрицательным классом;
4) измеряет общую эффективность модели; +
5) PR-кривая фокусируется только на том, как модель работает с положительным классом. +
16. Кривая «точность-полнота» демонстрирует удачный классификатор, если
1) стремится занять положение, при котором точка перегиба близка к точке с координатами (0;1) (верхний левый угол 1-й четверти координатной плоскости);
2) стремится занять положение, при котором точка перегиба близка к точке с координатами (1;1) (верхний правый угол 1-й четверти координатной плоскости); +
3) совпадает с биссектрисой угла 1-й четверти координатной плоскости;
4) располагается немного выше, чем биссектриса угла 1-й четверти координатной плоскости.
17. Критерий Хи-квадрат в лог-линейной регрессионной модели
1) помогает определить, насколько эффективно добавление новых предикторов улучшает модель; +
2) позволяет оценить, улучшает ли добавление определённых предикторов модель предсказательную способность по сравнению с базовой моделью (которая содержит только константу) и насколько значимо это улучшение; +
3) проверяет нулевую гипотезу о том, что уравнение в целом статистически незначимо;
4) используется для проверки статистической значимости влияния предикторов на зависимую переменную. +
18. Логистическая регрессия может быть описана следующими характеристиками
1) моделирует вероятности двух и более категориальных исходов; +
2) используется, когда целью является оценка вероятности только двух исходов событий;
3) определяет, какие из независимых переменных статистически значимо связаны с категориальным результатом; +
4) описывается одним линейным уравнением, которое прогнозирует количественную зависимую переменную.
19. Матрица ошибок содержит информацию
1) об истинном положительном результате классификации; +
2) о параметрах, по которым можно оценивать метрики качества модели; +
3) о прогнозе, полученном в ходе работы модели классификации; +
4) о причинно-следственных связях между зависимым и независимыми предикторами;
5) об истинном отрицательном результате классификации. +
20. Необходимым допущением логистической регрессии является
1) наличие мультиколлинеарности;
2) наличие выбросов;
3) отсутствие выбросов; +
4) независимость признаков в наборе данных; +
5) отсутствие мультиколлинеарности. +
21. Переменные модели бинарной логистической регрессии таковы, что
1) хотя бы одна из независимых переменных должна быть бинарная;
2) независимых предикторов может быть только два;
3) независимые и зависимая переменные должны быть категориальными, у которых должно быть всего по два исхода;
4) зависимая переменная является бинарной категориальной. +
22. Применение логистической регрессии оправдано в случае, если
1) зависимая переменная является категориальной и имеет три и более упорядоченных исхода; +
2) зависимая переменная является категориальной и имеет только два исхода; +
3) зависимая переменная является количественной;
4) зависимая переменная является категориальной и имеет три и более неупорядоченных исхода. +
23. Роль логистической регрессии в машинном обучении сводится к
1) разработке решающего правила для принятия решений с оценкой вероятностей исхода; +
2) установлению порогового значения предикторов; +
3) прогнозированию количественной зависимой переменной;
4) разработке бинарной классификации объектов. +
24. Свойства ROC-кривой
1) ROC-кривая определяет частоту верных отнесений к классу с отрицательным исходом;
2) ROC-кривая сравнивает частоту истинных и ложных положительных результатов при различных пороговых значениях; +
3) кривая, характеризующая качество бинарного классификатора; +
4) кривая зависимости истинно-положительной частоты от ложноположительной. +
25. Сила связи между предиктором и исходом установлена верно в следующих высказываниях
1) нет связи между предиктором и исходом, если ОШ=0;
2) более высокие значения предиктора увеличивают шансы на исход, если ОШ>1; +
3) более высокие значения предиктора увеличивают шансы на исход, если ОШ<1;
4) нет связи между предиктором и исходом, если ОШ=1. +
26. Специфичность по матрице ошибок — это
1) общая доля правильных прогнозов (как положительных, так и отрицательных);
2) доля истинно отрицательных результатов;
3) доля истинно положительных результатов;
4) доля истинных отрицательных значений среди всех отрицательных прогнозов. +
27. Уровни отсечения в бинарной логит-регрессии – это
1) пороговые значения уровня значимости;
2) это пороговые значения расчетной вероятности, определяющей принадлежность к одному из двух классов; +
3) количество потенциальных предикторов;
4) объем выборки, достаточный для того, чтобы построить лог-линейную модель.
28. Целью классификации является
1) предсказание значений зависимой переменной на основе значений независимых переменных (предикторов);
2) предсказание разницы между исходным классом и предсказанным;
3) выявление закономерности в размеченном наборе данных, где для каждого наблюдения уже известна правильная категория; +
4) расчет вероятности появления конечного события.
29. Чтобы определить оптимальное количество пациентов для модели логит-регрессии, необходимо применить правило
1) объем выборки должен быть в 10–20 раз больше, чем количество предикторов в модели; +
2) объем выборки может быть любым, это не влияет на результат;
3) объем выборки должен быть в 5 раз больше, чем количество предикторов в модели;
4) пациентов должно быть не менее 500.
30. Чувствительность по матрице ошибок
1) определяется долей истинно положительных результатов; +
2) определяется суммарной долей истинно правильных прогнозов, как положительных, так и отрицательных;
3) показывает, насколько хорошо предсказаны истинные положительные результаты; +
4) определяется долей истинно отрицательных прогнозов.
