p — ймовірність того, що подія Y відбудеться, p(Y=1) p/(1-p) це «відношення шансів» ln[p/(1-p)] це логарифм відношення шансів, або «логіт» всі інші компоненти моделі однакові.
Спосіб обчислення p-значень для лінійної та логістичної регресій пов’язаний із порівнянням дисперсії, яка спостерігається в наших моделях, із загальною дисперсією простого вгадування середнього кожного разу або більшості класів (наші базові моделі).
Як згадувалося раніше, logit(p) = log(p/1-p), де p дорівнює ймовірність того, що Y = 1. Y може приймати два значення: 0 або 1. P{Y=1} називається ймовірністю успіху. Отже, logit(p) = log(P{Y=1}/P{Y=0}). Це називається логарифмом шансів.
Отже, як саме знайти p-значення? Для простої регресії p-значення визначається за допомогою t-розподілу з n − 2 ступенями свободи (df), який записується як t n − 2 і обчислюється як 2 × площа минулого |t| під кривою t n − 2.
logit(p) = log(p/(1-p))= β0 + β2*мат. logit(p) = log(p/(1-p))= (β0 + β1) + (β2 + β3 )*мат. Тепер ми можемо зіставити результат логістичної регресії з цими двома рівняннями. Таким чином, ми можемо сказати, що коефіцієнт для математики є ефектом математики, коли жінка = 0.
P-значення розраховується з використанням вибіркового розподілу тестової статистики за нульовою гіпотезою, вибіркових даних і типу тесту, який виконується (тест з нижнім хвостом, тест з верхнім хвостом або двосторонній тест). P-значення для: тесту з нижнім хвостом визначається: p-значення = P(TS ts | H 0 вірно) = cdf(ts)