Андрей Исаченко
Ученик
(117)
2 часа назад
Сначала вычислим условные средние. Для каждого значения X вычислите среднее Y, учитывая частоту появления в классе для каждого Y. Например, если X=2 имеет частоты классов 4 и 5 для Y=3 и 13 соответственно, рассчитайте (3*4 + 13*5)/9. Также сделайте подобное для всех X. Повторите то же самое для Y, вычисляя средние X при каждом зафиксированном Y.
Затем вычислите коэффициент корреляции для двух переменных X и Y. Сначала вычислите центральное значение X и Y для всей таблицы, затем их средние значения (дисперсию) и диапазон значений каждой переменной. Вычислите ковариацию, то есть насколько X и Y движутся в унисон от своих средних значений. Разделите ковариацию на произведение квадратного корня из дисперсии X и квадратного корня из дисперсии Y. Это даст вам силу корреляции; если полученное число близко к 1 или -1, корреляция сильная, а если к 0 - слабая.
Теперь постройте уравнения регрессии. Чтобы получить Y из X, сначала получите из диаграммы рассеяния прямую линию, которая делит область так, что почти все точки попадают на одну сторону. Эта линия имеет наклон, который дает значение углового коэффициента; разделите ковариацию на дисперсию X, затем пересечение получается из усечения ствола; вычтите среднее Y из общего произведения, где склонность - это среднее значение X, контролирующее выход, и это будет Y, добавьте константу C в уравнении Y = наклон * X + C. Сделайте обратное для остального.