Как проанализировать связь между двумя категориями переменных?

Question

Как проанализировать связь между двумя категориями переменных?

INDOMITABLE Профи (881), открыт 4 недели назад

Как проанализировать связь между этими двумя категориями переменных?Корреляционный анализ не подходит

Answer 1

Александр Маймасов Мудрец (10966) 4 недели назад

Между ними нет связи! Они никак не связаны...

Answer 2

Это может быть логистическая регрессия с градацией в качестве двоичной зависимой переменной (1 для "Да" и 0 для "Нет") и расой в качестве независимой. Вы бы закодировали Race в виде пяти отдельных фиктивных (1/0) переменных, при этом каждый субъект в вашем наборе данных имел бы 1 в одной из этих переменных и 0 в четырех других. Затем вы должны запустить регрессию с одним из этих пяти макетов, опущенных в регрессии, в качестве эталонной категории. Вы бы использовали выходные данные, чтобы сделать выводы, например, о том, что шансы на получение высшего образования у студентов расы A на X% выше, чем у студентов расы B.
Существует модуль Scikit-Learn "LogisticRegression", который легко выполнит это вычисление (хотя это только для Python, а не для R, что может быть проблемой). Преимущество Scikit в том, что если вы хотите выполнить линейный SVC ... это легко, потому что это просто еще один модуль. Более того, если вы хотите оценивать данные в рамках ML framework, это простое расширение. Опять же, вам нужно будет немного изучить Python, чтобы импортировать ваши данные.
Традиционные статистические данные, такие как тесты Хи-квадрат и V Крамера, могут быть использованы для определения взаимосвязи между двумя категориальными признаками.
Проще говоря, при определенных величинах и степенях результат будет такой, что 5 к 1. Скажем, вот вы покупаете товар. Какова вероятность, что вы купите этот.

То есть люди купят скорее мороженное, чем кондиционер. Почему?
Потому что кондиционер более затратный и требует больше времени. Тоже самое и с едой. Если человек никуда не торопится, то приготовит еду сам за меньшие деньги и получит удовольствия от процесса. А в другом случаи ресторан. Поэтому цифра 1 содержит числа 2000, а 5 даже не дотягивает до 900. Значит все верно. Законы рынка таковы. Если брать доходность каждого дня и периода, мы получим график где будут показано все в процентном соотношении. Скажем, палатки с мороженным раскинутым по всей Москве, могут принести больше дохода за день, чем один проданный кондиционер в МВидео.

Answer 3

Петр Тарасов Высший разум (150144) 3 недели назад

Зависимость цены от этажа? Влияет ли этажность на стоимость?
Название темы исследования и его цель, укажите , пожалуйста.
Основные расчёты выполнил.
Тогда, можно предположить что ЦЕНА от высоты этажа НЕ зависит. ( чем выше этаж, тем ниже цена?)
А может быть, так? Средняя цена квартир(?) на нижнем (1) этаже ВЫШЕ чем средняя цена квартир на пятом)! Выбирайте сами!

INDOMITABLEПрофи (881) 3 недели назад

Исследуется возможная связь электропотребления в жилых помещениях ( значения в 1 столбце) с этажом, на котором они находятся ( в данном случай 1-й этаж и 5-й этаж)

INDOMITABLEПрофи (881) 3 недели назад

в 1 столбце переменные рассматриваются как зависимые, а во втором столбце категориальные переменные

Петр Тарасов Высший разум (150144) INDOMITABLE, спасибо, тогда переставляем столбцы, чтобы этаж была Х, а энергопотребление У. Вам даны два независимых исследования (этаж) и зависимая переменная - энергопотребление У. С любым критерием, которые я указал и работать. Вот мой аргумент: наблюдений в группах ровно по 10, что в одной, то и в другой. Следовательно, группы необходимо сравнить между собой.

Петр ТарасовВысший разум (150144) 3 недели назад

малых. 10 наблюдений- это малая выборка.

INDOMITABLEПрофи (881) 3 недели назад

Простите пожалуйста хочу как можно лучше понять, как вы рассчитали этот столбец?

Петр ТарасовВысший разум (150144) 3 недели назад

И по задаче: На первых этажах гораздо холоднее, чем на пятых и жителям приходится дополнительно обогревать ( тратить электроэнергию) помещение! Да, еще и солнца намного меньше ( в условиях городской застройки). Проверил свой вывод: вчера зашёл к знакомой, живущей на первом этаже (9-тиэтажного дома).
Очень сыро, дверь в подъезде постоянно открыта и впускает на первый этаж холодный воздух. Поэтому, на первом гораздо холоднее! Мы "СДЕЛАЛИ" эту задачу! Скажи, она очень интересная? Я такие люблю! С трудной "загогулиной"!

INDOMITABLE Профи (881) Петр Тарасов, можно ли уточнить при расчете t использовалась такая формула?

Петр ТарасовВысший разум (150144) 3 недели назад

Вторая формула применялась для расчёта несмещенной оценки среднего квадратичного.....для двух выборок.

Петр ТарасовВысший разум (150144) 3 недели назад

Обе выборки малые, известна несмещенная дисперсия и стандарт ( ср квадр отклонение), поэтому применили критерий Фишера- Снедекора, таблица есть не везд

е, поэтому посылаю

Петр ТарасовВысший разум (150144) 3 недели назад

Встроено а стены, счетчик. Бросаешь монету, включается обогрев. Но так как здесь, такого расхода э/э на обогрев нет. Дома типовые построены так, что летом в квартире нечем дышать. Осенью так, как пришлю попозже фото. Тепло только когда за окном -25 и ниже. Тогда ПОВЫШАЮТ ДАВЛЕНИЕ и помещение нагревается. Остальное, позже на фото будет. И сделай вывод, какие раньше были "строители" и проектировщики жилых зданий.