ПОИСК Статьи Чертежи Таблицы Параметрические показатели связи из "Биометрия " Ковариация (сою) есть усредненная величина произведений (Лг—х) (г/г—у) отклонений каждой пары наблюдений от их средних, т. е. сою== 1/п)[Л(Хг—х) (у1—у)]. Очевидно, что величина этого показателя будет в значительной мере зависеть от того, насколько часто в общем ряду произведение хг—х) (г/.—у) будет иметь один знак — плюс или минус. В первом случае пары вариант должны отклоняться от своих средних в одном направлении (т. е. Х1 х и У1 Р или х1 х и у1 .у). В другом случае, если Х1 х, то у1 у или наоборот. При этом преобладание величин одного знака в принципе способствует большему абсолютному значению коэффициента ковариации, так как величины с разными знаками в сумме дают меньшую абсолютную величину. Среднее значение всех произведений указывает, в какой мере большим (или меньшим) значениям Хг соответствуют большие (или меньшие) значения г/г. [c.210] Коэффициент корреляции — отвлеченное число, лежащее в пределах от —1 до +1. При независимом варьировании признаков, когда связь между ними полностью отсутствует, г=0. Чем сильнее сопряженность между признаками, тем выше значение коэффициента корреляции. Следовательно, при г 0 этот показатель характеризует не только наличие, но и степень сопряженности между признаками. При положительной или прямой связи, когда большим значениям одного признака соответствуют большие же значения другого, коэффициент корреляции имеет положительный знак и находится в пределах от О до +1, при отрицательной или обратной связи, когда большим значениям одного признака соответствуют меньшие значения другого, коэффициент корреляции сопровождается отрицательным знаком и находится в пределах от О до —1. [c.211] Вычисление коэффициента корреляции. Это вычисление производят разными способами и по-разному в зависимости от числа наблюдений (объема выборки). Рассмотрим отдельно специфику вычисления коэффициента корреляции при наличии малочисленных выборок и выборок большого объема. [c.211] Пример 1. Изучали зависимость между массой тела гамадрг. лов-матерей и их новорожденных детенышей. Под наблюдениел находилось 20 обезьян. Результаты наблюдений и их обработка приведены в табл. 96. [c.212] Значения критических точек для разных уровней значимости и чисел степеней свободы k=n—2 приведены в табл. V Приложений. [c.214] В табл. V Приложений для a=20—2=18 и а=1% находим tst —2,88. Нулевую гипотезу отвергают на высоком уровне значимости (/ 0,01). [c.214] Достоверность выборочного коэффициента корреляции можно проверить по специальной таблице, в которой содержатся значения критических точек rst для уровней значимости а=5% и а=1% с учетом числа степеней свободы k — n—2. Так, для k= 8 и а=1% в табл. XVI Приложений находим г = 0,56. [c.214] Применим эту формулу к расчету коэффициента корреляции между жирномолочностью коров и их дочернего потомства (табл. 97). В данном случае объем выборки п=12 и Гд 1/=0,598. [c.214] В табл. V Приложений для А = 12—2 = 10 и а = 5% находим tst = 2,23. Так как t =2,b6 ist=2,23, нулевую гипотезу отвергают на 5%-ном уровне значимости (0,01 Р 0,05). Этот вывод подтверждается и при оценке величины Гху = О,Q20 с помощью табл. XXI Приложений, в которой для =10 и а=5% находим Гв =0,58. [c.215] Этот критерий используют в тех случаях, когда вместо коэффициента корреляции берут соответствующее ему число z. Нулевая гипотеза отвергается на принятом уровне значимости а и числе степеней свободы k—n—2. Значения критических точек ist приведены в табл. V Приложений. [c.216] Применение z-преобразования позволяет с большей уверенностью оценивать статистическую значимость выборочного коэффициента корреляции, а также и разность между эмпирическими коэффициентами корреляции г —r —dr, когда в этом возникает необходимость. [c.216] Минимальный объем выборки для точной оценки коэффициента корреляции. Только что рассмотренный пример показывает, с какой осторожностью следует делать заключение о статистической значимости выборочного коэффициента корреляции, вычисленного на малообъемных выборках. Очевидно, предпочтение в таких случаях следует отдавать оценке г по преобразованной величине z. [c.217] Это означает, что для окончательного решения вопроса о статистической значимости эмпирического коэффициента корреляции между жирномолочностью коров и их дочернего потомства необходимо увеличить число наблюдений по меньшей мере до п=17. [c.217] Классы, помещаемые в верхней строке таблицы, обычно располагаются слева направо в возрастающем порядке, а в первом столбце таблицы — сверху вниз в убывающем порядке. При таком расположении классов вариационных рядов их общие частоты (при наличии положительной связи между признаками X и У) будут распределяться по клеткам решетки в виде эллипса по диагонали от нижнего левого угла к верхнему правому углу решетки или (при наличии отрицательной связи между признаками) в направлении от верхнего левого угла к нижнему правому углу решетки. Если же частоты fxy распределяются по клеткам корреляционной Таблица 98 решетки более или менее равномерно, не образуя фигуры эллипса, это будет указывать на отсутствие корреляции между признаками. [c.218] Распределение частот fxy по клеткам корреляционной решетки дает лишь общее представление о наличии или отсутствии связи между признаками. Судить о тесноте или силе связи, ее направлении можно более или менее точно лишь по значению и знаку коэффициента корреляции. При вычислении коэффициента корреляции с предварительной группировкой выборочных данных в интервальные вариационные ряды не следует брать слишком широкие классовые интервалы. Грубая группировка гораздо сильнее сказывается на значении коэффициента корреляции, чем это имеет место при вычислении средних величин и показателей вариации. [c.218] Учитывая это обстоятельство, авторы известного руководства Теория статистики Дж. Юл и М. Кендэл (1960) рекомендуют избирать величину классового интервала не крупнее V20 вариационного размаха коррелируемых признаков, группировать димерную совокупность наблюдений не менее чем в 15—25 классов. Эта ценная рекомендация имеет, однако, один существенный недостаток она не согласуется с объемом выборки, не учитывает то, что между числом классов и величиной классового интервала Х существует определенное соотношение, в общем виде оно выражается формулой (1), в которой знаменатель К находится в зависимости от объема выборки п. Опыт показал, что в области корреляционного анализа величину К можно поставить в зависимость от объема выборки примерно следующим образом (табл. 98). [c.218] Как и другие статистические характеристики, вычисляемые с предварительной группировкой исходных данных в вариационные ряды, коэффициент корреляции определяют разными способами, дающими совершенно идентичные результаты. [c.219] Очевидно, что для определения коэффициента корреляции этим способом необходимо предварительно рассчитать средние арифметические X я у, также величины 1 fya y и 1 fxyaxay Пример 3, При проведении осеннего кросса на 10-километровую дистанцию и лыжных гонок спортсменов на дистанцию 5 км были получены результаты, которые сведены в табл. 99. Эти данные, выраженные в минутах, указывают на положительную зависимость между переменными У к X, где через У обозначены результаты лыжных гонок, а через X — результаты 10-километрового кросса. [c.219] Способ условных средних имеет преимущество перед способом произведений, так как позволяет избегать операции с дробными числами и придавать один и тот же (положительный) знак отклонениям а и йу, что упрощает технику вычислительной работы, особенно при наличии многозначных чисел. [c.221] Вернуться к основной статье