Корреляционный анализ.
- 23.03.24 г.
- 9772225665000     24009


А. В реальных условиях на любой объект или процесс имеется множество воздействий, вклад каждого из которых в чистом виде учесть порой очень сложно, особенно с учетом других воздействий и в совокупности с ними. Практически любое воздействие во времени может зависеть от всех других или только от ряда из них, а может и вообще не зависеть. Поэтому на практике принято ограничиваться изучением зависимости одного воздействия и математическим ожиданием другого. В таком случае речь может идти об изменении не только значения воздействия, но и его закона распределения, или о так называемой статистической связи, вычисление которой, особенно в чистом виде, достаточно сложно. Более того, необходимо решить ряд вопросов:
– какое воздействие следует принять за зависимое, а какое за независимое,
– обычно имеет место зависимость от совокупности разных воздействий, и нельзя утверждать, что можно обнаружить причину зависимого воздействия, тем более, одну причину, скорее, имеют место взаимосвязанные следствия, поэтому в большинстве случаев следует искать имеющую место статистическую зависимость.
    Однако, что важно и что послужило основой корреляционного анализа, так это то, что все же можно прогнозировать изменение выбранного (зависимого) воздействия от других (понимаемых как независимые). Тогда главная задача корреляционного анализа – это определение соотношений между воздействиями (случайными переменными) за счет вычисления, оценки и проверки значимости коэффициентов корреляции и оценки частных коэффициентов корреляции.
    Поэтому особенностями и предпосылки корреляционного анализа являются следующие:  
– переменные величины – значения воздействий – должны быть случайными,
– случайные величины должны иметь совместное нормальное распределение.
    В итоге корреляционный анализ может оценить функцию регрессии одной случайной переменной (фактора, признака) на другую (термин «фактор» применяется нами в концептуальном смысле, а «переменная» – в обычном, количественном).
    Или, в корреляционном анализе на основе оценок параметров совокупности объектов можно получить оценки степени связи между переменными и можно оценить регрессию одной переменной на другую.


Б. Корреляционный анализ концептуально достаточно прост (речь идет не о его математическом аппарате), и в принципе при изложении методов обработки данных его можно было бы просто упомянуть, предложив читателям самим изучить его. Однако этот анализ данных (метод обработки данных) следует акцентировать, так как именно при его диалектическом исследовании (напомним, оно отлично от научного тем, что выявляются сущностные аспекты) был обнаружен момент (в терминах диалектики – свойство), который важен для решения одной из главных задач Раздела, что будет обсуждаться отдельно.

Итак, корреляционный анализ – это статистический метод (группа статистических методов), позволяющий определить корреляционные зависимости между воздействиями, переменными, т.е. на его основе определяется, существует ли корреляционная зависимость между ними и насколько она сильна; иными словами, корреляционный анализ предназначен для определения степени (тесноты, силы) связи между двумя или более переменными – он дает ответ на вопрос о том, как связаны между собой переменные в изучаемых выборках.
    Дело в том, что корреляционная зависимость (корреляционная связь)  
– может быть вызвана одной скрытой переменной или несколькими,
– может отсутствовать: наблюдаемая зависимость случайна.
    Корреляционная зависимость отражает согласование изме­нения переменных (двух или более), т.е. то, что изменение одной переменной находится в соответствии с изменением дру­гой, или то, что при изменении значения одной переменной возможно закономерное изменение (уменьшение или увеличение) другой переменной.
    Их можно изучать только на основе представительных выборок методами математической статисти­ки.
    Они не могут рассматриваться как акт наличия причинно-следственной зависимости, а свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, т.е. корреляционная зависимость отражает лишь статистическую взаимосвязь. Или задача корреляционного анализа – установить, являются ли данные случайные величины взаимосвязанными.
    Таким образом, применение корреляционного анализа имеет условия – указанное ограничение и ряд других, например, следующих:
– наличие большого количества наблюдений переменных,
– многомерное нормальное распределение значений всех переменных,
– качественная однородность исходной совокупности значений.

Корреляционный анализ дает возможность установить, соответственны ли наборы данных, в основном, по величине, т.е. если большим значениям одного набора данных (признака) соответствуют большие значения данных другого набора, то говорят, что имеет место положительная корреляция, а если малым значениям одного набора соответствуют большие значения данных другого набора – отрицательная корреляция. Если данные не имеют того или другого соответствия – нулевая корреляция или близкая к нулю корреляция.
    Степень связи измеряется с помощью интервальной или относительной шкал, она определяется по абсолютному значению (т.е. не зависит от ее «направленности») и фиксируется соответствующим коэффициентом.
    Корреляционные зависимости различаются, в основном, по форме, направлению и степени (силе).

Наглядное представление о связи переменных дает график: в простейшем случае каждый объект представляет собой точку, координаты которой заданы значениями двух переменных. Таким образом, множество объектов представляет собой на графике множество точек. По конфигурации этого множества точек можно судить о характере связи между двумя переменными:
– наклон – направление связи,
– ширина – степень связи (о ней можно судить по тому, насколько тесно расположены точки вокруг линии регрессии).


В. Виды корреляции:
– простая и сложная, или множественная,
– положительная, нулевая и отрицательная,
– сильная и слабая,
– линейная и нелинейная,
– ранговая,
– с прямой или обратной связью,
– ложная,
– частная.
    Отдельно остановимся на последних двух видах.
    Ложная корреляция. Повторимся, если между двумя переменными установлена тесная зависимость, то из этого еще не следует их причинная взаимообусловленность: тесная зависимость может возникнуть в силу влияния ряда неучтенных факторов, и смысл истинной связи может искажаться. В целях ее выявления используют частные корреляции.
    Частная корреляция. Если две переменные коррелируют, то всегда можно предположить наличие их общей причины – некой третьей переменной. Для проверки этого предположения следует исключить влияние этой третьей переменной и вычислить корреляцию двух рассматриваемых переменных без учета влияния третьей; такая корреляция называется частной.


Г. Коэффициент корреляции – количественная мера соотношения переменных, величина которого варьируется в пределах от –1 до +1 в зависимости от вида корреляции. Чем больше модуль коэффициента, тем степень связи сильнее. Таким образом, коэффициент корреляции позволяет понять, насколько тесная связь существует между переменными.
    В общем случае применяют следующие коэффициенты корреляции:
– коэффициент корреляции Пирсона,
– коэффициент конкордации (коэффициент Кендалла),
– коэффициент ранговой корреляции Спирмена,
– коэффициент корреляции знаков Фехнера,
– множественный, или совокупный, коэффициент корреляции,
– выборочный коэффициент корреляции,
– частный коэффициент корреляции.


В. Достоинства корреляционного анализа следующие:
– коэффициенты корреляции относительно просты в подсчете,
– их применение не требует специальной математической подготовки.

Для диалектики наибольшую ценность представляет то, что корреляционный анализ имеет диалектические моменты, игнорируемые в науках и которые поэтому следует обсудить в дискуссиях.


См. «Математическое представление вещи и ИТ».

 

Дискуссии и конференции. Методы