Факторный анализ.
- 28.01.24 г.
- 9772225665000     24003


Как было отмечено, в наступившем семестре будет обсуждаться начало темы тотальной организации методов, отличной от классификации или иного научного распределения методов по группам, исходя из того, что было обретено понимание а) одной из особенностей обработки вообще данных (методов), отсутствующей в науках, это – различенность (методов), и б) одной из характеристик, это – опосредствование. Они важны для решения одной из главных стоящих сейчас задач – установление собственной определенности со-организации методов, но это особенность, поэтому сначала необходимо установить некоторую единичность, или характерный признак тотальной организации методов – их взаимосвязи. Показать его в целом удобнее всего при анализе факторного анализа, а детали могут быть обсуждены в дискуссиях.

(Статья сформирована на основе многочисленных общедоступных источников информации, в силу чего, в частности, некоторые термины обобщены для согласованности текста.)


Общие положения.

Факторный анализ – это многомерный метод, применяемый для изучения взаимосвязей между значениями множества переменных исследуемого предмета, когда предполагается, что известные (наблюдаемые, или первичные, или исходные) переменные, значения которых регистрируются тем или иным образом, зависят от меньшего количества неизвестных (латентных, вторичных, или скрытых) переменных и случайной ошибки.
    Факторный анализ был создан для выделения отдельных компонент исследуемого предмета из многомерных данных по различным критериям, в первую очередь, скрытых факторов (что, кстати, является одной из основных задач информационных технологий).
    Факторный анализ предназначен для того, чтобы
– выявить факторы, отвечающие за наличие линейных статистических корреляционных связей между наблюдаемыми переменными,
– всесторонне, как можно более полно, но в то же время компактно описать предмет.
    Если кратко, то факторный анализ позволяет строить иерархию коррелирующих показателей и объединять их в более крупные группы.
    Факторный анализ используется в самых различных областях человеческой деятельности и в науках: медицине, экономике и т.д.
    При анализе оценок, полученных по нескольким критериям, можно предположить а) их сходство между собой и наличие коэффициента корреляции, и б) существование некоторой латентной переменной, с помощью которой можно объяснить наблюдаемое сходство полученных данных и выводов. Такую латентную переменную называют фактором.
    Факторы могут быть количественными и качественными.
    Факторы могут иметь различную значимость.
    Конкретный фактор, который наиболее значимо влияет на другие переменные, приводит к выводу о возможности и необходимости выделить его как наиболее общий, наиболее приоритетный.
    Факторный анализ позволяет находить в совокупности первичных переменных некоторые вторичные переменные – факторы. Или, если кратко, с помощью факторного анализа из всей совокупности первичных переменных выделяются независимые друг от друга их совокупности, внутри которых переменные связаны сильнее, чем переменные, относящиеся к разным совокупностям. (Налицо отличие от формирования кластеров.)
    Таким образом, суть факторного анализа заключается в выделении вторичных переменных, или факторов, определяющих корреляции между первичными переменными.
    При анализе в один фактор объединяются сильно коррелирующие между собой переменные, и, как следствие, происходит перераспределение дисперсии между компонентами, и получается максимально простая и наглядная структура факторов. После объединения корреляция компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить другие латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей.

Основные понятия факторного анализа.
    Два основных понятия факторного анализа: 
– фактор – скрытая переменная,
– нагрузка – корреляция между исходной переменной и фактором,
– выходные переменные – это реакции (отклики) на воздействие входных переменных,
– параметр оптимизации,
– связи.
    Факторы принято представлять геометрически в системе осей координат, относительно которых каждый эксперимент, замер, тест, может быть изображен в виде точки.
    Обычно оси ортогональны, перпендикулярны друг другу, но иногда кластеры экспериментов располагаются таким образом, что лучшего соответствия используемым критериям удается достичь при использовании косоугольных осей. 
    Исходная таблица корреляций определяет лишь положение экспериментов относительно друг друга, т.е. положение осей координат не фиксировано данными. Те же точки можно нанести на плоскость с любым расположением координатных осей, поэтому при проведении факторного анализа обычно вращают оси до тех пор, пока не получают наиболее приемлемого и легко интерпретируемого отображения.
    Когда факторы коррелируют между собой, имеется возможность «факторизовать факторы» и получить факторы второго порядка, или общий фактор
    Возможны факторы третьего порядка.

Характеристики факторов.
    Факторы имеют две основные характеристики:
– объем объясняемой дисперсии,
– нагрузки.
    В идеальной ситуации вся дисперсия может быть объяснена рядом главных факторов со своими долями. В обычной ситуации может наблюдаться два или более главных факторов, а также имеется часть неинтерпретируемой дисперсии (геометрические искажения), исключаемая из анализа, как говорят, по причине незначимости (однако лучше сказать – по причине неизвестности их качества наукам).
    Нагрузки с точки зрения геометрии есть проекции точек на оси (ОХ, ОУ и т.д.).
    Проекции – это коэффициенты корреляции, точки – наблюдения. Таким образом, факторные нагрузки являются мерами связи.
    Нагрузки могут обладать свойством биполярности – наличием положительных и отрицательных показателей в одном факторе. Если биполярность присутствует, то показатели, входящие в состав фактора, дихотомичны и находятся в противоположных координатах.

Требования к факторам.
    Основное требование к факторам – управляемость.
    Под управляемостью понимается установление нужного значения фактора и поддержание его в течение всего времени исследования предмета. В этом состоит особенность исследования предмета.
    Суть еще несколько требований к факторам:
– совместимость,
– независимость,
– однозначность,
– точность установления граничных значений факторов.
– операционная определенность.

Критерии определения факторов.
    Существует несколько часто употребляемых критериев определения факторов:
– собственных чисел,
– отсеивания.
– значимости,
– доли воспроизводимой дисперсии,
– интерпретируемости и инвариантности.
    Некоторые из них являются альтернативными по отношению к другим, а часть этих критериев можно использовать вместе, чтобы один дополнял другой.

Цели и задачи факторного анализа.
    Две основных цели факторного анализа:
– определение взаимосвязей между переменными,
– сокращение числа переменных необходимых для описания данных.
    Или основная цель факторного анализа – это упрощение описания предмета (данных) посредством сокращения числа переменных или сокращение размерности данных.
    Факторный анализ позволяет решить следующие задачи (в целом совпадающих с этапами проведения факторного анализа, см. ниже):
– обнаружение факторов,
– отбор факторов для анализа исследуемых показателей,
– классификация факторов,
– обнаружение (моделирование) взаимосвязей между результативными и факторными значениями,
– определение степени влияния каждого из факторов на изменение величины результирующего значения,
– анализ роли каждого из показателей,
– практические использование факторной модели.

Виды факторного анализа.
    Основными видами факторного анализа являются: 
– детерминированный, или функциональный (результативный критериальный показатель, представляющий собой произведение частных или алгебраическую сумму факторов), и стохастический, или корреляционный (при наличии между результативным и факторными показателями неполной или вероятностной связи),
– прямой, или дедуктивный (от общего к частному), и обратный, или индуктивный (от частного к общему),
– статический и динамический,
– ретроспективный и перспективный,
– одноступенчатый и многоступенчатый.
    Факторный анализ может быть:
– разведочным – он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках;
– конфирматорным (подтверждающим), предназначенным для проверки гипотез о числе факторов и их нагрузках.

Условия применения факторного анализа.
    Практическое выполнение факторного анализа начинается с проверки его условий.
    В обязательные условия факторного анализа входят следующие:
все признаки должны быть количественными,
– число экспериментов должно быть не менее чем в два раза больше числа переменных,
– выборка должна быть однородна,
– исходные переменные должны быть распределены симметрично,
– факторный анализ осуществляется по коррелирующим переменным.

Исполнение факторного анализа.
    Концептуально, факторный анализ, независимо от используемых методов, начинается с обработки корреляционной матрицы, полученной из опытов, а заканчивается получением факторной матрицы, т. е. таблицы, показывающей вес или нагрузку каждого из факторов по каждому эксперименту.
    Функционально, факторный анализ реализуется через перераспределение дисперсии (между компонентами факторов) согласно выбранному методу, или через процедуру вращения факторов (см. выше).
    Целью ортогональных вращений является определение простой структуры факторных нагрузок.
    Целью большинства косоугольных вращений является определение простой структуры вторичных факторов; косоугольное вращение следует использовать в частных случаях. 
    При ортогональных вращениях каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, поэтому факторы оказываются независимыми, некоррелированными друг от друга.
    Косоугольные вращения – это преобразование, при котором факторы коррелируют друг с другом. Преимущество косоугольного вращения состоит в следующем: когда в результате его выполнения получаются ортогональные факторы, то есть уверенность, что эта ортогональность действительно им свойственна, а не привнесена искусственно.
    Существует более 10 методов вращения в обоих видах. 
    Практика показывает следующее: если вращение не произвело существенных изменений в структуре факторного пространства, то это свидетельствует о его устойчивости и о стабильности данных.
    Возможны еще два варианта:
– сильное перераспределение дисперсии – результат выявления латентного фактора,
– очень незначительное изменение или его отсутствие, при этом сильные корреляции могут иметь только один фактор, – однофакторное распределение, которое возможно, например, когда на предмет наличия определённого свойства проверяются несколько групп объектов, однако искомое свойство есть только у одной из них.

Этапы факторного анализа:
– установление цели проведения расчетов,
– обнаружение факторов,
– отбор факторов, которые непосредственно или косвенно влияют на конечный результат,
– классификации и систематизация факторов для комплексного исследования,
– обнаружение (моделирование) зависимости между выбранными параметрами и конечным показателем (результатом),
– расчет (определение) степени воздействия факторов и оценка роли каждого из них на изменение величины результата,
– практические использование факторной модели.

Методики факторного анализа.
    Детерминированный анализ позволяет выявить логику воздействия основных факторов, проанализировать их влияние в количественных значениях. В результате можно понять, какие факторы следует изменить для повышения эффективности.
    Его преимущества: универсальность, простота, легкость использования, поэтому он применяется часто.
    Стохастический анализ позволяет проанализировать существующие косвенные связи. Он предназначен для исследования опосредованных факторов. Метод используется в том случае, если невозможно найти прямые связи. Стохастический анализ считается дополнительным. Он используется только в некоторых случаях.

Методы факторного анализа.
    Группы методов факторного анализа:
– методы детерминированного факторного анализа:
– методы стохастического факторного анализа:
    Графоаналитический метод определения значимости факторов позволяет провести отсеивающий эксперимент при минимальном числе опытов. Он позволяет, основываясь только на экспериментальных данных определить не только степень влияния факторов на результирующую функцию, но и сделать предварительные выводы о том, как влияют факторы (в сторону увеличения или уменьшения результирующей функции).
    Метод главных компонент (МГК – principal component analysis, PCA) считается многими учеными основным методом факторного анализа.
    МГК предназначен для выявления наиболее значимых факторов и, как следствие, факторной структуры.
    Суть МГК состоит в замене коррелированных компонентов некоррелированными факторами.
    Важной характеристикой МГК является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов.
    Достоинство МГК в том, что он (единственный) математически обоснованный метод факторного анализа.
    МГК позволяет уменьшить размерность данных, потеряв наименьшее количество информации.
    Вычисление главных компонент может быть сведено к вычислению сингулярного разложения матрицы данных или к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных
    МГК часто рассматривают как частный случай факторного анализа, когда все специфические факторы приняты равными нулю, а общие факторы ортогональны.
    Хотя по утверждению ряда исследователей МГК не является методом факторного анализа, поскольку не расщепляет дисперсию индикаторов на общую и уникальную.
    МГК применяется во многих областях, в том числе, в эконометрике, биоинформатике, обработке изображений, для сжатия данных, в общественных науках.

Недостатки факторного анализа.
    Основной проблемой факторного анализа является выделение и интерпретация главных факторов. При отборе компонент исследователь обычно сталкивается с существенными трудностями, так как не существует однозначного критерия выделения факторов, и потому здесь неизбежен субъективизм интерпретаций результатов.

Некоторые выводы.
    Необходимо отметить, что факторный анализ обладает существенным диалектическим свойством, рассмотренным Гегелем в его труде «Наука логики», что делает факторный анализ важным для диалектики, причем в смысле как проведения исследований, так и развития диалектической методологии.
    Факторный анализ в определенном смысле дополняет кластеризацию, что делает его важным для формирования диалектической системы методов.
    Оба этих положения будут обсуждены в дискуссиях.

 

См. См. «Математическое представление вещи и ИТ», «Т: Целое и части в реальности», «Т: Сравнение анализов» и «Регрессионный анализ и диалектика».

 

Дискуссии и конференции. Методы