«Методика факторного анализа» 2 Содержание: Введение....................................................................................................... 3 Глава 1. Основные понятия факторного анализа ............................................... 4 Глава 2. Некоторые свойства факторного анализа ............................................ 10 Глава 3. Решение факторной системы ................................................................ 14 Заключение .................................................................................................. 20 Список использованной литературы ........................................................ 21 3 Введение Все явления и процессы хозяйственной деятельности предприятий находятся во взаимосвязи и взаимообусловленности. Одни из них непосредственно связаны между собой, другие косвенно. Отсюда важным методологическим вопросом в экономическом анализе является изучение и измерение влияния факторов на величину исследуемых экономических показателей. Под фактором понимается гипотетическая непосредственно не измеряемая , скрытая (латентная) переменная в той или иной мере связанная с исходными наблюдаемыми переменными. Факторный анализ (ФА) ( в широком смысле) - совокупность моделей и методов ориентированных на выявление, конструирование и анализ факторов по информации об их “внешних” проявлениях. К ним относятся: метод главных компонент, методы многомерного шкалирования, применяемые для формирования факторного пространства по информации о близости объектов, методы кластерного анализа при применении для построения неколичественных факторов. Факторный гипотетических анализ (в узком (ненаблюдаемых) смысле) факторов это методы выявления призванных объяснить корреляционную матрицу количественных наблюдаемых признаков. При этом предполагается, что наблюдаемые переменные являются линейной комбинацией факторов. 4 Глава 1. Основные понятия факторного анализа Под названием модели с латентными переменными будем понимать совокупность статистических моделей, описывающих и объясняющих наблюдаемые данные их зависимостью от ненаблюдаемых характеристик, которые могут быть сконструированы с помощью определенных математических методов. Модель факторного анализа является примером такой модели, в которой общие факторы являются латентными переменными. Модели с латентными переменными применяются при решении следующих задач1: a. понижение размерности признакового пространства в данных типа “объект-признак", b. классификация объектов на основе сжатого признакового пространства, c. косвенные оценки признаков, не поддающихся непосредственному измерению, d. преобразование исходных переменных к более удобному для интерпретации виду, e. создание структурной теории исследования объектов. В большинстве приложений ФА речь идет о выявлении в наблюдаемых признаках некоторой латентной (скрытой) переменной f, называемой фактором. Гипотеза о наличии этого фактора основано на предположении о существовании чего-то общего в наблюдаемых признаках. В случае существования только одного фактора суть ФА состоит в объяснении корреляции между наблюдаемыми признаками с помощью корреляции этих признаков с фактором . В общем Грищенко О.В. Анализ и диагностика финансово-хозяйственной деятельности предприятия. Таганрог, 2000, с. 178. 1 5 случае может быть несколько факторов между наблюдаемыми . Корреляция признаками обозначают и факторами . Величины называются факторными нагрузками и они образуют матрицу факторных нагрузок . Во многих приложениях ФА основная цель состоит в объяснении корреляционной матрицы признаков R ее матрицей факторных нагрузок A. Матрицу A находят численными методами, как правило, определяя собственные числа и векторы матрицы R при условии выполнения . Пример. Рассмотрим основные понятия на простом примере. Пусть дана матрица “объект -признак”, описывающая данные измерений n объектов из четырех переменных .2 Вычисленная корреляционная матрица матрицы наблюдений X равна . (7.1) Наблюдается тесная коэффициентом корреляции первыми двумя, а 2 связь между переменными = 0.72, переменная и с связана слабее с - не зависит от всех остальных переменных. Шеремет А.Д., Сайфулин Р.С. Методика финансового анализа. – М., Инфра-М, 2001, с. 111. 6 Целью факторного анализа является нахождение латентной переменной, так называемого фактора, который бы позволил воспроизвести наблюдаемую корреляционную матрицу с использованием соответствующей процедуры вычислений. корреляционную матрицу Редуцированную (преобразованную) можно воспроизвести с помощью вектора факторной нагрузки по уравнению3 . (7.2) Вектор =[0.90 0.80 0.50 0.05] представляет собой факторную нагрузку ненаблюдаемого фактора. В результате умножения матрицу , отличающуюся от Диагональные элементы матрицы получим диагональными элементами. (элементы в скобках) называются общностями. Общность i - того элемента будем обозначать через Величина . называется характерностью. Диагональные элементы исходной и редуцированной корреляционных матриц связаны соотношением 4 Таким . образом значения компонент вектора , называемых факторными нагрузками, воспроизводят все коэффициенты корреляции для четырех переменных. Фактор 3 4 непосредственно для измерения недоступен Кравченко Л. Анализ хозяйственной деятельности в торговле 7-е изд. М.: Новое знание, 2004, с. 152. Курс экономики под ред. Райзберга Б.А. – М., Инфра-М, 1999, с. 285. 7 - он гипотетичен. Факторный анализ призван для установления таких гипотетичных факторов. Из приведенного примера ясно, что прежде чем определить фактор нужно построить редуцированную корреляционную матрицу по значениям общностей. Оценка общностей составляют первую проблему факторного анализа, проблему общности. Второй проблемой является определение фактора. Это так называемая проблема факторов. В общем случае для объяснения корреляционной матрицы потребуется не один, а несколько факторов. Каждый фактор характеризуется столбцом, каждая переменная - строкой матрицы А. Фактор называется генеральным (general factor), если все его нагрузки значительно отличаются от нуля и он имеет нагрузки от всех переменных. Генеральный фактор имеет нагрузки от всех переменных и схематически такой фактор изображен на рис.7.1 столбцом .Фактор называется общим (common factor), если хотя бы две его нагрузки значительно отличаются от нуля. Столбцы , , на рис.1 представляют такие общие факторы. Они имеют нагрузки от более чем двух переменных. Если у фактора только одна нагрузка, значительно отличающаяся от нуля, то он называется характерным фактором (unique factor) (см. столбцы на рис.1. 8 Рис. 1. Схематическое изображение факторного отображения. Крестик означает высокую факторную нагрузку. Каждый такой фактор представляет только одну переменную. Решающее значение в факторном анализе имеют общие факторы. Если общие факторы установлены, то характерные факторы получаются автоматически. Число высоких нагрузок переменной на общие факторы называется сложностью (complexity). Например, переменная имеет сложность 2, а переменная - три. Итак мы пытаемся построить модель , где , (7.4) - ненаблюдаемые факторы k < p, - наблюдаемые переменные (исходные признаки), , - факторные нагрузки, на рис.1 9 - случайная ошибка связанная только с с нулевым средним и дисперсией , и , - некорpелированы , - некоррелированные случайные величины с нулевым средним и единичной дисперсией . Тогда . Здесь дисперсии - i-ая общность представляющая собой часть , обусловленная факторами, - часть дисперсии , обусловленная ошибкой. В матричной записи факторная модель примет вид X = AF + e, где матрица нагрузок, F- k - вектор факторов, e - вектор ошибок. , (7.7) где ошибок. - диагональная матрица порядка p, содержащая дисперсии 10 Глава 2. Некоторые свойства факторного анализа Факторный анализ, как и главные компоненты позволяет, сократить размерность признакового пространства. Оба метода являются эффективными способами исследовании взаимосвязей между переменными. Основное различие между этими методами заключается в том, что главные компоненты являются линейными функциями от наблюдаемых переменных, в то время как общие факторы не выражаются через комбинацию исходных признаков5. Главные компоненты не объясняют корреляции между переменными. В случае некоррелированных данных главных компонент не существует. Факторный анализ представляет корреляционную структуру в терминах гипотетической (латентной) модели, в то время как анализ главных компонент сокращает размерность за счет использования нескольких линейных комбинаций исходных переменных. Таким образом факторный анализ ориентирован на задачи, несколько отличные от задач главных компонент. В отличии от главных компонент факторный анализ (разложение матрицы Kx) нечувствителен к изменению шкал. Действительно, если умножаем каждую переменную xi на , то условия на дисперсия не изменяется , наши факторные нагрузки будут иметь вид , и вместо Kx будем иметь Rx, и , Грищенко О.В. Анализ и диагностика финансово-хозяйственной деятельности предприятия. Таганрог, 2000, с. 211. 5 11 . Факторное решение не единственно. Если В -ортогональная матрица (k k), то X=AF+L и разложение Х можно переписать . Но =I , поэтому за А взять АВ, а за F - и разложение Kx, примет прежний вид Последнее означает что имеется бесконечное число факторных нагрузок , удовлетворяющих исходным предпосылкам, структур (A, L2). Эту трудность можно преодолеть, если ввести на А ограничение. Рассмотрим матричное уравнение подробнее. В левой части уравнения с учетом симметрии число коэффициентов равно р(р+1)/2. В правой части р(k+1). Если k+1>(р+1)/2, то однозначное решение факторной задачи невозможно. Будем нормализовать постоянные А, полагая , , что эквивалентно ,что , где еще J - диагональная ограничений . В результате имеем ( ) матрица ,что накладывает 12 или Если , то система уравнений остается неопределенной Андерсен вывел другое соотношение единственности решения: при вычеркивании из А любой строки, оставшуюся часть матрицы можно было бы разделить на две подматрицы ранга k . Это условие дает такие же результаты, что и предыдущее уравнение. Отсюда случаи: p = 2 и k = 1; p=4иk=2 не допускают идентификации. коэффициентов Число независимых при заданном числе переменных p и максимальном числе факторов k для положительного числа степеней свободы приведено в табл. 1. Таблица 7.1. Число независимых коэффициентов p 3 4 5 6 7 8 9 10 12 20 40 k - 1 2 3 3 4 5 5 7 14 31 Число 3 6 10 15 21 28 36 45 66 190 780 коэффициентов 13 Максимально возможное число факторов, которое удается извлечь из данной корреляционной матрицы порядка p равно . 14 Глава 3. Решение факторной системы Основной моделью факторного анализа является уравнение , в котором вектор наблюдений x представляется в терминах и в виде некоторых соотношений p и числом общих факторов. Основное условие: - диагональная, - неотрицательно определенная матрица. Дополнительным условием единственности решения является диагональность матрицы . Имеется множество методов решения уравнения. Наиболее ранним методом факторного анализа является метод главных факторов, в котором методика анализа главных компонент используется применительно к редуцированной корреляционной матрице с общностями на главной диагонали. Для оценки общностей обычно пользуются коэффициентом множественной корреляции между соответствующей переменной и совокупностью остальных переменных6. Факторный анализ проводится исходя из характеристического уравнения, как и в анализе главных компонент = 0. Этот метод широко распространен, но постепенно уступает методу наименьших квадратов. Рассмотрим Решение задачи идентификации факторов модели МНК итерационным методом. Из всех решений выбираем только то, для которого - диагональная и все элементы упорядочены по убыванию и различны. Нужно найти такие 6 Кравченко Л. Анализ хозяйственной деятельности в торговле 7-е изд. М.: Новое знание, 2004, с. 165. 15 оценки матриц параметров , которые минимизируют сумму квадратов разностей между двумя соответствующими друг другу, т.е. стоящими на одинаковых местах, элементами ковариационной матрицы дисперсиями - и ковариациями и оценки ковариационной матрицы Иначе говоря, требуется минимизировать по элементам матриц . и функцию , где или . Если количество факторов k равно числу переменныхp, то вычисленные и наблюдаемые корреляционные матрицы совпадут. При использовании МНК считают, что k < p. Функционал можно представить как функцию и минимизировать эту функцию. При этом можно придерживаться следующего порядка действий. Теперь рассмотрим порядок решения уравнения. Имеется несколько численных алгоритмов реализации оценивания по методу наименьших квадратов. Среди них наиболее широко известны следующие алгоритмы: итерационный метод главных осей (или итерации повторной факторизации7, метод Ньютона-Рафсона, метод ориентированный на минимизацию остатка. Здесь мы рассмотрим подробно только первый метод. А. Итерационный метод главных осей. 7 Шеремет А.Д., Сайфулин Р.С. Методика финансового анализа. – М., Инфра-М, 2001, с. 178. Хармана, 16 1. вектора По матрице наблюдений “объект-признак” находим оценки средних и ковариационной матрицы , где , (7.19) . Информация, содержащаяся в корреляционной , может быть также представлена матрицей вектором стандартных - i-й диагональный элемент обратной матрицы , k - число отклонений и , где .8 2. Выбирается число факторов k. 3. По находим оценку , где факторов, p - число исходных переменных.. 4. на Заменяем у диагональные элементы , т. е. общностями и получаем редуцированную корреляционную матрицу . Ковалев К. В. Финансовый анализ: Управление капиталом. Выбор инвестиций. Анализ отчетности. М.:1995, с. 99. 8 17 5. Находим условный минимум по A при заданном . Отсюда ; ; ; ; ; . Отсюда Пусть - есть собственный вектор , матрицы собственные числа и . собственные векторы Условный экстремум равен . 7. Минимизируем полученную функцию . (7.25) по , т.е. находим 18 Заменив в матрицу А на получим второе приближение . 7. Находим матрицы с помощью главных компонент и т.д. В общем случае . Если элементы матрицы удовлетворяют условию , например, , то говорят о сходимости оценок характерностей и принимают матрицы и за конечные характеристики. В. Метод Ньютона-Рафсона. Будем минимизировать функционал одним алгоритмом. Представим этот функционал как функцию от A и L. . Минимизация , как и в методе главных осей, проводится в два этапа. Сначала находится условный экстремум по А при заданном L. Полученная функция минимизируется численно по L с помощью метода Ньютона-Рафсона9. Для минимизации функции нужны производные функции Первые производные функции по этому методу по L первого и второго порядков. равны Грищенко О.В. Анализ и диагностика финансово-хозяйственной деятельности предприятия. Таганрог, 2000, с. 233. 9 19 . Если все собственные числа матрицы близки к нулю, то вторые производные определяются по формуле . Основной алгоритм минимизации[60]. Пусть L обозначает вектор столбец с элементами и пусть h и H обозначают соответственно вектор столбец и матрицу производных Обозначим значение L на s-й итерации, а , и . - соответствующие вектор первых производных и матрица вторых производных. Тогда итерационная процедура Ньютона-Рафсона запишется в виде , где - вектор столбец поправок. Эта процедура проста для применений: основные вычисления на каждой итерации состоят в нахождении собственных чисел и собственных векторов и решении симметричной системы. ОМНК и ММП не зависят от масштабов измерений. Если признаки матрицы наблюдений Х подчиняются многомерному нормальному закону распределения а объемы выборок большие, то эти методы дают оценки с хорошими свойствами. Для обоих методов требуется положительная определенность матрицы ковариационной матрицы или . Метод же МНК этого условия не требует. корреляционной 20 Заключение Таким образом, при использовании регрессионного анализа акцент делается на выявлении веса каждого факторного признака, воздействующего на результат, на количественную оценку чистого воздействия данного фактора при элиминировании остальных. Существует и другой подход к исследованию структуры взаимодействия признаков, развивающийся в рамках факторного анализа. Этот подход основан на представлении о комплексном характере изучаемого явления, выражающемся, в частности, во взаимосвязях и взаимообусловленности отдельных признаков. Акцент в факторном анализе делается на исследовании внутренних причин, формирующих специфику изучаемого явления, на выявлении обобщенных факторов, которые стоят за соответствующими конкретными показателями. Факторный анализ не требует априорного разделения признаков на зависимые и независимые, так как все признаки в нем рассматриваются как равноправные. Здесь нет допущения о неизменности всех прочих условий, свойственного регрессионно-корреляционному анализу. Цель факторного анализа - сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристик явления, которые, однако, не поддаются непосредственному измерению (например, уровень аграрного развития). При этом предполагается, что наиболее емкие характеристики окажутся одновременно и наиболее существенными, определяющими. 21 Список использованной литературы: 1. Грищенко О.В. Анализ и диагностика финансово-хозяйственной деятельности предприятия. Таганрог, 2000. 2. Кравченко Л. Анализ хозяйственной деятельности в торговле 7-е изд. М.: Новое знание, 2004. 3. Шеремет А.Д., Сайфулин Р.С. Методика финансового анализа. – М., Инфра-М, 2001. 4. Ковалев К. В. Финансовый анализ: Управление капиталом. Выбор инвестиций. Анализ отчетности. - М.:1995. 5. Курс экономики под ред. Райзберга Б.А. – М., Инфра-М, 1999.