مقالات و پایان نامه ها

آناليز اجزای اصلی:پایان نامه ورشکستگی مالی در شرکت‌های توليدی

دانلود پایان نامه

– آناليز اجزای اصلی

آنالیز اجزای اصلی یک روش اختیاری چند متغیری است. اگر در جایی اجبار به انتخاب مهم‌ترین متغیر یا تعداد محدودی از متغیرها دریک مجموعه است، می‏توان از آنالیز اجزای اصلی کمک گرفت.

درواقع آنالیز اجزای اصلی یکی از مهم‌ترین روش‏های کاهش بعد محسوب می‌گردد.

روش‌های کاهش بعد، یک فضای چند بعدی را به یک فضای با ابعاد کمتر نگاشت می‌دهند. این روش‌ها به دو دسته خطی و غیر خطی تقسیم می‌شوند:

از روش‌های خطی می‌توان به تحلیل عاملی، DWT، PCA  DFT و … اشاره کرد.

از روش‌های غیر خطی هم می‌توان به: Principal Curves، Self Organizing Maps، Vector and Quantization، Genetic and Evolutionary Algorithms، Regression اشاره کرد.

آنالیز اجزای اصلی یکی از مدل‌های مهم تحلیل عاملی است، که هنگامی‌که هدف محقق تلخیص متغیرها و دستیابی به تعداد محدودی از آن‏ها برای به‌کارگیری در مدل بعدی باشد، از آن بهره گرفته می‏شود.

2-2-1-تحليل عاملی

تحلیل عاملی نامی عمومی است که برای برخی از روش‌های آماری چند متغیره که هدف اصلی آن خلاصه کردن داده‌هاست . این روش به بررسی همبستگی درونی تعداد زیادی از متغیرها می‌پردازد و در نهایت آن‏ها را در قالب عامل‌های عمومی محدودی دسته بندی کرده و تبیین می‌کند (کلانتری، 1389).

تحلیل عاملی ( برخلاف رگرسیون چندگانه ،تحلیل تشخیصی یا همبستگی کانونی که در آن یک یا چند متغیر وابسته و تعداد زیادی متغیر مستقل وجود دارد ) روشی هم وابسته بوده که در آن کلیه متغیرها بطور همزمان مد نظر قرار می‌گیرند . در این تکنیک ، هر یک از متغیرها به عنوان یک متغیر وابسته لحاظ می‌گردد .

این روش در دهه های اخیر به ویژه با عمومیت یافتن استفاده از رایانه در پژوهشات در سطح وسیع مورد استفاده محققان قرار گرفته است .

2-2-2-فرآيند تحليل عاملی

هدف اصلی تحلیل عاملی تلخیص تعداد زیادی از متغیرها در تعداد محدودی از عامل‌ها می‌باشد، به‌طوریکه در این فرآیند کمترین میزان گم شدن اطلاعات وجود داشته باشد . تحلیل عاملی کاربردهای مختلفی در تحلیل داده‌ها دارد که مهم‌ترین آن را می‌توان به شرح ذیل خلاصه کرد .

  • دستیابی به ابعادی که بصورت پنهانی در مجموعه وسیعی از متغیرها وجود دارد ولی به آسانی قابل مشاهده نمی‌باشند . این نوع تحلیل عاملی به تحلیل عاملی نوع R معروف است که در آن تعداد زیادی متغیر در تعداد محدودی از عامل‌ها خلاصه می‌شوند .
  • ابداع روشی برای ترکیب و تلخیص تعداد زیادی از افراد در گروه‌های مختلف در درون یک جامعه بزرگ. این روش به تحلیل عاملی نوع Q معروف است که در آن افراد یا موارد در تعدادی گروه طبقه بندی می‌شوند .
  • شناسایی متغیرهای مناسب از بین مجموعه وسیعی از متغیرها به منظور استفاده از آن‏ها برای تحلیل‌های بعدی در رگرسیون چندگانه ، یا تحلیل تشخیصی.
  • ایجاد مجموعه کوچک و کاملا” جدیدی از متغیرها که بطور کامل به جای متغیرهای اصلی در تحلیل‌های بعدی رگرسیون ، یا تحلیل تشخیصی مورد استفاده قرار گیرد .

رهیافت‌های اول و دوم به منظور شناسایی ابعاد یا عامل‌ها مورد استفاده قرار می‌گیرد . روش سوم با دستیابی به بارهای عاملی، آن‏ها را به عنوان پایه ای برای شناسایی متغیرها برای تحلیل‌های بعدی به وسیله سایر تکنیک‌های آماری قرار می‌دهد. روش چهارم ، رهیافتی است که از طریق آن مقادیر  عاملی محاسبه گردیده و سپس این مقادیر به عنوان متغیرهای مستقل در تحلیل رگرسیون یا تحلیل تشخیصی مور استفاده قرار می‌گیرد .

اگر هدف از پژوهش ، کاهش داده‌ها و خلاصه کردن آن‏هاست ، تحلیل عاملی تکنیک مناسبی برای آن می‌باشد . در این مرحله سئوالاتی که محقق باید از خود بپرسد این است که چه نوع متغیرهایی باید در تحلیل به کار گرفته شود ؟ چند متغیر در تحلیل باید مورد استفاده قرار گیرد ؟ نوع داده‌ها از نظر سطوح اندازه گیری چگونه باید باشد ؟ و حجم نمونه چقدر باید باشد ؟ در پاسخ به این سئوالات باید گفت که هر نوع متغیر مرتبط با مسئله پژوهش را می‌توان در تحلیل به کار گرفت. داده‌های خام برای تحلیل عاملی باید از نوع کمی باشند. اما در مواقعی می‌توان از متغیرهای مجازی با کدهای (0 و1 ) و غیر پارامتری یا کیفی نیز استفاده کرد.

یکی از روش‌های انتخاب متغیرهای مناسب برای تحلیل عاملی استفاده از ماتریس همبستگی است . از آنجا که اساس روش تحلیل عاملی بر همبستگی بین متغیرها اما از نوع غیر عاملی استوار است ، بنابراین در استفاده از این روش باید ماتریس همبستگی بین متغیرها نیز استفاده گردد . معمولا” این‌گونه ماتریس‌های همبستگی وجود رابطه بین برخی متغیرها و عدم ارتباط آن با برخی دیگر را نشان می‌دهند . این الگو در تحلیل عاملی موجب شکل گیری خوشه‌هایی می‌گردد که متغیرهای درون خوشه با یکدیگر همبستگی داشته و با متغیرهای خوشه های دیگر همبستگی نداشته باشند . توصیه می‌شود متغیرهایی که با هیچ متغیری همبستگی لازم را نداشته باشند از تحلیل حذف گردند .

در تحلیل عاملی مدل‌های مختلفی وجود  دارد که از میان آن‏ها دو روش تحلیل مؤلفه های اصلی و تحلیل عاملی مشترک از پرکارترین این روش‌هاست . انتخاب هر یک از این مدل‌ها به هدف محقق بستگی دارد . مدل تحلیل مؤلفه های اصلی زمانی مورد استفاده قرار می‌گیرد که هدف محقق تشخیص متغیرها و دستیابی به تعداد محدودی عامل برای هدف پیش بینی باشد . در مقابل ، تحلیل عاملی مشترک زمانی بکار می‌رود که هدف شناسایی عامل‌ها با ابعادی باشد که به سادگی قابل شناسایی نیستند .

بسته به دلایل استفاده از تکنیک تحلیل عاملی، محقق ممکن است با استفاده از عامل‌ها کار خود را به اتمام برساند و یا ممکن است به محاسبه مقادیر عاملی بپردازد تا داده‌هایی برای تحلیل‌های بعدی به وسیله سایر تکنیک‌های آماری به دست آید . اگر هدف ، ترکیب منطقی متغیرها و یا پاسخگویان باشد، در این صورت فرآیند تحلیل با تفسیر عامل‌ها پایان می‌یابد . اگر هدف شناسایی متغیرهای مناسب برای کاربردهای بعدی توسط سایر تکنیک‌های آماری باشد ، محقق ماتریس عاملی را مورد بررسی قرار داده و متغیرهایی که بیشترین بار عاملی را داشته باشند به عنوان جانشین برای بعد خاصی از عامل انتخاب می‌کند و اگر هدف ایجاد مجموعه کوچک کاملا” جدیدی از متغیرها به منظور جایگزین کردن متغیرهای اصلی برای استفاده از سایر تکنیک‌های آماری باشد ، مقادیر عاملی ترکیبی برای معرفی هر یک از عامل‌ها محاسبه می‌گردد . در این صورت مقادیر عاملی به عنوان داده های خام به جای متغیرهای مستقل در تحلیل رگرسیون ، تحلیل تشخیصی و غیره استفاده می‌گردد .

تحلیل عاملی مشترک و تحلیل مؤلفه های اصلی :

در تحلیل عاملی ، دو مدل اساسی وجود دارد که محقق می‌تواند از آن‏ها استفاده کند .  این مدل‌ها عبارتند از تحلیل عاملی مشترک و تحلیل مؤلفه های اصلی . برای انتخاب مناسب‌ترین مدل ، محقق باید یک نکته را در مورد انواع واریانس‌ها مورد توجه قرار دهد . با توجه به هدف تحلیل عاملی مجموعأ سه نوع واریانس وجود دارد :

  • واریانس مشترک
  • واریانس خاص
  • واریانس خطا

واریانس مشترک ، آن بخش از واریانس است که با سایر متغیرهای لحاظ شده در تحلیل سهیم می‌باشد . واریانس خاص واریانسی است که تنها به یک متغیر خاص مربوط می‌شود . واریانس خطا ناشی از بی اعتباری و ناپایایی در داده های جمع آوری شده و یا شانس و تصادف در اندازه گیری پدیده‌هاست . زمانیکه از تحلیل مؤلفه‌های اصلی استفاده می‌شود ، واریانس کل مد نظر قرار می‌گیرد و عامل‌های دو رگه ای استنتاج می‌شود که سهم کوچکی از واریانس خاص و واریانس خطا را شامل می‌شود ، اما این‌ها در حدی نیستند که ساختار عاملی کل را تحت تأثیر قرار داده و آن را تحریف یا منحرف کند .

نکته دیگر اینکه ، در تحلیل مؤلفه های اصلی ، مقادیر قطرهای ماتریس همبستگی 1 می‌باشند . برعکس در تحلیل عاملی مشترک مقادیر مشترکات در قطر ماتریس قرار می‌گیرد و عامل‌ها تنها بر اساس واریانس مشترک استنتاج می‌گردند . از نقطه نظر واریانس ، تفاوت زیادی بین قرار دادن مقادیر 1 در قطر ماتریس و قرار دادن مقادیر مشترکات در آن وجود دارد . با قرار دادن مقدار1 در قطر ماتریس واریانس کل به ماتریس عاملی وارد می‌گردد ، اما تحلیل عاملی مشترک مقادیر مشترک را در قطر ماتریس قرار می‌دهد و در نتیجه عوامل تنها بر اساس واریانس مشترک محاسبه می‌گردد .

هردو این مدل‌ها در سطح وسیع توسط محققان مورد استفاده قرار می‌گیرند . انتخاب هر یک از این مدل‌ها برای تحلیل داده‌ها به دو معیار مربوط می‌باشد:

  • هدف محقق از استفاده از تحلیل عاملی
  • میزان شناخت قبلی از واریانس موجود در متغیرها

زمانیکه ، محقق در صدد پیش بینی و تعیین کمترین تعداد عامل‌هاست که قادر باشد بیشترین واریانس موجود در مقادیر اصلی را تبیین کند ، و شناخت قبلی نیز وجود دارد که واریانس خاص و واریانس خطا سهم کمتری از کل واریانس را شامل می‌شود، در این صورت روش تحلیل مؤلفه‌های اصلی انتخاب مناسبی خواهد بود. در مقابل ، اگر هدف اولیه ، شناسایی ابعاد پنهان در متغیرهای اصلی باشد و محقق نیز شناخت کمتری از واریانس خطا و واریانس خاص دارد ، علاقمند است که این نوع واریانس را حذف کند . مناسب‌ترین مدل در این‌گونه مواقع تحلیل عاملی مشترک می‌باشد (کلانتری، 1389).

2-2-3-مراحل تکنيک آناليز اجزای اصلی

  • جمع آوری داده‌ها

با فرض اینکه PCA بر روی یک مجموعه داده های دوبعدی (X,Y) اعمال می‏شود، بعد از جمع آوری داده های این دو بعد، مراحل بعد اجرا می‌گردد.

  • محاسبه ماتریس کواریانس

ماتریس کواریانس برای داده های دو بعدی به شکل زی خواهد بود:

آناليز اجزای اصلی:پایان نامه ورشکستگی مالی در شرکت‌های توليدی

  • محاسبه بردارهای ویژه و مقادیر ویژه

در میان تمام بردارهایی که می‏توان ماتریس بردار را در آن ضرب کرد، بردارهایی وجود دارند که پس از ضرب، راستای آن‏ها تغییر نمی‏کند و فقط اندازه آن‏ها تغییر می‏کند، این بردارها را بردار ویژه می‏نامند. برای هر بردار ویژه یک مقدار ویژه نیز وجود دارد که بیان می‏کند اندازه آن بردار پس از تبدیل چند برابر خواهد شد.

 

FeatureVector: ماتریسی که شامل بردارهای ویژه به ترتیب مقادیر ویژه می‏باشد.

  • انتخاب مولفه‏های اصلی

درواقع پراکندگی داده‌ها در راستای بردارهایی که مقادیر ویژه بزرگ‌تری دارند، بیشتر است، در نتیجه، در این مرحله می‏توان بردارهای ویژه‏ای که مقادیر ویژه‏شان کمتر بوده را نادیده گرفت و درواقع کاهش بعد داد. بر اساس ملاک کیسر بردارهایی که مقادیر ویژه‏اشان کمتر از 1 است، حذف می‏گردند.

  • بدست آوردن داده های جدید

 

FinalData = RowFeatureVectore × RowDataAdjust

RowFeatureVectore (بردار ویژگی سطری) ترانهاده ماتریس ستونی از بردار‌های مشخصه هست، پس یک ماتریس سطری از بردار های مشخصه است. که در آن بردار‌های مشخصه پر اهمیت‌تر در بالا قرار دارند.

RowDataAdjust (داده های تعدیل شده سطری) ترانهاده اطلاعات تعدیل شده است. در هر ستون از مجموعه داده‌ها قرار دارد و هر سطر یک بعد جداگانه را نگهدار می‌کند.

FinalData مجموعه داده های نهایی با مجموع داده‌ها در ستون‌ها و همراه ابعاد سطرها است که منحصرا داده های اصلی را به ازای بردار های اصلی خواهد داد.

  • استفاده از داده های جدید در مدل بعدی

از داده های بدست آمده در مرحله بعد، بسته به نیاز محقق استفاده خواهد شد. در این پژوهش از داده‏های بدست آمده در مدل تحلیل پوششی داده‏ها استفاده خواهد شد.

قابل ذکر است در این پژوهش برای اجرای تکنیک آنالیز اجزای اصلی از نرم افزار StatistiXL استفاده می‏شود.

دانلود پایان نامه
92