Користење на анализа на кластери во Microsoft Excel

Pin
Send
Share
Send

Една од алатките за решавање на економски проблеми е кластерска анализа. Со негова помош, кластерите и другите предмети од низата на податоци се класифицираат во групи. Оваа техника може да се примени во Excel. Ајде да видиме како се прави ова во пракса.

Користејќи ја кластерската анализа

Со помош на кластерска анализа, можно е да се спроведе земање мостри според атрибутот што се проучува. Неговата главна задача е да се подели повеќедимензионална низа во хомогени групи. Како критериум за групирање, се користи коефициент на корелација на пар или растојание од Евклидон помеѓу предметите по даден параметар. Вредностите најблиски едни до други се групираат заедно.

Иако овој вид на анализа најчесто се користи во економијата, може да се користи и во биологијата (да се класифицираат животните), психологијата, медицината и во многу други области на човековата активност. Кластерната анализа може да се примени со помош на стандардната алатка за Excel за овие цели.

Пример за употреба

Имаме пет предмети кои се карактеризираат со два проучени параметри - x и г..

  1. Ние ги применуваме формулата за растојание од Евклид, на овие вредности, што се пресметува според образецот:

    = ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. Оваа вредност се пресметува помеѓу секој од петте предмети. Резултатите од пресметката се ставаат во матрицата за растојание.
  3. Ние гледаме помеѓу кои вредности е растојанието најмалку. Во нашиот пример, ова се предмети 1 и 2. Растојанието помеѓу нив е 4.123106, што е помалку од помеѓу сите други елементи на оваа популација.
  4. Комбинирајте ги овие податоци во група и формирајте нова матрица во која вредностите 1,2 делува како посебен елемент. При составување на матрицата, оставаме најмали вредности од претходната табела за комбинираниот елемент. Повторно гледаме, помеѓу кои елементи растојанието е минимално. Овој пат е 4 и 5како и предметот 5 и група предмети 1,2. Растојанието е 6.708204.
  5. Наведените елементи ги додаваме во генералниот кластер. Ние формираме нова матрица според истиот принцип како претходниот пат. Тоа е, ние ги бараме најмалите вредности. Така, гледаме дека нашиот сет на податоци може да се подели на две кластери. Првиот кластер ги содржи елементите најблиску едни до други - 1,2,4,5. Во вториот кластер во нашиот случај, претставен е само еден елемент - 3. Тоа е релативно далеку од другите објекти. Растојанието помеѓу јата е 9,84.

Ова ја комплетира постапката за поделба на населението во групи.

Како што можете да видите, иако генерално анализата на кластери може да изгледа како комплицирана постапка, всушност, разбирањето на нијансите на овој метод не е толку тешко. Главната работа е да се разбере основната шема на групирање.

Pin
Send
Share
Send