Search for content and authors
 

Wybór parametrów normalizacyjnych i miary odległości a hierarchiczne grupowanie aglomeracyjne obiektów

Barbara Pawełek 

Akademia Ekonomiczna w Krakowie, Katedra Statystyki (AE), Rakowicka 27, Kraków 31-510, Poland

Abstract

Głównym celem proponowanego referatu jest podzielenie się wynikami teoretycznych rozważań dotyczących wpływu wyboru parametrów normalizacyjnych i miary odległości na wyniki grupowania obiektów z wykorzystaniem hierarchicznych metod aglomeracyjnych. Metody te można opisać centralną procedurą aglomeracyjną. Przedstawiony zostanie zatem schemat postępowania przedstawiający działanie tej procedury, w którym można zauważyć zasadniczą rolę relacji między dwiema wielowymiarowymi odległościami przy podejmowaniu decyzji o połączeniu, w danym powtórzeniu, dwóch skupień. To spostrzeżenie pozwoli nawiązać w rozważaniach do prowadzonych przez autorkę badań nad wpływem wyboru formuły normalizacyjnej i miary odległości na relację między wielowymiarowymi odległościami.

Zgodnie z ideą omawianych metod, w każdym powtórzeniu etapów centralnej procedury aglomeracyjnej, w celu m.in. prześledzenia „losów” badanych obiektów, rejestruje się, które skupienia zostały połączone, ich skład oraz, jaka była wielowymiarowa odległość między nimi. W badaniach należy liczyć się z możliwością otrzymania różnych wniosków w zależności od podjętych decyzji, co do wyboru: wstępnego uporządkowania liniowego obiektów, formuły normalizacyjnej, miary odległości oraz hierarchicznej metody aglomeracyjnej.

W wystąpieniu zaprezentowany będzie przykład pokazujący powyższe możliwości/zagrożenia. Analizie poddanych będzie: 5 wybranych wariantów parametru skalującego, 3 wybrane odległości, tzn. miara miejska, Euklidesa i Czebyszewa oraz 7 wybranych kombinatorycznych hierarchicznych metod aglomeracyjnych.

W świetle wniosków z zaprezentowanych rozważań, w przypadku analizowania „ścieżki połączeń” dla wybranego obiektu lub wyboru jednego spośród uzyskanych podziałów, jako najlepiej reprezentującego grupy podobnych obiektów, mogą zrodzić się wątpliwości, co do uniwersalności, wiarygodności, dopuszczalności, czy też trafności wniosków wyciąganych z tego typu analiz. Autorka uważa, że reakcją na te wątpliwości powinien być świadomy wybór takich statystycznych narzędzi, jak formuły normalizacyjne, miary odległości, czy też taksonomiczne metody. Śledzenie zmian w połączeniach skupień, w zależności od decyzji podjętych na wcześniejszych etapach badania porównawczego i poszukiwanie odpowiedzi na pytania: dlaczego otrzymuje się różne przyporządkowania; dlaczego dotyczą one tylko wybranych obiektów; czy przyczyny tych odmienności są do zaniedbania, czy też są ważną informacją o kształtowaniu się badanego złożonego zjawiska ekonomicznego w rozważanej zbiorowości; mogą być pomocne w uzyskiwaniu bardziej wiarygodnych wniosków.

 

Legal notice
  • Legal notice:
 

Presentation: Oral at XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS, Sympozjum A, by Barbara Pawełek
See On-line Journal of XVI KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS

Submitted: 2007-04-15 21:12
Revised:   2009-06-07 00:44