Record Details

"Mining Social Science Data: a Study of Voting of the Members of the Seimas of Lithuania by Using Multidimensional Scaling and Homegeneity Analysis"

Intellectual Economics

View Archive Info
 
 
Field Value
 
Title "Mining Social Science Data: a Study of Voting of the Members of the Seimas of Lithuania by Using Multidimensional Scaling and Homegeneity Analysis"
„Socialinių mokslų duomenų gavyba: Lietuvos Respublikos Seimo narių balsavimo analizė naudojant daugiamačių skalių metodą ir homogeniškumo analizę“
 
Creator Krilavičius, Tomas
Morkevičius, Vaidas
 
Subject Multidimensional scaling; Homogeneity analysis; Data mining; Data visualization; Similarity measures; Roll-call analysis; Parliamentary voting
C10; C15; C46; C65
daugiamačių skalių metodas; homogeniškumo analizė; duomenų gavyba; duomenų vaizdavimas; panašumo matai; balsavimų analizė; balsavimai parlamente
C10; C15; C46; C65
 
Description Multidimensional scaling (MDS) is a well known statistical and data mining technique. It is applicable for an exploratory data analysis and visualization in many different areas, such as economics, especially marketing, credit risk analysis, psychology and computer science. However, it suffers from some serious drawbacks, i.e. it depends on several subjective parameters: choice of data coding, similarity measures and modeling type. We demonstrate these drawbacks in a novel application of MDS analyzing a roll-call voting of the members of Lithuanian Parliament (MPs). We propose using a different technique allowing to escape from the mentioned problems in social science data mining, a homogeneity analysis. We briefly discuss it, illustrate its application on the same data and demonstrate its advantages over MDS. In the paper we concentrate on the technical and methodological aspects of the both methods, therefore, it can be easily reapplied to analyze various economic data, such as customers churn in telecommunications or customers groups in marketing. We discuss all the used tools, coding of votes, similarity measures, division (or non-division) of roll calls into the substantive periods, dimensionality of the solutions of MDS and homogeneity analysis as well as diverse visualization techniques. We compare different visualization techniques of the results of homogeneity analysis where most of the objects in the produced plots represent MPs: 2D and 3D object plots; span plots, where for each class of objects (in our case a faction) a minimal spanning tree is drawn; 2D and 3D star plots, where each object is connected with its class centroid. We conclude with recommendations for researchers modeling social science data and present our future plans regarding voting analysis.
Daugiamačių skalių metodas (MDS) yra gerai žinomas statistikoje ir duomenų gavyboje. Jis gali būti taikomas tiriamajai duomenų analizei ir rezultatų vaizdavimui daugelyje sričių, pvz. ekonomikoje, ypač marketinge, kredito rizikos analizėje, psichologijoje ir informatikoje. Deja, šis metodas turi ir tam tikrų trūkumų – jis priklauso nuo keleto subjektyviai parenkamų parametrų: duomenų kodavimo būdų, panašumo matų ir modeliavimo tipų. Šiame straipsnyje mes atskleidžiame MDS trūkumus, pritaikydami jį naujame kontekste, t. y. analizuodami Lietuvos Respublikos Seimo (LRS) narių balsavimus. Taip pat siūlome duomenų analizės metodą, leidžiantį išvengti minėtų problemų – homogeniškumo analizę. Straipsnyje trumpai apžvelgiamas šis metodas ir pademonstruojamas jo efektyvumas taikant jį tiems pat duomenims. Straipsnyje taip pat gana detaliai aptariami techniniai ir metodologiniai darbo aspektai, kad mūsų pademonstruotus metodus būtų galima lengvai pritaikyti kitose srityse, pvz. analizuojant ekonominius duomenis – klientų kaitą ryšio paslaugų bendrovėse ar klientų grupavimą marketinge. Aprašomi ir visi darbo etapai: naudoti įrankiai, balsavimų kodavimas, panašumo įvertinimo matai, balsavimų (ne)skaidymas į prasmingus periodus, MDS ir homogeniškumo analizės sprendinių dimensijų skaičiaus analizė bei įvairūs gautų rezultatų vaizdavimo būdai. Taip pat aptariami bei lyginami skirtingi homogeniškumo analizės rezultatų vaizdavimo metodai: objektų1 atvaizdavimas 2-matėje ir 3-matėje erdvėse (angl. object plot), minimalaus jungimo medis objektams (angl. span plot), objektų centroidų jungtys su objektais 2-matėje ir 3-matėje erdvėje (angl. star plot), Voronojaus mozaikos (angl. Voronoi plot) ir kiti. Straipsnis baigiamas rekomendacijomis darbams su socialinių mokslų duomenimis bei tolimesniais tyrimo planais.
 
Publisher Mykolas Romeris University
 
Contributor

 
Date 2013-09-09
 
Type info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion


 
Format application/pdf
 
Identifier https://www3.mruni.eu/ojs/intellectual-economics/article/view/816
 
Source Intellectual Economics; Vol 5, No 2 (2011): Intellectual economics; 224–243
Intelektinė ekonomika; Vol 5, No 2 (2011): Intellectual economics; 224–243
1822-8038
1822-8011
 
Language eng
 
Relation https://www3.mruni.eu/ojs/intellectual-economics/article/view/816/773
 
Rights Copyright (c) 2014 Intellectual Economics