Luku 2 Data

Käytän tutkielmassa International Social Survey - projektin (ISSP) vuoden 2012 kyselytutkimusta “Perhe, työ ja sukupuoliroolit” (International Social Survey Programme: Family and Changing Gender Roles IV). Tutkimuksen aikaisempien toteutusten dataa on käytetty tutkielman tärkeimmissä lähteissä esimerkkidatana.

Länsi-Saksan ja USA:n tutkimuslaitosten yhteistyö vakiintui ISSP-organisaatioksi 1984 (http://www.issp.org). Vuonna 2015 neljän perustajajäsenen joukko oli kasvanut 49 maahan. Vertailevan tutkimuksen aineistoja on kerätty monista teemoista, perhearvoista ja naisten työmarkkina-asemasta neljä kertaa (1988, 1994, 2002, 2012). USA:n edustajana mukana ollut Tom W. Smith näkee aineistojen arvon juuri kansainvälisessä vertailevassa tutkimuksessa. Järjestön julkaisuluettelossa oli 2012 yli 5200 julkaisua. Viime vuosina luetteloon on lisätty noin 400 julkaisua vuodessa (Smith 2015).

Data ja dokumentaatio on vapaasti saatavilla saksalaisen GESIS-tutkimuslaitoksen ylläpitämästä data-arkistosta (https://www.gesis.org/en/issp/home). Suomessa tutkimuksen data ja dokumentaatio löytyvät Tampereen yliopiston Aila-tietoarkistosta (https://services.fsd.uta.fi/catalogue/FSD2820?tab=summary&study_language=fi).

GESIS-instituutin ”datakatalogista”(https://zacat.gesis.org) löytää kätevästi kaiken dokumentaation ja datan (ISSP 2016), mutta edes saksalaiset eivät voi estää www-sivustojen innokkaita uudistajia. Monet linkit lähdeluettelossa vievät GESIS-arkistosivulle, josta löytyy pitkä lista pdf-dokumentteja.

Taulukkoon 2.1 on koottu neljän tärkeimmän dokumentin tiedostonimet ja lyhyt kuvaus.

Taulukko 2.1: ISSP 2012: tärkeimmät dokumentit
dokumentti sisältö tiedosto
Variable Report Perusdokumentti, muuttujien kuvaukset ja taulukot ZA5900_cdb.pdf
Study Monitoring Report tiedokeruun toteutus eri maissa ZA5900_mr.pdf
Basic Questionnaire Maittain sovellettava kyselylomake ZA5900_bq.pdf
Contents of ISSP 2012 module substanssikysymykset taulukkona ZA5900_overview.pdf
Questionnaire Development kyselylomakkeen laatiminen ssoar-2014-scholz_et_al-ISSP_2012_Family_and_Changing.pdf

Tätä kirjoittaessa (10.11.2020) ISSP 2012 - aineisto löytyy osoitteesta [https://zacat.gesis.org/webview/index.jsp?object=http://zacat.gesis.org/obj/fStudy/ZA5900].

Koodikirja (“Variable report”) (GESIS 2016) selostaa tarkasti tietosisällön. Tutkimuksen seurantaraportti (“Study Monitoring Report”) (Gendall ja Randow 2016) kertoo miten tutkimus käytännössä toteutettiin. Kyselylomake (”ISSP 2012 - Family and Changing Gender Roles IV Basic Questionnaire” 2011), suomenkielinen versio (Tilastokeskus 2012) ja muut kieliversiot voivat olla hyödyllisiä. Tiedonkeruun tarkoitus ja kyselyn suunnittelun ideat kerrotaan omassa raportissa (Scholz ym. 2014).

2.1 Aineiston rajaaminen

Olen rajannut laajasta aineistosta 25 maata ja joukon muuttujia. Maat on valittu niin, että ne ovat suhteellisen samankaltaisia ja valitut muuttujat ovat niissä samanlaisia. Kysymyksissä on jonkin verran pieniä eroja, mutta joissain tapauksissa ero on merkittävä. Esimerkiksi Espanja on jostain syystä jättänyt tässä käytetyistä muuttujista ns. neutraalin (”en samaa enkä eri mieltä”) vastausvaihtoehdon pois, joten jätin Espanjan pois tutkielmani analyyseistä.

Substanssimuuttujat ovat yksi ”kysymyspatteri”, jolla luodataan asenteita naisten roolista työmarkkinoilla. Aiheen pysyvää ajankohtaisuutta kuvaa hyvin The Economist - lehden artikkeli Saksojen jälleenyhdistymisen 30-vuotispäivänä (3.10.2020, “A report…reveals the interplay between policy and attitudes that influences the decision to work.”). Artikkeli on maksumuurin takana mutta tutkimus on vapaasti luettavissa (DIW Weekly Report 38 / 2020, S. 403-410)

Taulukon 2.2 kysymysten lyhyet versiot ovat datassa mukana. Sarakkeessa “muuttuja” on alkuperäisen aineiston muuttujanimi, kysymyksen tunnus on valittuun dataan luotu muuttujanimi.

Taulukko 2.2: ISSP2012:Työelämä ja perhearvot - kysymykset
muuttuja kysymyksen tunnus, lyhennetty kysymys
V5 Q1a Working mother can have warm relation with child
V6 Q1b Pre-school child suffers through working mother
V7 Q1c Family life suffers through working mother
V8 Q1d Women’s preference: home and children
V9 Q1e Being housewife is satisfying
V10 Q2a Both should contribute to household income
V11 Q2b Men’s job is earn money, women’s job household
V12 Q3a Should women work: Child under school age
V13 Q3b Should women work: Youngest kid at school
SEX Respondents age
AGE Respondents gender
DEGREE Highest completed degree of education: Categories for international comparison
MAINSTAT Main status: work, unemployed, in education…
TOPBOT Top-Bottom self-placement (10 pt scale)
HHCHILDR How many children in household: children between [school age] and 17 years of age
MARITAL Legal partnership status: married, civil partership…
URBRURAL Place of living: urban - rural

Kyselylomakkeilla kysymykset olivat hieman pidempiä. Kuva 2.1 on osa suomenkielistä lomaketta.

Suomenkielinen lomake

Kuva 2.1: Suomenkielinen lomake

Valituista taustamuuttujista monet on kerätty haastattelulla. Tiedonkeruu, otantamenetelmät ja yksikkövastauskadon (unit non-response, otokseen valitulta ei saada mitään tietoja) huomioiminen on tehty joka maassa omalla tavallaan. Aineistoissa on mukana painot, joilla tulokset voidaan korottaa perusjoukon tasolle, mutta kansainvälisiä vertailupainoja ei syystä tai toisesta ole. Taustamuuttujat kuten koulutustaso on harmonisoitu vertailukelpoisiksi.

Tutkimuksen kohdeperusjoukko on 18-vuotiaat tai sitä vanhemmat, poikkeuksina Suomi (15 - 74 vuotiaat), Islanti, Japani, Etelä-Afrikka ja Venezuela.

Jos ohitetaan pienet erot kysymyksissä ja vastausvaihtoehdoissa jäljelle jää erävastauskato. Erävastauskadolla tarkoitetann tilannetta, jossa joihinkin kysymyksiin ei vastata. Esimerkiksi Ranskassa yli 20 prosenttia kieltäytyi vastaamasta lasten lukumäärää kysyttäessä (HHCHILDR), ja aika moni kieltäytyi vastaamasta myös muihin perherakenteeseen liittyviin kysymyksiin. Tässä tutkielmassa monimuuttujakorrespondenssianalyysiä käytetään puuttuneisuuden analyysiin.

Poistin aineistosta havainnot, joissa tieto iästä tai sukupuolesta puuttuu (32969-32823 = 146 havaintoa).

Aineiston luokittelu- ja järjestysasteikon muuttujat muunnetaan R-ohjelmiston factor-tietotyypiksi. Teen muunnokset useammassa vaiheessa heti kun data on luettu SPSS-tiedosta. Käsittelyssä pyrin noudattamaan helposti toistettavan tutkimuksen periaatteita (McNamara ja Horton 2018). Koodi ei saisi olla kovin virhealtista (”haurasta”) ja tarkistuksia tehdään paljon. Data-analyysin ja ehkä erityisesti korrespondenssianalyysin idea on kuitenkin operoida matriiseilla, lisätä ja poistaa rivejä ja sarakkeita ja rakennella mutkikkaampia matriiseja yksinkertaisemmista. Analyysivaiheessa koodi muuttuu hauraammaksi.

Aineisto ja korrespondenssianalyysi

Michael Greenacre on käyttänyt aineistoa eri vuosilta luentomateriaaleissa kuten Helsingissä 2017 (M. Greenacre 2017) ja ainakin kahdessa oppikirjassaan ((Greenacre 2010), (M. J. Greenacre 2017)). ISSP - aineistoa vuodelta 1989 on käytetty myös neljän singulaariarvohajoitelmaan perustuvan menetelmän vertailuun (Greenacre 2003). Blasius ja Thiessen (Blasius ja Thiessen 2006) arvioivat aineiston laatua ja maiden vertailtavuutta vuoden 1994 aineistolla.

Sukupuoliroolien (gender roles) ja niihin liittyvien asenteiden vertailevaa kansainvälistä (cross-cultural) tutkimusta on tehty paljon. Tutkimusongelman sisällöllisten ja teoreettisen kysymysten nykytilaa kuvaa tuore artikkeli (Walter 2018).

Ferragina ja Seeleib-Kaiser (2015) tutkivat ensin 18 OECD-maan perhepolitiikan muutoksia kolmen viime vuosikymmenen ajalta. Näkökulma on työllisyyspolitiikka ja menetelmänä monimuuttuja-korrespondenssianalyysi (MCA). Havaituille kehityssuunnille etsitään toisessa vaiheessa selityksiä. Aineistona on viisi kansainväliseen vertailuun soveltuvaa aineistoa, yhtenä niistä ISSP:n data kolmelta kierrokselta (1988,1994,2002).