Bozsonyi Károly
INVARIANCIAELVEK A SZOCIOLÓGIAELMÉLETBEN ÉS AZ EMPIRIKUS KUTATÁSBAN
Matematikai-szociológiai értekezés*



“Addig nincs bizonyosság, amíg az
ember nem alkalmazhatja valamelyik
matematikai tudományt, vagy valamit,
ami a matematikai tudományokkal
összefügg.”

(Leonardo da Vinci)



Dolgozatomban a kontextuális elemzésben leggyakrabban alkalmazott modellek ismertetésével és az alkalmazásukkor felmerülõ módszertani problémákkal foglalkozom.

Elsõsorban matematikai tulajdonságaik alapján kívánom csoportosítani az alkalmazott modelleket, a szakirodalomban bevett és általam javasolt szempontok szerint.

Az új osztályozási szempont alapján bemutatok egy, a klasszikustól nagymértékben eltérõ modellt, és ezt részletesen diszkutálom mind elméleti, mind empirikus tulajdonságai szerint.


Az invariancia fogalma és elméleti jelentõsége

Bizonyos transzformációkkal szemben invariánsnak nevezünk egy matematikai modellt akkor, ha a transzformáció végrehajtása után a modell struktúrája nem változik meg, így a kapott eredmények is lényegében függetlenek ezektõl a transzformációktól.

A szociológiában használatos matematikai modellekkel szemben joggal fogalmazzuk meg azt a követelményt, hogy a változók kódolásában jelentkezõ önkény ne legyen hatással a modell alapján levont következtetéseinkre. Azaz a változók át-kódolása ne vonhassa maga után a következtetéseink megváltozását. Szeretnénk, ha a modelljeink kódolás-érzéketlenek, vagyis az átkódolásnak megfelelõ transzfor-mációkra (a változók lehetséges értékeinek permutációcsoportjára) invariánsak lennének.

Amint azt az alábbiakban bebizonyítom, a kontextuális elemzésben használatos regressziós modellek nem invariánsak a változók átkódolását jelentõ permutációcsoportra, így a belõlük levont következtetések sem lehetnek megbízhatóak, hiszen egy másik kódolással esetleg teljesen más következtetésre juthatnánk ugyanazokból az adatokból kiindulva.

Bemutatok és részletesen diszkutálok egy invariáns modellosztályt is.


A kontextuális elemzésben alkalmazott modellek matematikai szempontú osztályozása

A kontextuális elemzésben különbözõ statisztikai eljárásokat alkalmaztak és alkalmaznak, mint például: többdimenziós kereszttáblák elemzése, grafikus módszerek, variancia-kovariancia elemzés, regresszióelemzés. Az invariancia értelmezése a regressziós modellek esetén végezhetõ el legkézenfekvõbben, ezért a továbbiakban csak ezekkel a modellekkel foglalkozom.


Modellek a független változóban jelentkezõ kontextuális hatásra
(Csoportösszetétel modell)

Mielõtt a modell formális ismertetésébe bocsátkoznánk, célszerûnek tûnik szociológiai jelentésének és jelentõségének tisztázása.

Ez a modell arra a szituációra referál, mikor a cselekvõk viselkedését saját tulajdonságaikon túl egy rájuk jellemzõ, a modellben független változóként kezelt tulajdonság adott kontextusbeli eloszlása is befolyásolja. (A gyakorlati alkalmazások során gyakran nem áll rendelkezésre és/vagy nincs is szükség a teljes eloszlásra, hanem az adott változó mérési szintjétõl függõen annak elsõ momentumát – relatív gyakoriság, várható érték – használják.) Példa lehet erre a helyzetre, ha egy iskolában a tanulók teljesítményét személyes képességeiken túl az osztályukban mutatkozó fiú–lány arány is befolyásolja. A modell általános alakja:

Yij = f (Xj), (1)

ahol az Yij az Y változó értéke a j. kontextus i. egyedénél, és az aláhúzás az átlagot jelöli. Feltételezve azt, hogy az egyéni szintû összefüggés lineáris, és az adott kontextusban mindössze két csoport van, az (1) egyenlet a következõ explicit alakot ölti:

Yij = bl Xij + b2 (1 – Xij) + eij. (2)

Az eij a hibatag és Xij az egyén csoport-hovatartozását jelöli (Xij =1, ha a j. kontextus (osztály) i. egyede fiú, és 0, ha lány), bl és b2 az egyik, illetve a másik csoport hatását fejezi ki Yij -re.

Ha csak a j. csoportra számított átlagok (arányok) állnak rendelkezésre, akkor a (2) egyenlet kisebb matematikai átalakítások után a következõképpen alakul:

Yj = b2 + (b1 – b2) Xj + Ej. 3)

A kontextuális hatást azzal veszik figyelembe, hogy b1 és b2 Xj -nek a függvénye:

Yj = b2  (Xj) + { b1(xj) – b2 (Xj)} Xj + Ej.  (4)

A legegyszerûbb lineáris esetben ez a függés a következõ alakú lehet:

b1 = c1 + d1 Xj (4a)
b2 = c2 + d2 Xj (4b)

Tehát b1 és b2, azaz a fiúk, illetve lányok tanulmányi átlaga egyrészt saját nemüktõl függ, ezt fejezi ki cl és c2, másrészt a nemek arányától az osztályban, ezzel kapcsolatos a d1és d2.

A (4a) és (4b) egyenletek (3)-ba helyettesítésével az egyenlet algebrai átalakítása után a következõ kifejezésre lehet jutni:

Yj = (dl – d2)Xj2 + (cl – c2 + d2)Xj + c2 + Ej. (5)

A modellben szereplõ paraméterekre adott különbözõ megszorításokkal a kontextuális hatás különbözõ modelljeihez lehet jutni. Mivel ez a problémakör Moksony Ferenc hivatkozott mûvében részletesen ki van dolgozva, ismertetésétõl itt eltekintek.

Ehelyett egy, a modellek invarianciatulajdonságain nyugvó osztályozást vezetek be.


Invariáns és nem invariáns modellosztályok

Vizsgáljuk meg, hogyan viselkedik az (5) egyenlettel megadott modell tiszta kontextusok (fiú-, illetve leányosztályok) esetén. Elõször is vegyük észre, hogy Xj 0 vagy 1 lesz attól függõen, hogy a j. kontextust megadó osztály kizárólag fiúkból vagy lányokból áll-e.

Az (5) egyenlet fiúosztályok esetén (Xj =1) a következõ alakra egyszerûsödik:

Yj = d1 + c1 + Ej. (5a)

Azaz a tiszta fiúosztályok teljesítménye függ mind az egyéni, mind a kontextuális hatást leíró paraméterektõl.

Lányosztályok esetére (Xj = 0) a következõ összefüggést kapjuk:

Yj = c2 + Ej. (5b)

Azaz tiszta lányosztályokban nincs kontextuális hatás. Ez persze tisztán empirikus kérdés, de jó okunk van föltételezni, hogy a társadalomban vannak olyan szituációk, amikor a független változó szerinti homogén csoportok kontextualitás tekintetében ugyanúgy viselkednek. Márpedig az (5) egyenlethez rendelhetõ modell nem ilyen. Ráadásul, ha a fiúk és lányok kódolását felcseréljük, akkor – az elõzõ eredménnyel homlokegyenest ellenkezõleg – a tiszta fiúosztályokból tûnik el a kontextuális hatás, és a lányosztályokban marad meg.

Ezt az invarianciaproblémát a következõ modellel hidalhatjuk át. Induljunk ki most is a (3) egyenletbõl, és továbbra is maradjunk a lineáris közelítés mellett, a kontextuális hatást kifejezõ (4a) és (4b) egyenleteket azonban definiáljuk át a következõ módon:

b1 = c1 + d1 Xj (6a)
b2 = c2 + d2 (1 – Xj). (6b)

Ezeket (3)-ba helyettesítve a következõt kapjuk:

Yj= c2 + d2 (1 – Xj) + { (c1 + d1 Xj ) – (c2 + d2 (1 – Xj))} Xj + Ej. (7)

A zárójelek fölbontása és átrendezés után a következõ egyenletet kapjuk:

Yj= (d1+ d2 )Xj2 + (c1- c2 -2d2) Xj+c2+d2+Ej. (8)

Ezek után vizsgáljuk meg, hogy a (8) egyenlet valóban invariáns modellt határoz-e meg.

Elõször tekintsük a tiszta fiúosztály (X1 = 1) esetét. Ekkor (8) a következõ alakra redukálódik:

Yj = d1 + c1 + Ej. (8a)

Ez megegyezik (5a)-val.

Lássuk, mi a helyzet tiszta leányosztály esetén:

Yj = d2 + c2 + Ej (8b)

Ez eltér (5b)-tõl, hiszen itt homogén leányosztályok esetében is föllépett a kontextuális paraméter. (8a) és (8b) összevetése mutatja, hogy csak a paraméterek numerikus értékeiben térnek el egymástól, struktúrájukban nem, tehát a (8) egyenlettel megadott modell invariáns az átkódolást jelentõ transzformációra. Nézzük meg, mit jelent ez formálisan. Az eddigiektõl eltérõen, a fiúkat kódoljuk 0-nak, a lányokat 1-nek.

Ez formálisan a következõ transzformációval adható meg:

X'ij = 1 – Xij és X'j = 1 – Xj. (9)

Erre a transzformációra a (8) egyenlet a következõ alakot ölti:

Y'j = (d1 + d2)Xj2 + (c2 – c1 – 2d1)Xj + c1 + dl + Ej. (10)

Amint látható, az átkódolás hatására csak annyi történt, hogy d1 felcserélõdik a d2-vel, a c1 pedig a c2-vel. Mindez teljesen ésszerû, hiszen most a kettes indexû paraméterek vonatkoznak a fiúkra és az egyes indexûek a lányokra. Ha ugyanezt a transzformációt (átkódolást) végrehajtjuk a nem invariáns (5) modellen, a következõ eredményt kapjuk:

Y'j = (d1 – d2)Xj2 + (c2 – c1 + d2 – 2d1) Xj + c1 + d1 + Ej. (11)

Amint látható, a (11) egyenlet nagyon különbözik az (5)-tõl, azaz a modell nem invariáns, és érzékeny a kódolásra.

Mielõtt az invariáns modell részletes diszkussziójába kezdenénk, a következõ táblázatban összehasonlítjuk az (5) és (8), valamint a transzformált (10) és (11) modellek együtthatóit.

 

Xj2 együtthatója

Xj együtthatója

konstans

 (5) modell

d1– d2

c1 – c2 + d2

c2

(11) transzformált modell

d1 – d2

c2 – c1 + d2 – 2 d1

c1 + d1

 (8) modell

d1 + d2

c1 – c2 – 2 d2

c2 + d2

(10) transzformált modell

d2 + d1

c2 – c1 – 2 d1

c1 + d1



Tekintettel arra, hogy a mérések során (ha csak az aggregált adatok állnak rendelkezésre) egy parabolát kapunk, a parabola pedig egy háromparaméteres görbe, általános esetben nem határozható meg a modellnek mind a négy szabad paramétere, ugyanis a rendelkezésünkre álló egyenletrendszer alulhatározott.


Az invariáns modell részletes diszkussziója

Alulhatározott egyenletrendszerek megoldása a paraméterekre kirótt megszorítások bevezetésével válik lehetõvé. Annak függvényében, hogy mely paraméterekre milyen megszorításokat alkalmazunk, a kontextuális hatás különbözõ modelljeit kapjuk.

A diszkusszió során kapott eredményeket mindig összevetjük majd az (5) modell diszkussziója során kapott eredményekkel.


a) Tiszta egyéni hatás

A magyarázott változó csak az egyének személyes tulajdonságaitól függ, nincs kontextuális hatás. Ennek a modellnek a következõ paraméterválasztás felel meg: d1 = d2 = 0 és c1 ¹ c2. Aggregált adatok esetén a következõ regressziós egyenletet kapjuk:

Yj = (c1– c2) Xj + c2 + Ej. (12)

A modellben szereplõ összes paraméter az aggregált adatokból is meghatározható. Ez az eredmény megegyezik az (5) modellbõl származóval.


b ) Tiszta kontextuális hatás

A magyarázott változó kizárólag a kontextustól függ, az egyének személyes tulajdonságaitól nem, ennek a következõ paraméter-specifikáció felel meg:

d1 = d2 = d ¹ 0, továbbá c1 = c2 = c.

Ekkor a (8) modellbõl a következõket kapjuk:

Yj = 2dXj2 – 2d Xj + c + d + Ej. (13)

Most az (5) modelltõl merõben különbözõ eredményt kaptunk, hiszen ott a tiszta kontextuális hatást leíró egyenlet is lineáris, ezért a tiszta egyéni és a tiszta kontextuális hatás nem különböztethetõ meg. Itt viszont a tiszta kontextuális hatást leíró egyenlet másodfokú, így megkülönböztethetõ a tiszta egyéni hatás esetétõl. Mivel a (13) egyenletben szereplõ paraméterek száma kettõ, és a parabola három paramétert határoz meg, a modell összes paramétere meghatározható az aggregált adatokból is. Formálisan ugyan eggyel több egyenletünk van, mint paraméterünk, ezért megtörténhetne, hogy az egyenletrendszer túlhatározottsága miatt nincs megoldás, ám esetünkben ez nem áll fönn, hiszen az egyik egyenlet lineárisan nem független a többitõl.


c) Egyéni és kontextuális hatás összegzõdése

Ebben a modellben a különbözõ kontextusba tartozó egyének viselkedése egyaránt függ az egyes egyének tulajdonságaitól és a kontextustól, azonban az egyéni és a kontextuális hatások között nincs interakció. Azaz a kontextus egyformán befolyásolja mindkét csoport tagjait. A megfelelõ paraméterezés ebben az esetben a következõ lesz:

c1 ¹ c2 és d1 = d2 = d ahol d ¹ 0.

Ezekkel a megszorításokkal a (8) modellbõl a következõ egyenletet kapjuk:

Yj = 2dXj2 + (c1 – c2 –2d) Xj + c2 + d + Ej. (14)

Ebbõl az egyenletbõl is meghatározható az összes paraméter, és alakját tekintve azonos a (13) modellel. Az aggregált adatok esetén ez a kétféle modell empirikusan mégis megkülönböztethetõ egymástól. Ugyanis a (13) modellben az empirikus paraméterek (a parabola mérhetõ együtthatói) nem függetlenek egymástól.

Az egyértelmûség érdekében a parabola normálegyenletében vezessük be a következõ jelöléseket: y = ax2 + bx + g, ahol a, b, g a parabola mérhetõ együtthatói. A (13) egyenletben csak két független paraméter van, a harmadik a következõ megszorítás alá esik: a = –b – ennek teljesülése pedig empirikusan eldönthetõ. Problémát okozhatna, ha ez az összefüggés a (14) egyenletben is fönnállhatna. Azonban rövid számolás után meggyõzõdhetünk arról, hogy az a = –b összefüggés csak akkor teljesülhet, ha c1 = c2 igaz, viszont ez per definitionem a (13) modellt adja. Tehát a (13) és (14) modellek aggregált adatok esetén is megkülönböztethetõek az a és b paraméterek megmérésével. Az (5) modell ebben a specifikációban ismét lineáris egyenletre vezetett, ezért még a kontextuális hatást nélkülözõ esettõl sem volt empirikusan elkülöníthetõ csoportosított adatok segítségével.

A következõ táblázatban összefoglaljuk, hogy az eddig tárgyalt három modell hogyan különböztethetõ meg egymástól empirikusan a parabola fõegyütthatójára kirótt megszorítások tesztelésével, továbbá, hogy a modell elméleti paraméterei hogyan becsülhetõk meg a mérhetõ empirikus paraméterekbõl.

 

paraméter-
specifikáció

empirikus
paraméterek

paraméter-
becslések

Tiszta egyéni hatás:
Yj = (c1 – c2) Xj + c2 + Ej

d1 = d2 = 0
c1 ¹ c2

a = 0,
b és g tetszõleges

c2 = g
c1 = b + g

Tiszta kontextuális hatás:
Yj = 2dXj2 – 2dXj + c + d + Ej

d1 = d2= d¹ 0
c1=c2=c

a = -b
g tetszõleges

d = a /2
c = (2g – a )/2

Egyéni és kontextuális
hatás összegzõdése:
Yj = 2dXj 2 + (c1 – c2 – 2d) Xj + c2 + d + Ej

d1 = d2= d¹ 0
cc2

a ¹ -b
g tetszõleges

d = a/2

c2 = (2g – a )/2
c1 = (2b + 2g –a )/2




d) Egyéni és kontextuális hatás keresztezõdése

Mind az egyéni, mind a kontextuális hatások befolyásolják az egyén viselkedését, ráadásul ezek között a hatások között interakció van. Azaz a kontextus különbözõképpen befolyásolja a különbözõ csoportok tagjait. Ezt a jelenséget differenciális érzékenységnek nevezi a szakirodalom. A megfelelõ paraméterspecifikáció a következõ lesz:

d1 ¹ d2 ¹ 0 és c1 ¹ c2

Ebben a legáltalánosabb esetben a (8) modell nem egyszerûsödik. A négy paraméter meghatározása a három empirikus paraméter segítségével nem lehetséges. Ez az eredmény megegyezik az (5) modell viselkedésével, hasonló paraméterválasztás mellett.

Összegezve megállapíthatjuk, hogy modellünk – amennyiben nincs a kontextuá-lis hatásban differenciális érzékenység – még aggregált adatok esetén is egyértelmûen megkülönbözteti a különbözõ hatástípusokat, és módot ad az összes szereplõ paraméter meghatározására. (Az egyén szintû viselkedést leíró “b” paramétereket is beleértve.) Keresztezõ kontextuális hatás esetén a (8) modell az (5) modellhez hasonlóan csoportosított adatok alapján nem specifikálható.

Ezzel befejeztem a független változóban jelentkezõ kontextuális hatás leírására alkalmazott modellek jelentõs részének elemzését, a továbbiakban áttérek a függõ változóban értelmezett kontextuális hatás lehetséges modelljeinek tárgyalására.


Modellek a függõ változóban jelentkezõ kontextuális hatásra
(Az állapot szétterjedésének modellje)

Ebben a modelltípusban a cselekvõk viselkedését személyes tulajdonságaikon túl nem az adott kontextusbeli arányuk befolyásolja, hanem az, hogy mennyien végzik már az adott cselekvést a kontextusban. Azaz, hogy a cselekvés mennyire elterjedt a cselekvõk környezetében. Számtalan esetben gondolhatjuk, hogy ez a modell releváns, hiszen a társadalomban gyakori, hogy az emberek cselekvéseiket a környezetükben már elterjedt viselkedéshez igazítják.

Ez a modelltípus az elõzõhöz képest merõben új problémát is felvet. Nevezetesen – amíg a csoportösszetétel-modellekben a magyarázott változó általában nem hat vissza a kontextuális változóra (a tanulmányi eredmény megváltozása nem befolyásolja a fiú–lány arányt), addig – a most tárgyalt modellekben a magyarázott változó megváltozása maga után vonhatja a kontextuális változó módosulását. (Például ha egy osztály tanulmányi eredményét nem a fiú–lány aránnyal, hanem a jó tanulók–rossz tanulók arányával akarjuk magyarázni, akkor a magyarázott változó megváltozása nyilvánvalóan módosítja a kontextuális változót is.) E visszahatás miatt ennek a modellosztálynak az analitikus tárgyalása sokkal szerényebb keretek között lehetséges, mint a csoportösszetétel-modellek esetén.

A modell általános alakja:

Yij = f (Yj). (15)

A szakirodalomban a visszahatásból származó dinamikát a magyarázott változó differenciálásával veszik figyelembe, ezzel azonban rendkívül leszûkül a modell alkalmazhatóságának köre, hiszen értelemszerûen fel kell tételezni a függõ változó idõ szerinti differenciálhatóságát, ez pedig még a legmagasabb mérési szintû változókra sem teljesül szükségszerûen.

A differenciális összefüggés a következõ alakú:

dYij = f (Yj) dt. (16)

A cselekvõ viselkedésének megváltozása egy rövid dt idõintervallum alatt arányos a cselekvést már folytatók számának valamilyen függvényével. A (16) differenciálegyenlet látszólag szeparábilis, azonban explicit integrálással általában nem oldható meg, ugyanis Yj maga is Yij függvénye. Ezért az egyik lehetõség a megoldására, hogy itt is áttérünk az aggregált adatok szintjére, ekkor a következõt kapjuk:

d/dt(Yj) = f (Yj). (17)

A (17) már szeparábilis differenciálegyenlet, tehát a változók szétválasztása utáni integrálással megoldható. Ennek eredményeképp megkapható Yj(t) explicit idõfüggése, a kontextuális és egyéni hatások azonban szétválaszthatatlanná válnak.

Másik lehetséges mód (16) megoldására, ha Yj függését Yij-tõl explicitté tesszük. Ekkor egy nj (a j. kontextusban található egyedek száma) darab egyenletbõl álló csatolt differenciálegyenlet-rendszert kapunk, amely formálisan a következõképp adható meg:

d/dt (Yij) = f (Ylj, ..., Ynjj) (i = 1... nj). (18)

Ami a probléma bonyolultságát illeti, gondoljuk meg, hogy egy húsz fõs osztály esetén ez a módszer húsz darab egyenként húszváltozós differenciálegyenlet szimultán megoldását jelentené, ami még számítógéppel sem mindig lehetséges.

Eddigi fejtegetéseinket összefoglalva megállapíthatjuk, hogy ennek a modelltípusnak a megoldása korántsem olyan problémamentes, mint a csoportösszetétel-modelleké, ami azért is szomorú, mert valószínûleg az utóbb tárgyalt cselekvéselterjedési modelleknek vannak érdekesebb és fontosabb szociológiai alkalmazási lehetõségei.


Összefoglalás

Dolgozatomban matematikai jellemzõik alapján osztályoztam és jellemeztem a kontextuális elemzés legelterjedtebb módszereit. A csoportösszetétel-modellek esetére bevezettem egy új, a modellek invariancia-tulajdonságain nyugvó osztályozási szempontot. Majd ennek alapján definiáltam egy alternatív modellt. Ez – összehasonlítva a klasszikus megoldással – elõnyös elméleti (érzéketlen a kódolásra) és empirikus (a differenciális érzékenységet nélkülözõ modellek aggregált adatok esetén is teljesen specifikálhatóak) tulajdonságokkal rendelkezik.


* Köszönetet mondok Moksony Ferencnek, akinek a kontextuális elemzésrõl tartott elõadásai fölhívták figyelmem a témára, továbbá kandidátusi értekezése hasznos szakirodalmi iránymutatásul szolgált. Szeretnék továbbá köszönetet mondani azoknak a csoporttársaimnak, akik a dolgozat korábbi változatának elkészítésében részt vettek.


Felhasznált irodalom

Bertalan László (szerk.) 1980. Az ökológiai tévkövetkeztetésrõl. Szociológia, 3–4.

– 1987. Magyarázat, megértés, elõrejelzés. Budapest: Tömegkommunikációs Kutatóközpont

Boudon, R. 1987. Az ökológiai elemzés és kontextuális elemzés kapcsolata. In.: Bertalan (szerk.) 1987.

Coleman, J. S. 1970. Relational Analysis: The Study of Social Organizations with Survey Methods. In.: Etzioni, A. (Ed.) A Sociological on Complex Organizations. London

Davis, J. A.–J. L. Spaeth–C. Houson 1987. Kontextuális hatások elemzése. In: Bertalan (szerk.) 1987.

Moksony Ferenc 1985. A kontextuális elemzés. (Kandidátusi értekezés) Budapest

Schelling, Th. C. 1987. A kritikus nagyságú tömeg elvén nyugvó modellek diagrammatikus ábrázolása. In.: Bertalan (szerk.) 1987.