Eerdere literatuuronderzoeken

Kwalitatieve literatuuronderzoeken	3
Beperkingen van kwalitatief literatuuronderzoek	4
Kwantitatieve literatuuronderzoeken	5

Vanaf het eind van de jaren zeventig zijn onderzoekers in alle ernst begonnen met het onderzoeken van de psychologische verbanden of effecten van SMK. Al snel werden vele van dergelijke onderzoeken gepubliceerd. Dit had op haar beurt de opkomst van een nieuwe vorm van onderzoek tot gevolg, bestaand uit het verslaan en samenvatten van het beschikbare onderzoek - het verrichten van literatuuronderzoek dus. Tijdens de afgelopen 15 jaar zijn er de nodige literatuuronderzoeken verschenen. Deze onderzoeken zijn niet altijd unaniem in hun conclusies, hoewel het grootste deel de veronderstellingen omtrent causaliteit, intensiteit, grootschaligheid en de gelijkwaardigheid voor jongens en meisjes van de veronderstelde schade van SMK deelt, waarmee zij de populaire veronderstellingen omtrent SMK steunen. Door de jaren heen zijn er twee soorten van literatuuronderzoek verricht: kwalitatieve en kwantitatieve. We zullen beide soorten van onderzoek aan een nadere beschouwing onderwerpen.

Kwalitatieve literatuuronderzoeken

Het eerste type literatuuronderzoek is kwalitatief. In dit type onderzoek verzamelt de onderzoeker een aantal onderzoeksverslagen en vat in verhalende vorm samen wat er in gezegd lijkt te worden. De onderzoeker geeft de lezer in woord en beschrijving - en niet in wiskundige vorm - zijn of haar interpretatie van de bevindingen van het geheel van de onderzoeken.

De auteurs van deze kwalitatieve literatuuronderzoeken hebben overwegend geconcludeerd dat SMK geassocieerd moet worden met een omvangrijk aantal psychische problemen, waaronder woede, depressie, psychische angsten, eetstoornissen, alcohol en drugsmisbruik, verminderd zelfvertrouwen, relatieproblemen, ongepast seksueel gedrag, agressie, zelfverminking, zelfmoord, dissociatie (meervoudige persoonlijkheid) en posttraumatische stress. Vaker dan niet hebben zij aangenomen dat SMK de oorzaak is van deze problemen en hebben zij daarbij beweerd, of geïmpliceerd, dat de meeste mensen met SMK gerelateerde ervaringen met deze problemen te maken zullen krijgen. Sommigen hebben zich veel moeite getroost om te benadrukken dat jongens net zo zeer onder deze problemen gebukt gaan als meisjes. Een groep van onderzoekers noemde het een mythe dat jongens in mindere mate door SMK beïnvloed zouden worden dan meisjes. Een andere onderzoeker deed pogingen om vast te stellen of jongens in gelijke mate door SMK beïnvloed werden als meisjes af als een futiliteit en stelde dat SMK 'uitgesproken traumatische effecten heeft op de slachtoffers, ongeacht hun sekse.'

Niet alle onderzoekers hebben echter met deze conclusies ingestemd. Een aantal van hen heeft erop gewezen dat voorzichtigheid geboden is bij het postuleren van causaliteit, waarbij zij stelden dat SMK zo sterk verweven is met problemen in en rond het gezin, dat het niet echt mogelijk is om het verminderd welbevinden bij personen met SMK-ervaringen in vergelijking met een controlegroep aan SMK, dan wel aan slechte gezinsomstandigheden toe te schrijven. Een aantal onderzoekers heeft beweerd dat de gevolgen van SMK eerder variabel zijn, dan overwegend negatief. In een van zijn eerste onderzoeken vond Constantine bijvoorbeeld dat negatieve gevolgen vaak afwezig waren bij personen met SMK-ervaringen in niet-klinische steekproeven. Hij concludeerde dat er geen sprake is van onvermijdelijke gevolgen of een vaststaand geheel aan reacties en dat de manier waarop op SMK gereageerd wordt mede door niet-seksuele factoren beïnvloed wordt, zoals de mate van vrijwilligheid waarmee de jongere participant zijn inbreng in de seksuele ontmoeting beleeft. Tenslotte heeft een aantal onderzoekers opgemerkt dat jongens ertoe neigen veel positiever of neutraler te reageren dan meisjes.

Beperkingen van kwalitatief literatuuronderzoek.

Welke conclusie kunnen we trekken uit kwalitatieve literatuuronderzoeken als geheel met betrekking tot de heersende opvattingen omtrent SMK? Om een aantal redenen eigenlijk geen. Ten eerste omdat de conclusies van het ene onderzoek vaak niet consistent zijn met ander onderzoek. Ten tweede, en belangrijker nog, omdat deze literatuuronderzoeken over het algemeen gebukt gaan onder vertekeningen in de steekproeven (steekproeffouten) en ten derde omdat ze zich kwetsbaar tonen voor onderzoeksfouten als gevolg van subjectiviteit en onnauwkeurigheid.

Steekproeffouten.

Al deze kwalitatieve literatuuronderzoeken (op één na, waar wij later in deze lezing nog op terug zullen komen) zijn voornamelijk gebaseerd op klinische en justitiële steekproeven. Een groot deel ervan is uitsluitend - of bijna uitsluitend - gebaseerd op deze steekproeven. Van klinische en justitiële steekproeven van personen met SMK-ervaringen kan niet aangenomen worden dat zij representatief zijn voor de hele populatie van personen met een SMK-geschiedenis. Dit is een buitengewoon belangrijk principe dat het waard is om nader onder de loep genomen te worden.

Het 'bewijs' dat masturbatie geestelijke stoornissen tot gevolg heeft, werd ooit gebaseerd op de observatie dat geïnstitutionaliseerde psychiatrische patiënten masturberen. Het 'bewijs' dat homoseksualiteit een geestelijke stoornis is, was ooit gebaseerd op steekproeven van psychiatrisch patiënten en gevangenen. Toen men niet-klinische steekproeven begon te onderzoeken, ontstond een heel ander en veel gunstiger beeld van masturbatie en homoseksualiteit. Analoog hieraan moet ook SMK onder niet-klinische steekproeven onderzocht worden om vast te kunnen stellen of het in het algemeen schadelijk is, en zo ja, in welke mate.

Sommige literatuuronderzoeken naar SMK zijn gebaseerd op grote aantallen klinische steekproeven. Dit spoorde de onderzoekers aan om te concluderen dat SMK buitengewoon destructief is. Maar grotere aantallen onderzoeken brengen ons niet noodzakelijk dichter hij valide kennis. Dit kunnen wij met een beroemd voorbeeld illustreren.

In 1936 voerde de Republikeinse presidentskandidaat Alf Landon campagne om het presidentschap tegen de kandidaat van de Democraten, Franklin D. Roosevelt. Twee weken voor de verkiezingen stuurde het tijdschrift Litarery Digest 12 miljoen briefkaarten rond waarop zij mensen vroegen op wie zij zouden gaan stemmen. Zij ontvingen 2,5 miljoen reacties, waarvan 57% kenbaar maakte op Landon te stemmen en 43% op Roosevelt. De eigenlijke verkiezingen toonden precies het omgekeerde resultaat. Wat ging er fout? Het tijdschrift had haar populatie uit registers van autobezitters en telefoonboeken samengesteld. In 1936, tijdens het hoogtepunt van de depressie, hadden de bezitters van auto's en telefoons waarschijnlijk meer geld en waren om die reden eerder geneigd op een Republikeinse kandidaat te stemmen. Met andere woorden, de steekproef was niet representatief. Het feit dat het tijdschrift een enorm aantal reacties had ontvangen (2,5 miljoen) woog niet op tegen de vertekening in de samenstelling van de steekproef. Een representatieve steekproef van 1000 personen (zoals deze tegenwoordig veelal gebruikt wordt) is veel geschikter om valide resultaten te behalen. Het principe is dat een fout in de steekproef nooit goedgemaakt kan worden door een grotere omvang. De gerichtheid op klinische en juridische steekproeven is een belangrijke tekortkoming van de meeste kwalitatieve literatuuronderzoeken.

Conclusies trekken uit onderzoeken, gebaseerd op klinische en juridische steekproeven, is niet alleen problematisch omdat deze steekproeven niet representatief zijn voor de hele bevolking, maar ook omdat gegevens afkomstig uit deze steekproeven bloot staan aan een grote kans op ongeldigheid.

Een van de problemen heeft te maken met de opvattingen van therapeuten. Als een therapeut ervan overtuigd is, zoals velen dat ooit waren, dat homoseksualiteit leidt tot verminderd welbevinden, dan zal deze therapeut minder gemotiveerd zijn om door te zoeken naar andere mogelijke oorzaken van het verminderd welbevinden van een homoseksuele patiënt. Op deze wijze blijft de opvatting van de therapeut dat homoseksualiteit een geestelijke stoornis is, gehandhaafd.

Dezelfde redenering is van toepassing op SMK. In een beroemd voorbeeld hiervan evalueerde de psychiater Fred Berlin de geestesgesteldheid van de president van American University, die net wegens het plegen van obscene telefoongesprekken gearresteerd was. Berlin hoorde van zijn patiënt dat hij op elfjarige leeftijd een incestueuze relatie met zijn moeder had gehad, maar ook dat hij op verschillende momenten tijdens zijn kinderjaren herhaaldelijk slachtoffer van ernstige lichamelijke mishandeling was geweest. Berlin, overtuigd van de kracht van het causale verband tussen SMK en latere geestesstoornissen, richtte zich uitsluitend op het incestaspect als de oorzaak van de huidige problemen van zijn patiënt, en gebruikte deze zaak vervolgens als het zoveelste voorbeeld om aan te geven hoe vernietigend SMK is. Echter, gegeven de rol van het veel prominentere en veel meer alomtegenwoordige lichamelijke misbruik moeten zijn gevolgtrekkingen op zijn best dubieus genoemd worden.

Waar het om draait in dit voorbeeld is dat het geloof van de psychiater in de schadelijkheid van SMK versterkt wordt door zijn selectieve aandacht voor het bewijs, dat niet wetenschappelijk valide is. Hiermee wordt niet gezegd dat SMK nooit de oorzaak is van het verminderd welbevinden van een patiënt, maar wel dat de verwachtingen van een therapeut de perceptie dat SMK tot verminderd welbevinden leidt, substantieel kan versterken.

Subjectiviteit en onnauwkeurigheid

Kwalitatieve literatuuronderzoeken zijn geheel verhalend en daarmee blootgesteld aan subjectieve interpretaties van de onderzoekers. Onderzoekers die ervan overtuigd zijn dat SMK een belangrijke oorzaak is van psychische stoornissen bij volwassenen kunnen ten prooi vallen aan 'de bevestigingsfout' - dat wil zeggen: zij zien en beschrijven alleen die uitkomsten die op schadelijke gevolgen wijzen en besteden geen of minder aandacht aan resultaten die op niet-negatieve of positieve gevolgen wijzen, waarmee zij in hun opvattingen bevestigd worden. Analoog hieraan zie je hetzelfde bij mensen die in astrologie geloven en zeer onder de indruk zijn als een voorspelling uit een horoscoop uitkomt, maar tegelijkertijd geneigd zijn om het grote aantal gevallen waarin dat niet het geval is snel weer te vergeten. Door middel van de bevestigingsfout zijn zij overtuigd van de voorspellende waarde van astrologie.

Een voorbeeld van een bevestigingsfout in SMK-onderzoek is het onderzoek van Mendel, die in zijn literatuurstudie een onderzoek behandelde, bestaande uit twee gescheiden steekproeven van mannelijke studenten. In de eerste steekproef werd geen verband aangetroffen tussen SMK en verminderd welbevinden. In de tweede, kleinere, steekproef werd wel een gering verband geconstateerd. Mendel negeerde de resultaten uit de eerste steekproef, maar gebruikte de tweede om zijn bewering te staven dat SMK verminderd welbevinden tot gevoeg heeft. Deze selectieve aandacht voor bevestigende resultaten vormt een ernstig probleem in veel kwalitatieve literatuuronderzoeken.

Een ander probleem heeft te maken met nauwkeurigheid. In het voorbeeld van Mendels onderzoek dat we zojuist besproken hebben, gebruikte hij het bevestigende voorbeeld om te stellen dat SMK depressie, psychische angsten etc. tot gevolg heeft. Wat hij daarbij niet vermeldde was dat het gevonden verband in deze steekproef tussen SMK en genoemde symptomen gering is. Toch is dit uiterst belangrijke informatie omdat er geen valide redenen zijn om uit deze resultaten te concluderen, zoals Mendel deed, dat de gevolgen van SMK intens zijn. Dit is een constant probleem in deze kwalitatieve literatuuronderzoeken: onderzoeken wijzen geringe maar statistisch significante verschillen uit, maar onderzoekers blazen deze gegevens op door van ernstige gevolgen te spreken. Wat vereist is, is dat literatuuronderzoekers nauwkeurig met de statistische gegevens omspringen; anders is de kans levensgroot aanwezig dat zij, als ze op voorhand al overtuigd zijn van de destructieve gevolgen van SMK, de resultaten overdrijven.

Kwantitatieve Literatuuronderzoeken.

Om de problemen van kwalitatief literatuuronderzoek te omzeilen, is een aantal onderzoekers vanaf het midden van de jaren negentig begonnen met kwantitatief literatuuronderzoek. Dit literatuuronderzoek is gebaseerd op een statistische methode die meta-analyse heet. In meta-analyses verzamelt de onderzoeker een aantal onderzoeksverslagen waarin het welbevinden van personen met SMK-ervaringen vergeleken wordt met een controlegroep. Vervolgens neemt de onderzoeker de statistische informatie uit elk onderzoek waarin de beide groepen met elkaar vergeleken worden over en converteert deze tot een nieuw geheel van statistische gegevens. Tenslotte berekent de onderzoeker het gemiddelde van al deze statistische waarden om te zien wat het geheel van deze onderzoeken over het verband tussen SMK en psychisch welbevinden te zeggen heeft.

De gemeenschappelijke waarde die uit elk van de onderzoeken uit de meta-analyses die we hier zullen bespreken werd verkregen, wordt effectomvang genoemd. De effectomvang vertelt ons precies hoe groot het verschil is in psychisch welbevinden tussen mensen met SMK-ervaringen en personen uit de controlegroepen. Dit is iets anders dan het louter vaststellen dat de beide groepen een statistisch significant verschil vertonen, want een dergelijk verschil kan heel klein of heel groot zijn. De effectomvang vertelt ons of dit verschil klein of groot is.

Als je bijvoorbeeld een gulden kunt besparen op een artikel van duizend gulden door het in winkel A te kopen in plaats van winkel B, dan is er een verschil, maar het is heel klein. Bespaar je 200 gulden, dan wordt het interessant. Als consument wil je weten hoeveel je kunt besparen door naar winkel A te gaan, niet alleen of je iets bespaart.

Om de presentatie wat te vergemakkelijken, en gegeven het feit dat niet ieder van u met statistiek bekend is, zullen wij de effectomvang op de volgende manier weergeven. Stelt U zich voor dat we een groep mensen hebben, waarvan sommige SMK-ervaringen hebben en andere niet. U zult zich kunnen voorstellen dat er de nodige variatie bestaat in beide groepen met betrekking tot het psychisch welbevinden van de verschillende personen. Met sommigen is het wat betreft het psychisch welbevinden uitstekend gesteld, maar anderen gaat het matig, een aantal lijdt onder een verminderd welbevinden en met een enkeling gaat het ronduit slecht. Als SMK een erg sterk effect heeft op het welbevinden, dan zou SMK verantwoordelijk gesteld moeten worden voor ten minste 50% van de variabiliteit in het welbevinden onder alle personen. Heeft SMK een sterk effect dan neemt SMK ten minste 25% voor zijn rekening, bij een gemiddeld effect ten minste 10%, en bij een klein effect ten minste 1%.

De onderzoekster Jumper nam in haar onderzoek uit 1995 algemene bevolkingssteekproeven, studentensteekproeven en klinische steekproeven op in haar meta-analyse van de relatie tussen SMK en welbevinden. Ze berekende de gemiddelde effectomvang per steekproeftype. Nadat ze enkele fouten die ze gemaakt had corrigeerde, toonden haar resultaten dat SMK verantwoordelijk was voor 0,8% van de variantie in het welbevinden in de studentensteekproeven, voor 2,25% van de variantie in de algemene bevolkingssteekproeven en voor 7,30% In de klinische steekproeven. Met andere woorden, er bleek een verband tussen SMK en welbevinden, maar deze relatie was klein bij de niet-klinische steekproeven en gemiddeld bij klinische steekproeven.

In 1996 publiceerde een andere groep onderzoekers een tweede meta-analyse. Zij berekenden de gemiddelde effectomvangen voor respectievelijk niet-klinische en klinische steekproeven. De mate van variabiliteit veroorzaakt door SMK was 1,4% voor de niet-klinische steekproeven en 3,6% voor de klinische steekproeven.

Deze beide kwantitatieve literatuuronderzoeken vormen op een aantal manieren een vooruitgang ten opzichte van kwalitatief literatuuronderzoek.

	Ten eerste vermijden zij subjectieve interpretaties.
	Ten tweede bevatten zij grote aantallen niet-klinische steekproeven.
	Ten derde analyseerden zij de verschillende steekproeven afzonderlijk.

Het beeld dat vervolgens opdoemt, ziet er als volgt uit: klinische steekproeven verschillen duidelijk van niet-klinische steekproeven. Dit toont op empirische gronden aan dat het niet terecht is uit klinische rapportages omtrent SMK conclusies te trekken die de hele bevolking aangaan. Tevens blijkt dat, hoewel er een verband bestaat tussen SMK en verminderd welbevinden in niet-klinische steekproeven, dit verband klein is. Dit betekent dat de bewering dat SMK op grote schaal ernstige en blijvende schade veroorzaakt schromelijk overdreven is.

Belde onderzoeken, tot een jaar geleden de enige gepubliceerde meta-analyses, kenmerken zich echter door een aantal belangrijke minpunten, die voor ons uiteindelijk de reden zouden vormen on onze eigen meta-analyses uit te voeren.

Op de eerste plaats worden er nauwelijks steekproeven met mannen onderzocht - geen enkele in het tweede onderzoek.

Op de tweede plaats ging geen van de onderzoeken in op de vraag in hoeverre het aangetoonde verband tussen SMK en verminderd welbevinden veroorzaakt wordt door SMK of door ongunstige gezinsomstandigheden.

Op de derde plaats leverden de onderzoeken geen gegevens op over de schaal van de effecten. Als SMK een effect heeft, gaat dat dan op voor 100% van alle mensen met SMK-ervaringen of voor 50% of 10% of een ander percentage?

Op de vierde plaats werd er niets gezegd over hoe de betrokken personen op hun seksuele ervaringen gereageerd hebben. Het is mogelijk dat enkelen of zelfs velen niet negatief gereageerd hebben. Het heersende denken biedt geen ruimte aan deze mogelijkheid, maar objectieve wetenschap moet deze vragen stellen om zo de validiteit van de algemene veronderstellingen omtrent SMK te kunnen toetsen.

In een poging deze beide meta-analyses te verbeteren, hebben wij twee eigen onderzoeken verricht. Wij verrichtten deze meta-analyses om de heersende veronderstelling te toetsen dat SMK onder de algemene bevolking tot intense schade leidt, op grote schaal voorkomt en voor jongens en meisjes dezelfde negatieve gevolgen heeft. Omdat onze belangstelling uitging naar SMK-ervaringen onder de algemene bevolking hebben wij ons uitsluitend gericht op niet-klinische steekproeven. Deze beperking is gerechtvaardigd omdat de twee meta-analyses die wij voorheen bespraken, aantonen dat (en dit gaat op voor het gros van onderzoeken naar gedrag) bevindingen uit klinische steekproeven niet gegeneraliseerd kunnen worden. Om inzicht te krijgen in de aard van SMK, en om te onderzoeken of SMK per se schadelijk is, zijn het de mensen in de algemene bevolking die onderzocht moeten worden.