A dual system model
Bouwend op het eerdere empirische onderzoek, dat overtuigend heeft aangetoond dat menselijke cognitie wordt bepaald door zowel systeem I als systeem II processen . Mukherjee heeft onlangs een formeel wiskundig model ontwikkeld, dat uitgaat van parallelle werking van beide systemen, terwijl de uiteindelijke beslissing een gewogen combinatie is van de waarderingen van beide systemen op basis van het paradigma van waardemaximalisatie (figuur 1) (NB. In dit artikel gebruiken we termen systeem I en systeem II zoals gepopulariseerd door Kahneman, hoewel sommige auteurs liever spreken over type 1 en 2 verwerking, omdat het vrijwel zeker is dat menselijke cognitie niet is georganiseerd in duidelijk gescheiden fysieke systemen).
Mukherjee’s duale systeemmodel (DSM) gaat ervan uit dat de evaluatie van een risicovolle keuze (C) wordt gevormd door de gecombineerde input van systeem I en systeem II tot één enkele waarde en kan als volgt worden geformuleerd:
Waarbij C staat voor een beslissingssituatie (“keuze”), n – aantal uitkomsten, p i – waarschijnlijkheid van de i-de uitkomst, x i , van de gekozen keuze. V I staat voor de waardering van de beslissing bij een autonome, intuïtieve, op systeem I gebaseerde wijze van besluitvorming, en V II , dat een nutsfunctie kan zijn, staat voor de waardering bij een deliberatieve, op regels gebaseerde, op systeem II gebaseerde wijze van besluitvorming. k-is een schaalconstante, en γ is het gewicht dat aan systeem I wordt toegekend en kan worden geïnterpreteerd als de relatieve mate van betrokkenheid van systeem I bij het besluitvormingsproces. Systeem II wordt niet opgesplitst in twee subsystemen, zoals door sommigen wordt bepleit, maar wordt geacht te voldoen aan de rationaliteitscriteria van de verwachte nutstheorie (EUT), die ook door de moderne besluitvormingswetenschap wordt bepleit. Aangenomen wordt dat γ wordt beïnvloed door een aantal processen die bepalend zijn voor het functioneren van systeem I. Mukherjee benadrukte de volgende factoren als belangrijke bepalende factoren voor het functioneren van systeem I: individuele besluitvormings- en denkvoorkeuren, affectieve aard van de uitkomsten (hoe hoger de affectieve aard van de uitkomsten, hoe hoger de γ) en het kaderen en construeren van de besluitvormingstaak (beslissingen voor zichzelf zullen waarschijnlijk een hogere γ hebben, evenals besluitvormingsproblemen die gecontextualiseerd zijn en die een onmiddellijke oplossing vereisen of onder tijdsdruk worden genomen; de laatste vier beschrijven omstandigheden die kenmerkend zijn voor medische besluitvorming). Gemakkelijk beschikbare informatie, onze eerdere ervaring, de manier waarop informatie wordt verwerkt (woordelijk versus het verkrijgen van de “kern” ervan) en geheugenbeperkingen zullen naar verwachting ook van invloed zijn op de γ. De γ zal daarom naar verwachting hoger zijn wanneer informatie over waarschijnlijkheden en uitkomsten dubbelzinnig of niet gemakkelijk beschikbaar is, of wanneer een zeer ernstige negatieve eerdere uitkomst wordt herinnerd. Anderzijds zal, wanneer dergelijke gegevens beschikbaar zijn, hun gezamenlijke evaluatie door systeem II γ verminderen. In het algemeen kunnen de factoren die het proces van systeem I bepalen in vier grote categorieën worden ingedeeld: a) affect, b) evolutionaire hard-wired processen, verantwoordelijk voor automatische reacties op potentieel gevaar, zodanig dat systeem I typisch een groter gewicht toekent aan potentieel fout-positieven dan aan fout-negatieven (d.w.z.d.w.z. dat mensen cognitief meer geneigd zijn om ten onrechte het signaal van potentiële schade te accepteren dan een signaal dat de mogelijkheid van voordeel in zich draagt), c) overgeleerde processen van systeem II die naar systeem I zijn overgeheveld (zoals het effect van intensieve training dat leidt tot het gebruik van heuristieken, of “vuistregels” of praktijkrichtlijnen als een van de inspanningsbesparende cognitieve strategieën. Hoewel richtlijnen de producten kunnen zijn van analytische systeem II processen, is de toepassing ervan een systeem I proces), en (d) de effecten van stilzwijgend leren.
Mukherjee’s DSM model is gebaseerd op empirisch bewijs dat aantoont dat besluitvormers in een affect-rijke context over het algemeen alleen gevoelig zijn voor de aan- of afwezigheid van stimuli, terwijl zij in affect-arme contexten vertrouwen op systeem II om de omvang van stimuli (en waarschijnlijkheden) te beoordelen. Het saillante kenmerk van het model is dus dat systeem I uitkomsten alleen erkent als mogelijk of niet. Elke uitkomst die in overweging blijft krijgt evenveel gewicht in systeem I. Anderzijds herkent systeem II waarschijnlijkheden lineair zonder vervormingen, volgens het verwachte nutsparadigma.
Dientengevolge genereert duale waarderingsverwerking vaak gevallen waarin subjectieve waarderingen groter zijn bij lagere stimulusgrootten (d.w.z. wanneer de besluitvorming berust op gevoel, of evolutionaire hard-wired processen zoals wanneer het signaal gevaar kan opleveren), terwijl rationele berekening een grotere waarde oplevert bij hoge grootten. DSM is in staat om een aantal fenomenen te verklaren die menselijke besluitvorming karakteriseren, zoals a) schending van niet-transparante stochastische dominantie, b) viervoudig patroon van risicohouding, c) ambiguïteitsaversie, d) gemeenschappelijk gevolgen effect, e) gemeenschappelijk ratio effect, f) isolatie effect, g) en coalescentie en event-splitting effect .
Onder de realistische aanname dat uitkomsten positief zijn (d.w.z, >0, hetgeen met name van toepassing is op de medische setting) en machtswaardefuncties, V I x = x m I , en V II x = x voor respectievelijk systeem I en systeem II, kan DSM worden herschreven als:
waarbij 0 < m I ≤ 1 Merk op dat x i m I voldoet aan risicoaversie voor winsten en risicozoeken voor verliezen en dat de term voor systeem II p i x i lineair is zonder risicovervormingen.
Zoals Mukherjee opmerkt, is de schatting van de parameters in vergelijking 2) een meetoefening, die in het toekomstige empirische onderzoek moet worden geëvalueerd. Bijgevolg zouden de functies V II (x) en V I (x) kunnen worden gewijzigd, afhankelijk van de besluitvormingssetting en de doelstellingen van de besluitvormer.
Modificatie van DSM voor medische besluitvorming
We zullen een typische situatie in klinische besluitvorming beschouwen waarin een arts moet kiezen tussen behandeling (Rx) vs. geen behandeling (NoRx) voor ziekte (D) die aanwezig is met de waarschijnlijkheid p. . Elke beslissing resulteert in uitkomsten die een bepaalde waarde hebben, xi. Het model is weergegeven in figuur 2. Zoals hierboven is opgemerkt, erkent het systeem I uitkomsten alleen als mogelijk (of niet), en is het dus ongevoelig voor exacte waarschijnlijkheden. Elke uitkomst met een kans van niet nul krijgt evenveel gewicht in systeem I. In een keuze uit twee alternatieven is elke kans dus gelijk aan 0,5 in systeem I. Systeem II herkent kansen zonder vertekeningen, zoals volgens EUT te verwachten is.
Wij stellen dat van de emoties die de waardering van uitkomsten in systeem I-processen kunnen beïnvloeden, spijt een belangrijke rol speelt, terwijl systeem II-processen worden gedomineerd door rationele, analytische overwegingen volgens EUT . We kunnen spijt (Rg) definiëren als het verschil (verlies) in het nut van de uitkomst van de ondernomen actie en die van de actie die we hadden moeten ondernemen, achteraf bezien, maar alleen werkend op systeem I niveau (zie figuur 2).
Hieruit volgt dat we de volgende waardefuncties hebben (zie Additional file 1: Appendix voor gedetailleerde afleiding):
De totale waardering van de beslissing om te behandelen (Rx) is gelijk aan:
En
Het verschil in de uitkomsten van het wel en niet behandelen van de patiënt met de ziekte is gelijk aan het nettovoordeel van de behandeling (B) ; het verschil in uitkomsten tussen het niet behandelen en het wel behandelen van patiënten zonder ziekte wordt gedefinieerd als de netto schade (H) . Merk op dat voordelen en nadelen kunnen worden uitgedrukt in verschillende eenheden (zoals overleving, sterfte, morbiditeit, kosten, enz.) en kunnen worden geformuleerd als utilities en disutilities . Zoals hierboven uiteengezet, nemen wij verder aan dat de waardering van netto voordelen en netto nadelen door systeem I verschilt van systeem II. Daarom vervangen wij in systeem II nettobaten en nettoschaden door EUT-definities: B II = x 1 – x 3 en nettoschade H II = x 4 – x 2 . In systeem I definiëren we B I = x 1 m I – x 3 m I , en H I = x 4 m I – x 2 m I . Oplossen voor p (de ziektekans waarbij we onverschillig zijn tussen Rx en NoRx), levert op: (Vergelijking 3)
Dit betekent dat als de ziektekans groter is dan p t de besluitvormer de voorkeur geeft aan behandeling; zo niet, dan is een concurrerend beheersalternatief (zoals “Geen behandeling”) de optimale behandelingsstrategie. Merk op dat k typisch op 1 kan worden gesteld, zoals wij hier doen. Merk ook op dat het eerste deel van de vergelijking equivalent is aan de drempelwaarde-uitdrukking die in het EUT-kader wordt beschreven; de tweede uitdrukking wijzigt het EUT-gebaseerde besluitvormingsproces van systeem II zodanig dat indien de voordelen groter worden ervaren dan de nadelen, de drempelwaarschijnlijkheid altijd lager is dan de EUT-drempelwaarde. Indien een besluitvormer echter H I >B I ervaart, is de drempelwaarschijnlijkheid altijd hoger dan de EUT-drempel (zie hieronder voor bespreking in de context van het medische voorbeeld). Merk op dat γ en de verhouding H I H II alleen bijdragen tot de mate waarin de duale drempel boven of onder de klassieke EUT-drempel ligt. Dat wil zeggen dat γ en de verhouding H I H II niets veranderen aan de kwaliteit van de relatie tussen de dubbele drempel en de EUT-drempel: of de dubbele drempel boven of onder de EUT-drempel zal liggen, hangt alleen af van de verhouding B I H I.
Opgemerkt zij dat identieke afleidingen kunnen worden verkregen door het begrip verwachte spijt (in plaats van EUT) toe te passen. Hoewel kan worden betoogd dat spijt een krachtige emotie is die alle cognitieve processen beïnvloedt (als zogenaamde, “cognitieve emotie”), en dus kan functioneren op het niveau van zowel systeem I als systeem II, erkennen de meeste auteurs de affectieve waarde van spijt. Daarom hebben we aangenomen dat spijt functioneert op systeem I niveau. Daarom beperken we in ons model de invloed van spijt tot systeem I. Overigens kan onze vergelijking 3) ook worden afgeleid van het algemene Mukherjee’s DSM model, zelfs als spijt niet specifiek wordt aangeroepen.
Hoewel vergelijking 3) exacte berekeningen impliceert, moet ze niet worden opgevat als een model dat een nauwkeurige wiskundige beschrijving geeft van menselijke besluitvorming. Zij moet eerder worden beschouwd als een semi-kwantitatieve of kwalitatieve beschrijving van de manier waarop artsen hun beslissingen nemen. Ten eerste omdat systeem I geen exacte berekeningen uitvoert, maar eerder vertrouwt op “gist” voor de beoordeling van voordelen en nadelen op een meer kwalitatieve manier. Het mechanisme is afhankelijk van associaties, emoties (de zogenaamde “risico-als-gevoel”-schattingen), maar ook van geheugen en ervaring. In die zin kan het tweede deel van vergelijking 3), dat op systeem I berust, worden opgevat als de kwalitatieve modificator (“gewicht”), die, afhankelijk van de ramingen van voordelen en schade van systeem I, het eerste deel van de vergelijking (dat afhankelijk is van het precieze gebruik van bewijsmateriaal voor voordelen en schade van systeem II) verhoogt of verlaagt. Ten tweede moet de drempelwaarschijnlijkheid zelf worden beschouwd als een “actiedrempel”- op een bepaald moment beslist een arts of hij een behandeling toedient of niet. Typisch zet zij de geschatte ziektekans af tegen de drempel en handelt: als de ziektekans boven de “actiedrempel” ligt, dient de arts de behandeling toe; ligt de waarschijnlijkheid eronder, dan besluit zij geen behandeling toe te dienen. Een manier om vergelijking 3) te interpreteren is dus de schatting van de arts van de “hoofdzaak” van de actiedrempel: als volgens haar schatting de voordelen van de behandeling groter zijn dan de nadelen, en zij het “waarschijnlijk” acht dat de waarschijnlijkheid van de ziekte boven de drempel ligt, dan handelt zij en dient zij de behandeling toe. Als de arts het “onwaarschijnlijk” acht dat de waarschijnlijkheid van ziekte boven de “actiedrempel” ligt, dan zou zij de behandeling niet voorschrijven.
Het gedrag van het DSM-M model
De precieze cognitieve mechanismen die ten grondslag liggen aan duale systeemprocessen zijn niet volledig opgehelderd. Zoals in dit artikel besproken, hebben vele factoren invloed op de duale processen, wat leidt tot de suggestie dat deze processen zouden moeten worden gegroepeerd volgens de heersende mechanismen. Concentratie op elk van deze processen kan leiden tot specifieke theoretische voorstellen. Ons doel in dit artikel is om een overkoepelende cognitieve architectuur te bieden die algemene kenmerken van de meeste bestaande theoretische concepten omvat, terwijl we ons tegelijkertijd concentreren op specifieke aspecten van medische besluitvorming. In het algemeen vallen de theorieën over dubbele verwerking in twee hoofdgroepen uiteen parallelle-competitieve theorieën en standaard-interventionistische theorieën. De parallelle-competitieve theorieën gaan ervan uit dat systeem I en II processen parallel verlopen, waarbij ze elk concurreren om de controle over de respons. Als er een conflict is, is het niet duidelijk welk mechanisme wordt ingeschakeld om het conflict op te lossen. Anderzijds gaan standaardinterventietheorieën ervan uit dat systeem I een snelle en intuïtieve standaardreactie genereert, waarop al dan niet kan worden ingegrepen door de daaropvolgende langzame en doelbewuste verwerking van systeem II. Dit kan verder worden geoperationaliseerd via verschillende algemene mechanismen die in de literatuur zijn voorgesteld:
- 1)
Mukherjee’s additieve model zoals hierboven beschreven. Het kan worden gecategoriseerd als een variant van de parallel-competitieve theorie, omdat het ervan uitgaat dat de processen van systeem I en II parallel verlopen, maar wel een parameter γ bevat, die een grotere of kleinere activering van systeem I teweeg kan brengen. Mukherjee’s model modelleert echter niet expliciet de keuzes in termen van categorische beslissingen (d.w.z. accepteer vs. accepteer een gegeven hypothese niet), wat een fundamenteel kenmerk is van dual-processing modellen .
- 2)
Systeem I en systeem II werken op een continuüm , maar op zo’n manier dat systeem I nooit slaapt . Een uiteindelijke beslissing hangt af van de activering van beide systemen I en II . Geschat wordt dat ongeveer 40-50% van de beslissingen wordt bepaald door gewoonten (d.w.z. door systeem I) . Dit is ook een variant van de parallel-competitieve theorie; opgemerkt moet worden dat de laatste literatuur zich van dit model verwijdert .
- 3)
De uiteindelijke beslissing blijkt zowel van systeem I als van systeem II af te hangen, zodanig dat systeem I als eerste een antwoord voorstelt en systeem II dit onderschrijft . Daarbij kan systeem II de volledige controle over systeem I uitoefenen (zoals wanneer het zich baseert op de EUT modellering) of volledig falen om het functioneren van systeem I te overzien (b.v., wegens zijn onwetendheid of luiheid) . Volgens dit model worden beslissingen dus ofwel genomen door systeem I (default) ofwel door systeem II (dat al dan niet kan ingrijpen). Dit is een default-interventionalistisch model.
- 4)
De variant van model #3 is het zogenaamde “toggle-model”, waarin wordt voorgesteld dat de besluitvormer voortdurend cognitieve processen gebruikt die tussen de twee systemen heen en weer schakelen (toggle) . Dit is een variant van het default-interventionalist model.
Merk op dat γ in ons model continu is, maar het kan categorisch worden gemaakt als de “toggle”-theorie als de juiste wordt beschouwd. In dat geval kan in de beslisboom een logische schakelaar worden ingebouwd om tussen de twee systemen te kunnen schakelen. Het belangrijkste is dat wij, door het additieve model van Mukherjee te koppelen aan het drempelmodel, de architectuur verschaffen om parallelle concurrerende theorieën te verzoenen met standaard-interventionistische theorieën. Wij doen dit door expliciet te maken dat besluiten categorisch zijn (via drempel) bij een bepaalde mate van cognitieve inspanning (gemodelleerd via γ) parameter . Dat wil zeggen, de kernvraag is welke processen de acceptatie of verwerping van een bepaalde (diagnostische) hypothese bepalen. Ons model laat zien dat dit kan gebeuren als we de parallel-competitieve architectuur van Mukherjee’s additieve model handhaven, maar een schakelaar, ja of nee antwoord, veronderstellen voor het accepteren of verwerpen van een bepaalde hypothese (bij de drempel). Het is de evaluatie van de (diagnostische) gebeurtenis ten opzichte van de drempel die dient als de uiteindelijke output van onze besluitvormings- en redeneerprocessen. Zoals uit ons model blijkt, hangt dit af van de veronderstelling dat zowel systeem I als systeem II parallel werken, en van de omschakeling van de controle van het ene systeem op het andere volgens de default-interventionist-hypothese. Merk op dat afhankelijk van de activering van de γ-parameter en de beoordeling van de voordelen (winsten) en de nadelen (verliezen) de controle kan worden uitgeoefend door een van beide systemen: soms zal het het intuïtieve systeem zijn dat de controle zal uitoefenen en zal onze actie de vorm aannemen van een “gevoel van juistheid” ; soms zal het systeem II zijn dat de overhand zal hebben en onze beslissingen zal sturen. Aldus slagen wij erin om parallelle concurrerende met default-interventionalist modellen te verenigen door het additieve model van Mukherjee met het drempelmodel voor besluitvorming te verbinden.
Zoals hierboven besproken, kunnen vele factoren de schakelaar activeren zoals de aanwezigheid of de afwezigheid van empirische, kwantitatieve gegevens, de context van besluitvorming (b.v. beïnvloeden arm of rijk), de deskundigheid en de ervaring van de besluitvormer, enz. Bovendien heeft uitgebreid psychologisch onderzoek aangetoond dat mensen vaak gebruik maken van een eenvoudige heuristiek, die gebaseerd is op de prominente getallen als machten van 10 (b.v. 1,2,5,10,20,50,100,200 enz.) . Dat wil zeggen, hoewel systeem I de exacte berekeningen niet uitvoert, beoordeelt het toch “in grote lijnen” de relatieve voordelen en nadelen, en doet dat waarschijnlijk volgens een “1/10 aspiratieniveau” (afgerond op het dichtstbijzijnde getal) op zodanige wijze dat de schattingen van de verhouding voordelen/ nadelen veranderen met ordes van grootte van 1,2,5, 10, enz. Daarom beschouwen wij in dit hoofdstuk verschillende prototypische situaties: 1) wanneer γ = 0, 0.5, of 1; 2) wanneer BII>> HII, BII = HII en BII <<HII; en 3) wanneer spijt van verzuim (BI) << spijt van opdracht (HI), BI = HI, of BI>> HI
Eerst dient opgemerkt te worden dat γ=0, wanneer de teller van de linker breuk in vergelijking 6 ( Additional file 1: Appendix) nul is, d.e., wanneer p B II – 1 – p H II = 0 , of oplossen voor p, verkrijgen we p = 1 1 + B II H II , hetgeen precies de waarde is van de EUT-drempel voor de waarschijnlijkheid waarbij de verwachte utiliteiten van de twee opties gelijk zijn. Dit komt overeen met model #3 hierboven, waarin systeem II volledige controle uitoefent over de besluitvorming. Wanneer γ = 0, hebben we dus het klassieke EUT- en therapeutische drempelmodel. In dit geval heeft spijt geen invloed op de voordelen en nadelen van de EUT, en p t = H II H II + B II = 1 1 + B II H II . Als BII>> HII, benadert pt nul en zal een besluitvormer aan vrijwel iedereen een behandeling aanbevelen. Aan de andere kant, als BII = HII, is pt gelijk aan 0,5 en zal zij misschien behandeling aanbevelen als de ziekte even waarschijnlijk is als niet. Als BII << HII is, nadert pt 1,0 en zal de besluitvormer naar verwachting alleen een behandeling aanbevelen als zij absoluut zeker is van de diagnose.
Aan het andere uiterste, als γ = 1, hebben we het zuivere systeem-I-model (dat overeenkomt met model #3 hierboven, dat alleen op systeem-I-processen berust). Let op de waarde van γ=1, wanneer de noemer van de tweede breuk in vergelijking 6 ( Additional file 1: Appendix) gelijk is aan één, of wanneer de uitdrukking H I – B I = 0 , d.w.z., wanneer B I =H I . Onder deze voorwaarden is het vrij duidelijk dat de systeem I-evaluaties irrelevant worden als het waargenomen netto voordeel van de behandeling gelijk is aan de waargenomen netto schade. Wanneer γ=1, wordt het vermijden van spijt de belangrijkste motivator, niet de voordelen en de schade voor de EUT. Merk op dat in systeem I p niet gerelateerd is aan γ in termen van de waardering (vergelijking 1). Onder deze omstandigheden werkt alleen besluitvorming volgens systeem I en worden de analytische processen van systeem II onderdrukt (vergelijking 1), zoals te zien is bij die besluitvormers die de neiging hebben alleen intuïtie te volgen, of extreem beïnvloed worden door hun ervaringen uit het verleden zonder rekening te houden met nieuwe feiten op het terrein. Dat wil zeggen, verschillen in waarschijnlijkheid spelen geen rol bij dergelijke beslissingen, omdat iemand die alleen systeem I gebruikt waarschijnlijkheid niet als factor in overweging neemt.
Finitief, als γ = 0,5, wordt de beslisser gemotiveerd door EUT en door het vermijden van spijt (model #2 hierboven). In dit geval spelen de voordelen (BII), de nadelen (HII), de spijt van het weglaten (BI) en de spijt van het doen (HI) allemaal een actieve rol. Deze drie gevallen zijn weergegeven in tabel 1 (zie aanvullend bestand 2), waarin de drempelwaarschijnlijkheid voor γ = 0,5 en objectieve gegevens die wijzen op een hoge baten/schadelijk-verhouding ( B II / H II = 10 ). Ook wordt getoond hoe de drempelwaarschijnlijkheid afhangt van de individuele risicoperceptie. Als HI>> HI, vergroot dit het effect van BI/HI (zie vergelijking 3), wat resulteert in extreem gedrag in de zin van toenemende waarschijnlijkheid dat zo’n persoon ofwel altijd een behandeling zal accepteren (als pt<0) of afwijzen (als pt>1). Voor HI <<HII is het effect op de manier waarop systeem I voordelen en schade verwerkt niet zo uitgesproken en beïnvloedt het de EUT-drempel in veel mindere mate.