Articles

Modelo de processamento dual da tomada de decisões médicas

Posted on

Um modelo de sistema dual

Construção da investigação empírica anterior, que demonstrou de forma convincente que a cognição humana é determinada tanto pelos processos do sistema I como do sistema II . Mukherjee desenvolveu recentemente um modelo matemático formal, que assume o funcionamento paralelo de ambos os sistemas, enquanto que a decisão final é uma combinação ponderada das avaliações de ambos os sistemas com base no paradigma de maximização de valor (Figura 1) . (NB. Neste artigo empregamos os termos sistema I e sistema II como popularizados por Kahneman, embora alguns autores prefiram falar do processamento dos tipos 1 e 2, pois é quase certo que a cognição humana não está organizada em sistemas físicos distintamente separados ).

Figure 1
p>Modelo de tomada de decisão utilizando processos cognitivos de duplo processamento (após Mukherjee ]).

Mukherjee’s dual system model (DSM) assume que a avaliação da escolha arriscada (C) é formada pela entrada combinada dos sistemas I e II num único valor e pode ser formulada da seguinte forma

E C = γ V I C + 1 – γ V II C = γ 1 n ∑ i V I x i + 1 – γ k ∑ i p i V II x i
(1)

(1)

Onde C representa uma situação de tomada de decisão (“escolha”), n – número de resultados, p i – probabilidade do ith resultado, x i , da escolha seleccionada. V I representa a avaliação da decisão num modo de tomada de decisão autónomo, intuitivo, baseado no sistema I e V II , que pode ser uma função de utilidade, representa a avaliação num modo de tomada de decisão deliberativo, baseado em regras, baseado no sistema II. k-é uma constante de escala, e γ é o peso dado ao sistema I e pode ser interpretado como o grau relativo de envolvimento do sistema I no processo de tomada de decisão . O sistema II não está dividido em dois subsistemas defendidos por alguns, mas presume-se que adere aos critérios de racionalidade da teoria da utilidade esperada (EUT), como também é defendido pela ciência da decisão moderna . Presume-se que γ seja influenciado por uma série de processos que determinam o funcionamento do sistema I. Mukherjee enfatizou os seguintes factores como importantes determinantes do funcionamento do sistema I: tomada de decisão individual e predisposições de pensamento, natureza afectiva dos resultados (quanto maior a natureza afectiva dos resultados, maior é γ) e enquadramento e interpretação da tarefa de tomada de decisão (as decisões para o self terão provavelmente maior γ, bem como os problemas de decisão que são contextualizados e os que requerem resolução imediata ou são feitos sob pressão de tempo; os últimos quatro descrevem as circunstâncias características da tomada de decisão médica). Espera-se que a informação facilmente disponível, a nossa experiência anterior, a forma como a informação é processada (literalmente vs. obter o “essencial” da mesma), bem como as limitações de memória também afectem γ. Espera-se, portanto, que γ seja mais elevado quando a informação sobre probabilidades e resultados for ambígua ou não estiver prontamente disponível, ou quando um resultado anterior negativo muito grave for recordado. Por outro lado, quando tais dados estiverem disponíveis, a sua avaliação conjunta pelo sistema II reduzirá o γ. Em geral, os factores que definem o processo do sistema I podem ser classificados em 4 categorias principais: a) afectar, b) processos evolutivos com fios duros, responsáveis por respostas automáticas a potenciais perigos de tal forma que o sistema I normalmente dá maior peso a falsos positivos potenciais do que a falsos negativos (i.e. os humanos estão cognitivamente mais prontos a aceitar erroneamente o sinal de potenciais danos do que um que carrega o potencial de benefício), c) processos de aprendizagem excessiva do sistema II que foram relegados para o sistema I (tais como o efeito de treino intensivo que resulta no uso de heurística, ou “regras de ouro” ou directrizes de prática como uma das estratégias cognitivas de poupança de esforço. NB embora as directrizes possam ser os produtos dos processos do sistema analítico II, as suas aplicações tendem a ser um processo do sistema I), e (d) os efeitos da aprendizagem tácita .

Mukherjee modelo DSM baseia-se em provas empíricas que demonstram que os decisores num contexto rico em afectos são geralmente sensíveis apenas à presença ou ausência de estímulos, enquanto que em contextos pobres em afectos confiam no sistema II para avaliar a magnitude dos estímulos (e probabilidades) . Assim, a característica saliente do modelo é que esse sistema I reconhece os resultados apenas como sendo possíveis ou não. Por outro lado, o sistema II reconhece as probabilidades linearmente sem distorções, de acordo com o paradigma de utilidade esperado.

Como resultado, o processamento da dupla avaliação gera frequentemente instâncias em que as avaliações subjectivas são maiores a magnitudes de estímulo mais baixas (isto é, quando a tomada de decisão se baseia no sentimento, ou processos evolutivos com fios duros, tais como quando o sinal pode apresentar perigo) enquanto que o cálculo racional produz um valor maior a magnitudes elevadas . O DSM é capaz de explicar uma série de fenómenos que caracterizam a tomada de decisões humanas, tais como a) violação de dominância estocástica não transparente, b) padrão quádruplo de atitude de risco, c) aversão à ambiguidade, d) efeito de consequências comuns, e) efeito de rácio comum, f) efeito de isolamento, g) e efeito de coalescência e de divisão de eventos, .

A partir do pressuposto realista de que os resultados são positivos (ou seja utilitários >0, que é particularmente aplicável às funções de valor de potência, V I x = x m I , e V II x = x para o sistema I e sistema II, respectivamente, o DSM pode ser reescrito como:

V C = γ 1 n ∑ i x i m I + 1 – γ k ∑ i p i x i
(2)

where 0 < m I ≤ 1 Note que x i m I satisfaz a aversão ao risco para ganhos e procura de perdas e que o termo para o sistema II p i x i é linear sem distorções de risco.

Como observado por Mukherjee , a estimativa dos parâmetros na Equação 2) é um exercício de medição, que precisa de ser avaliado na futura investigação empírica. Consequentemente, as funções V II (x) e V I (x) poderiam ser alteradas, dependendo do cenário de tomada de decisão e dos objectivos do decisor. Da mesma forma, o parâmetro m pode não ser o mesmo para todos os resultados.

Modificação da DSM para a tomada de decisões médicas

Consideraremos uma situação típica na tomada de decisões clínicas em que um médico tem de escolher tratamento (Rx) vs. nenhum tratamento (NoRx) para a doença (D) que está presente com a probabilidade p. . Cada decisão resulta em resultados que têm um certo valor, xi. O modelo é apresentado na Figura 2. Como acima referido, o sistema I reconhece os resultados apenas como sendo possíveis (ou não), sendo assim insensível às probabilidades exactas. Cada resultado com probabilidade não nula tem o mesmo peso no sistema I. Assim, numa escolha com duas alternativas, cada probabilidade é igual a 0,5 no sistema I. O sistema II reconhece probabilidades sem distorções, como seria de esperar de acordo com a EUT.

Figure 2

Modelo de processamento manual de tomada de decisão, tal como aplicado a um dilema clínico, seja para tratar (Rx) o paciente com doença (D+) ou não. O paciente pode ou não ter uma doença (probabilidade p). Assume-se que o arrependimento funciona apenas ao nível do sistema I. (Note-se que a alternativa de tratamento concorrente pode incluir Rx ou NoRx). Rg- regret.

P>Pomos que entre as emoções que podem influenciar a avaliação dos resultados no processamento do sistema I, o arrependimento desempenha um papel importante, enquanto os processos do sistema II são dominados por deliberações racionais e analíticas de acordo com a EUT . Podemos definir o arrependimento (Rg) como a diferença (perda) nas utilidades do resultado da acção tomada e da acção que deveríamos ter tomado, em retrospectiva mas operando apenas ao nível do sistema I (ver Figura 2).

Hence, temos as seguintes funções de valor (ver Ficheiro adicional 1: Apêndice para derivação detalhada):

A avaliação geral da decisão a tratar (Rx) é igual a:

V R x = γ 2 V A R x , D + + V A R x , D – + 1 – γ k ( p V D ( R x , D + ) + 1 – p V D R x , D – ) = γ 2 x 2 m A – x 4 m A + 1 – γ k p x 1 + 1 – p x 2
(4)

E

V N o R x = γ 2 V A N o R x , D + + V A N o R x , D – + 1 – γ k p V D N o R x , D + + 1 – p V D N o R x , D – = γ 2 x 3 m A – x 1 m A + 1 – γ k p x 3 + 1 – p x 4
(5)

As diferenças nos resultados de tratar e não tratar o doente com doença são iguais ao benefício líquido do tratamento (B) ; a diferença nos resultados de não tratar e tratar os doentes sem doença é definida como danos líquidos (H) . Note-se que os benefícios e danos podem ser expressos nas várias unidades (tais como sobrevivência, mortalidade, morbilidade, custos, etc.) e podem ser formulados tanto como utilidades como desutilidades . Como explicado acima, assumimos ainda que a avaliação dos benefícios líquidos e danos líquidos pelo sistema I difere do sistema II. Assim, sob o sistema II, substituímos os benefícios líquidos e os danos líquidos utilizando definições EUT: B II = x 1 – x 3 e danos líquidos H II = x 4 – x 2 . No sistema I, definimos B I = x 1 m I – x 3 m I , e H I = x 4 m I – x 2 m I . Resolvendo para p (a probabilidade de doença em que somos indiferentes entre Rx e NoRx), obtemos: (Equação 3)

Isto significa que se a probabilidade de doença for superior a p t o decisor favorece o tratamento; caso contrário, uma alternativa de gestão concorrente (tal como “Sem Tratamento”) representa a estratégia de tratamento óptima. Note-se que k pode ser tipicamente fixado em 1, como o fazemos aqui. Note-se também que a primeira parte da equação é equivalente à expressão do limiar descrito no quadro EUT; a segunda expressão modifica o processo de tomada de decisão baseado no EUT do sistema II de tal forma que se os benefícios forem maiores do que os danos, a probabilidade do limiar é sempre menor do que o limiar EUT. Contudo, se um decisor experimenta H I >B I , a probabilidade limiar é sempre superior ao limiar EUT (ver abaixo para discussão no contexto do exemplo médico). Note-se que γ e a relação H I H II só contribuem para a magnitude em que o limiar duplo está acima ou abaixo do limiar EUT clássico. Ou seja, γ e o rácio H I H II não alteram a qualidade da relação entre o limiar duplo e o limiar EUT: se o limiar duplo será superior ou inferior ao limiar EUT depende apenas de um rácio B I H I.

De notar que as derivações idênticas podem ser obtidas aplicando o conceito de arrependimento esperado (em vez de EUT) . Embora se possa argumentar que o arrependimento é uma emoção poderosa que influencia todos os processos cognitivos (como a chamada “emoção cognitiva”) , e por isso pode funcionar tanto ao nível do sistema I como do sistema II , a maioria dos autores reconhece o valor de efeito do arrependimento . Assim, assumimos que o arrependimento funciona ao nível do sistema I . Portanto, no nosso modelo restringimos a influência do arrependimento ao sistema I. A propósito, a nossa Equação 3) também pode ser derivada do modelo geral DSM de Mukherjee mesmo que o arrependimento não seja especificamente invocado .

Altitude 3) implica cálculos exactos, mas não deve ser entendida como aquela que fornece um relato matemático preciso da tomada de decisões humanas. Pelo contrário, deve ser considerada mais como uma descrição semi-quantitativa ou qualitativa da forma como os médicos podem tomar as suas decisões. Em primeiro lugar, isto deve-se ao facto de o sistema que não efectua cálculos exactos, mas antes se basear na “essência” para a avaliação dos benefícios e prejuízos de uma forma mais qualitativa. O mecanismo depende de associações, emoções (assim chamadas, estimativas de “risco como sentimentos”), bem como da memória, e da experiência . Neste sentido, a segunda parte da Equação 3) que depende do sistema I pode ser entendida como o modificador qualitativo (“peso”), que, dependendo das estimativas de benefícios e danos do sistema I, aumenta ou diminui a primeira parte da equação (que depende da utilização precisa das provas de benefícios e danos do sistema II). Em segundo lugar, o próprio limiar de probabilidade deve ser considerado como um “limiar de acção” – a dada altura, um médico decide se deve ou não administrar tratamento. Normalmente, ela contrasta a probabilidade estimada de doença com o limiar e age: se a probabilidade de doença estiver acima do “limiar de acção”, o médico administra o tratamento; se estiver abaixo, ela decide não dar tratamento. Assim, uma forma de interpretar a Equação 3) é considerar a estimativa médica da “essência” do limiar de acção: se na sua estimativa, os benefícios globais do tratamento ultrapassam os danos, e ela considera que é “provável” que a probabilidade de doença esteja acima do limiar de probabilidade, então ela agiria e administraria o tratamento. Se a médica avaliar que é “improvável” que a probabilidade de doença esteja acima do “limiar de acção”, então ela não prescreveria o tratamento.

O comportamento do modelo DSM-M

Os mecanismos cognitivos exactos que estão subjacentes aos processos do sistema dual não são totalmente elucidados. Como discutido ao longo deste documento, muitos factores afectam o raciocínio dos processos duplos, levando a sugestões de que estes processos devem ser agrupados de acordo com os mecanismos predominantes . A concentração em cada um destes processos pode levar a propostas teóricas específicas. O nosso objectivo neste documento é fornecer uma arquitectura cognitiva abrangente que englobe características gerais da maioria dos conceitos teóricos existentes, ao mesmo tempo que se concentra em aspectos específicos da tomada de decisões médicas. Em geral, as teorias de duplo processamento dividem-se em dois grupos principais: as teorias competitivas paralelas e as teorias intervencionistaistas por defeito. As teorias de competição paralela pressupõem que os processos dos sistemas I e II prosseguem em paralelo, cada um competindo pelo controlo da resposta . Se houver um conflito, não é claro qual o mecanismo invocado para resolver o conflito . Por outro lado, as teorias de intervenção por defeito postulam que o sistema I gera uma resposta por defeito rápida e intuitiva, que pode ou não ser intervencionada por subsequente processamento lento e deliberativo do sistema II . Isto pode ser ainda operacionalizado através de vários mecanismos gerais que foram propostos na literatura:

  1. 1)

    Mukherjee modelo aditivo como descrito acima. Pode ser categorizado como uma variante da teoria da competição paralela, uma vez que pressupõe que os processos do sistema I e II prosseguem em paralelo, mas inclui o parâmetro γ, que pode desencadear uma maior ou menor activação do sistema I. O modelo de Mukherjee, contudo, não modela explicitamente as escolhas em termos de decisões categóricas (isto é, aceitar vs. não aceitar uma dada hipótese), o que é uma característica fundamental dos modelos de duplo processamento .

  2. 2)

    Sistema I e sistema II operam num continuum , mas de tal forma que o sistema I nunca dorme . Uma decisão final depende da activação de ambos os sistemas I e II . Foi estimado que cerca de 40-50% das decisões são determinadas por hábitos (isto é, pelo sistema I) . Esta é também uma variação da teoria da competição paralela; deve notar-se que a literatura mais recente está a afastar-se deste modelo .

  3. 3)

    A decisão final parece depender tanto do sistema I como do sistema II, de tal forma que o sistema I é o primeiro a sugerir uma resposta e o sistema II a endossa. Ao fazê-lo, o sistema II pode exercer o controlo total sobre o sistema I (tal como quando depende do modelo EUT) ou falhar completamente na supervisão do funcionamento do sistema I (por exemplo, devido à sua ignorância ou preguiça) . Portanto, de acordo com este modelo, as decisões são tomadas ou pelo sistema I (por defeito) ou pelo sistema II (que pode ou não intervir). Este é um modelo intervencionista por defeito.

  4. 4)

    A variação do modelo #3 é o chamado “modelo de alternância”, que propõe que o decisor utiliza constantemente processos cognitivos que oscilam entre os dois sistemas (alternância) . Esta é uma variante do modelo por defeito-intervencionista.

Nota que γ é contínua no nosso modelo, mas pode ser feita categoricamente se a teoria “toggle” for considerada como a correcta. Neste caso, pode ser introduzida uma troca lógica na árvore de decisão para permitir a alternância entre os dois sistemas. Mais importante ainda, ao ligar o modelo aditivo de Mukherjee com o modelo de limiar, fornecemos a arquitectura para conciliar as teorias competitivas paralelas com as teorias intervencionista-padrão. Fazemo-lo explicitando que as decisões são categóricas (via limiar) em certo grau de esforço cognitivo (modelado via γ) parâmetro . Ou seja, a questão-chave é que processos determinam a aceitação ou rejeição de uma determinada hipótese (de diagnóstico). O nosso modelo mostra que isto pode ocorrer se mantivermos uma arquitectura paralela ao modelo aditivo de Mukherjee mas assumirmos uma mudança, sim ou não resposta, se aceitamos ou rejeitamos uma dada hipótese (no limiar). É a avaliação do evento (diagnóstico) em relação ao limiar que serve como resultado final dos nossos processos de tomada de decisão e raciocínio. Como mostra o nosso modelo, isto depende da hipótese de funcionamento paralelo dos sistemas I e II, e da mudança no controlo de um sistema sobre outro de acordo com a hipótese de incumprimento-invencionalista. Note-se que dependendo da activação do parâmetro γ e da avaliação dos benefícios (ganhos) e prejuízos (perdas), o controlo pode ser exercido por qualquer um dos sistemas: por vezes será o sistema intuitivo que exercerá o controlo e a nossa acção assumirá a forma de “sentimento de correcção”; por vezes, será o sistema II que prevalecerá e impulsionará as nossas decisões. Assim, conseguimos unir modelos competitivos paralelos com modelos intervencionistas por defeito ligando o modelo aditivo de Mukherjee com o modelo de limiar para a tomada de decisões.

Como discutido acima, muitos factores podem activar a mudança, tais como a presença ou ausência de dados empíricos, quantitativos, o contexto da tomada de decisões (por exemplo, afectar pobres ou ricos), a perícia e experiência do decisor, etc. Além disso, uma extensa investigação psicológica demonstrou que as pessoas utilizam frequentemente uma simples heurística, que se baseia nos números proeminentes como poderes de 10 (por exemplo, 1,2,5,10,20,50,100,200 etc.) . Ou seja, embora o sistema I não efectue os cálculos exactos, continua a avaliar “essencial” dos benefícios e danos relativos, e provavelmente fá-lo de acordo com “1/10 nível de aspiração” (arredondado ao número mais próximo) de tal forma que as estimativas da relação benefícios/harmas mudam em 1,2,5, 10, etc., ordens de magnitude. Por conseguinte, nesta secção consideramos várias situações prototípicas: 1) quando γ = 0, 0.5, ou 1; 2) quando BII>> HII, BII = HII e BII <<HII; e 3) quando lamenta a omissão (BI) << lamenta a comissão (HI), BI = HI, ou BI>> HI

P>Primeiro, note que γ=0, quando o numerador da fracção esquerda na Equação 6 ( Ficheiro adicional 1: Apêndice) é zero, i.e., quando p B II – 1 – p H II = 0 , ou resolvendo para p, obtemos p = 1 1 + B II H II , que é exactamente o valor do limiar EUT para a probabilidade em que as utilidades esperadas das duas opções são as mesmas. Isto corresponderá ao modelo #3 acima, em que o sistema II exerce um controlo total sobre a tomada de decisões. Portanto, quando γ = 0, temos o modelo clássico EUT e o modelo de limiar terapêutico. Neste caso, o arrependimento não afecta os benefícios e danos do EUT, e p t = H II H II + B II = 1 1 + B II H II . Se BII>> HII, pt aproxima-se de zero e um decisor recomendará o tratamento a praticamente toda a gente. Por outro lado, se BII = HII, pt é igual a 0,5 e poderá recomendar tratamento se a doença for tão provável como não. Finalmente, se BII << HII, pt aproxima-se de 1.0, e espera-se que a decisora recomende o tratamento apenas se estiver absolutamente certa no diagnóstico.

No outro extremo, se γ = 1, temos o modelo puro do sistema I (correspondente ao modelo #3 acima, que se baseia unicamente nos processos do sistema I). Note-se o valor de γ=1, quando o denominador da segunda fracção na Equação 6 ( Ficheiro adicional 1: Anexo) é igual a um, ou quando a expressão H I – B I = 0 , isto é, quando B I =H I . Nestas condições, é bastante óbvio que a avaliação do sistema I se torna irrelevante se o benefício líquido percebido do tratamento for igual ao dano líquido percebido. Quando γ=1, a fuga ao arrependimento torna-se o principal motivador, e não os benefícios e danos do EUT. Note-se que no sistema I p não está relacionado com γ em termos de avaliação (Equação 1). Nestas circunstâncias, apenas a tomada de decisões no âmbito do sistema I funciona e os processos analíticos do sistema II são suprimidos (Equação 1), como se vê nos decisores que tendem a seguir apenas a intuição, ou são extremamente afectados pelas suas experiências passadas sem considerar novos factos no terreno. Ou seja, as diferenças de probabilidade não desempenham qualquer papel em tais decisões, porque uma pessoa que só utiliza o sistema I não considera a probabilidade como um factor.

Finalmente, se γ = 0,5, o decisor é motivado pela EUT e pela fuga ao arrependimento (modelo #2 listado acima). Neste caso, os benefícios (BII), danos (HII), lamentações de omissão (BI) e comissão (HI) são todos intervenientes activos. Estes três casos são apresentados no Quadro 1 (ver ficheiro adicional 2) que mostra probabilidades de limiar para γ = 0,5 e dados objectivos indicando uma elevada relação benefícios/ danos ( B II / H II = 10 ). Também é mostrado como a probabilidade de limiar depende da percepção do risco individual. Se HI>> HI, aumenta o efeito do BI/HI (ver Equação 3), o que resulta num comportamento extremo no sentido de aumentar a probabilidade de tal pessoa aceitar sempre (como pt<0) ou rejeitar tratamento (como pt>1). Para HI <<HII, o impacto na forma como o sistema I processa benefícios e danos não é tão pronunciado e influencia o limiar EUT em muito menor medida.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *