Richard Gill parte prima qui.
GLI ERRORI nel caso di De Berk erano tutt’altro che unici, dicono Gill e altri. “Noi umani siamo terribilmente bravi a vedere i modelli quando non ci sono”, afferma lo statistico Peter Green, professore emerito all’Università di Bristol e uno degli autori del rapporto RSS.
Gli investigatori a volte migliorano questi schemi solo contando le prove che confermano la loro teoria, scartando o nemmeno notando i dati che non lo fanno. Anche gli investigatori che mirano a essere imparziali possono fare scelte minori che si sommano a un quadro distorto, dice Thompson. “Ti ritrovi con una prova che sembra straordinariamente improbabile che si sia verificata per caso. E, naturalmente, il problema è che non si è verificato esattamente per caso: in un certo senso l’hai aiutato.”
Richard Gill teme che questo sia ciò che ha portato alla condanna nel 2006 di Geen, a cui sono stati dati 17 ergastoli, con una durata minima di 30 anni. I pubblici ministeri hanno sostenuto che c’era un alto tasso di arresti respiratori inspiegabili, che sono in genere più rari degli arresti cardiorespiratori, durante i turni di Geen, sebbene non abbiano cercato di quantificare la probabilità che questo “schema insolito” si sia verificato per caso.
Come nel caso di De Berk, c’erano altre prove, incluso il fatto che Geen aveva in tasca una siringa contenente miorilassante quando fu arrestato. L’accusa ha sostenuto che aveva iniettato il farmaco ai pazienti per provocare l’arresto respiratorio e poi fare l’eroe rianimandoli.
Gli avvocati della difesa di Geen hanno contestato il “modello insolito” in un appello del 2009, presentando un rapporto della statistica medica dell’Università di Warwick Jane Hutton. I giudici di appello hanno confermato la condanna. “I giudici sembravano essere molto sicuri di poter rilevare uno schema insolito senza inserire alcune delle informazioni più basilari di cui hai bisogno come confronto”, afferma Hutton.
In un articolo del 2022 pubblicato su Laws, Gill e colleghi hanno sostenuto che gli investigatori ciechi potrebbero aver raggiunto conclusioni diverse sul caso di Geen. L’alto tasso di arresti respiratori durante i suoi turni è stato accompagnato da un calo degli arresti cardiorespiratori, suggerendo una distorsione nel modo in cui questi casi sono stati classificati.
Rispetto ai dati dello stesso ospedale su un periodo di tempo più ampio, i decessi e le rianimazioni durante i turni di Geen non sembrano straordinari, hanno detto Gill e i suoi coautori. Lui e altri statistici hanno scritto lettere di sostegno nel 2015 quando Geen ha chiesto alla Criminal Cases Review Commission di esaminare il suo caso. La richiesta è stata respinta; Geen rimane in prigione.
ANCHE QUANDO gli esperti di statistica vengono coinvolti in un caso, possono non essere immuni da errori di ragionamento, come ha mostrato il lavoro di Elffers. Nel caso di Poggiali, l’infermiera italiana, gli statistici hanno scritto che un livello molto alto di significatività statistica è una “garanzia” che “c’è un effetto causale”, in questo caso tra Poggiali in servizio e le morti.
Ma questo è un noto errore di ragionamento: “La correlazione non è causalità”, dice Green. Thompson afferma che i cluster possono avere cause sorprendenti difficili o impossibili da scoprire. Indica i casi in cui le sostanze chimiche filtrate dall’attrezzatura o i cambiamenti nel latte artificiale erano colpevoli.
Gill e i suoi colleghi hanno scoperto che il tasso di mortalità di Poggiali era superiore a quello dei suoi colleghi, anche dopo vari controlli, ma hanno sostenuto che questo potrebbe essere spiegato almeno in parte dalle lunghe ore di lavoro di Poggiali, è arrivata molto presto ed è uscita tardi dai suoi turni, il che significava che era presente a più certificazioni di morte durante i passaggi di turno.
Hanno anche sottolineato un difetto statistico nelle prove mediche: un tossicologo aveva detto che la concentrazione di potassio trovata in uno degli occhi della vittima era inaspettatamente alta, suggerendo avvelenamento da cloruro di potassio. Ma questo non ha tenuto conto di alcuna incertezza statistica nei dati sui livelli attesi di potassio, hanno scritto Gill e colleghi in un articolo del 2021 su Law, Probability and Risk riassumendo i risultati che avevano contribuito a garantire l’assoluzione di Poggiali.
Richard Gill e la caccia alle streghe
Il caso Letby ora in tribunale mostra molte delle stesse caratteristiche preoccupanti dei casi precedenti, dicono Gill e altri. Letby è stata trasferita a mansioni d’ufficio nel 2016 dopo una serie di morti e rianimazioni durante i suoi turni, e arrestata per la prima volta nel 2018. È accusata di aver ucciso sette bambini e di aver tentato di ucciderne altri 10, utilizzando metodi come l’avvelenamento da insulina e l’iniezione di bolle d’aria.
Le somiglianze vanno oltre le statistiche al modo in cui Letby è stato diffamato. I commenti sui social media “ti fanno rivoltare lo stomaco”, dice Gill. “La gente dice che dovremmo riportare l’impiccagione, sparare alla cagna.” I media l’hanno dipinta come una “creatura malvagia”, afferma Neil Mackenzie, un avvocato con sede a Edimburgo, in Scozia, specializzato in casi di negligenza medica e coautore del rapporto RSS. “Penso che ci sia forse misoginia lì dentro”, dice Mackenzie. “La stampa ama le donne cattive.”
Il rapporto RSS Gill e altri pubblicato a settembre non afferma che Letby sia innocente, in parte perché un commento pubblico sulla colpevolezza o l’innocenza di una persona sotto processo può essere considerato oltraggio alla corte nei sistemi legali del Regno Unito. “Non dobbiamo avere alcuna opinione su questo caso”, dice Green, ma “qui c’è il potenziale per un errore giudiziario”.
Gill dice che un profondo pregiudizio cognitivo funziona contro gli imputati come Letby. Le persone “non credono nel caso, in realtà”, dice. “La meccanica quantistica ci ha gridato per 100 anni che l’universo fisico è costruito sulla casualità. … Ma questo non lo capiamo. Ci sconvolge profondamente. Quando accade una serie di cose brutte, sappiamo che deve esserci stato un agente responsabile. E così naturalmente crediamo nei diavoli e nelle streghe, negli dei e negli angeli.”
Tuttavia, NON TUTTI i casi di OMICIDIO MEDICO sono cacce alle streghe. “Questo è un caso in cui in realtà ci sono alcune streghe”, dice Thompson.
Nel 2000, ad esempio, un medico britannico di nome Harold Shipman è stato condannato per l’omicidio di 15 pazienti in un periodo di 3 anni dopo che un’indagine ha fornito prove che aveva somministrato overdose di diamorfina, eroina usata nel Regno Unito per il dolore intenso, e falsificato le cartelle cliniche di numerosi pazienti, suggerendo che erano stati più malati di quanto non fossero per far sembrare la loro morte meno sospetta.
Shipman era nel testamento di un paziente, ma le sue motivazioni non sono diventate chiare. Shipman, sospettato di aver ucciso altre centinaia, è stato condannato all’ergastolo ed è morto per suicidio nel 2004.
Un’inchiesta governativa durata 5 anni sulla scia del caso ha identificato modi per proteggere meglio i pazienti, come una maggiore supervisione dei certificati di morte. Il caso ha anche portato gli statistici a esplorare una nuova domanda: le statistiche potrebbero rilevare veri assassini, basandosi solo su un modello sospetto di morti?
Lo statistico di Cambridge David Spiegelhalter, che ha fornito consigli alla giuria, crede di sì. Lui e i suoi colleghi hanno adattato un metodo del controllo di qualità industriale per confrontare il tasso di certificati di morte firmati da Shipman nel tempo con i decessi negli studi di altri medici locali. Hanno scoperto che avrebbero potuto identificare uno schema preoccupante nei pazienti di Shipman 13 anni prima che fosse arrestato.
Un tale sistema produrrebbe falsi allarmi; più persone potrebbero morire sotto la cura di un medico o di un infermiere che si occupa di casi particolarmente difficili, per esempio. Ma un metodo robusto eviterebbe troppi fallimenti, afferma Spiegelhalter, e un “ping” nel sistema non dovrebbe mai essere considerato qualcosa di più di un segno che un essere umano dovrebbe guardare i dati.
Ma implementare questo tipo di monitoraggio di routine sarebbe molto complicato, afferma Bruce Guthrie, professore di medicina generale all’Università di Edimburgo. Il tipo di dati utilizzati da Spiegelhalter e dai suoi colleghi non viene raccolto di routine: è stato messo insieme come parte dell’indagine Shipman.
E Shipman lavorava da solo, cosa che fanno pochi medici di famiglia; è probabile che molti pazienti vedano più medici. È probabile che si presentino solo gli “assassini più orrendamente prolifici”, ha scritto Guthrie in una e-mail a Science.
Nel frattempo Thompson, Gill e altri chiedono correzioni culturali e istituzionali per prevenire condanne ingiuste. Molti avvocati trovano le statistiche impegnative, afferma Mackenzie. “Questo è uno dei mali del mito delle due culture”, dice: alcuni studenti sono incanalati in materie scientifiche, altri in discipline umanistiche, e “i due non si incontreranno mai”.
Niamh Nic Daeid, ricercatrice di scienze forensi presso l’Università di Dundee, afferma di incontrare abitualmente ansia e resistenza nei confronti delle statistiche. Nic Daeid, Spiegelhalter e altri hanno prodotto una serie di materiali di formazione statistica, tra cui un “primer” RSS e un corso online gratuito per avvocati.
Ma la formazione non è sufficiente, dice Thompson, perché i pregiudizi che sono alla base degli errori sono “integrati nei nostri processi percettivi”. Invece, dice, è fondamentale cambiare le procedure investigative. Il rapporto RSS raccomanda che gli investigatori siano accecati. Ad esempio, i patologi dovrebbero classificare le morti come sospette o meno senza sapere quale personale medico era presente, adattando i metodi di accecamento standardizzati utilizzati in epidemiologia per studiare i focolai di malattie.
Ma l’accecamento si è rivelato una vendita difficile tra gli scienziati forensi, in parte perché spesso è più impegnativo di quanto sembri, afferma Peter Stout, CEO dello Houston Forensic Science Center e un forte sostenitore dell’accecamento e di altre misure per migliorare la scienza forense.
Può significare, ad esempio, che un laboratorio di medicina legale, già a corto di fondi e tempo, ha bisogno di una persona in più che funga da case manager che controlli informazioni potenzialmente distorte da un analista cieco. E il confine tra informazioni rilevanti e irrilevanti non è sempre chiaro.
Decenni fa, prima che gli oppioidi dilagassero negli Stati Uniti, Stout e i suoi colleghi hanno passato settimane a eseguire tutti i test a cui potevano pensare su un campione, prima che un investigatore dicesse loro di cercare il fentanil. “Il mascheramento ha creato un costo enorme”, afferma.
Adele Quigley-McBride, ricercatrice sui pregiudizi cognitivi presso la Duke University, insegna agli analisti una tecnica chiamata smascheramento sequenziale. Il metodo aggira la linea sfocata tra informazioni rilevanti e irrilevanti dando agli investigatori l’accesso a quantità crescenti di informazioni ad ogni ciclo di analisi. Gli analisti annotano le loro osservazioni e conclusioni in ogni round; se nuove informazioni cambiano la loro opinione, devono spiegare perché.
GILL ERA ALLA CORTE d’appello di Arnhem nel 2010 quando fu annunciato il proscioglimento di De Berk. “È stato uno dei più grandi eventi della mia vita”, dice. “È stato davvero gioioso.” De Berk è stata immediatamente portata via dai suoi avvocati e i giornalisti hanno sciamato Derksen e De Noo. “Ho comprato una sigaretta di marijuana”, dice Gill, e poi ha preso un treno per L’Aia ed è andato in spiaggia. “Ho fumato la mia canna, ho mangiato un piatto di ostriche e ho bevuto del vino bianco”.
De Berk in seguito ha ricevuto scuse scritte dal ministro della giustizia olandese e un compenso finanziario non rivelato per i 6,5 anni trascorsi in prigione. Gill rimane in contatto con lei; le piacciono i suoi post su Facebook a volte. Ha detto a Gill che non voleva essere intervistata per questa storia. “È riuscita a mettere tutto da parte, e ha bisogno di mantenerlo così”, dice.
Tredici anni dopo, Gill, ora in pensione, sta osservando da vicino il caso Letby, ma la sua ossessione per le statistiche forensi ha cominciato a placarsi. I suoi progetti di pensionamento includono una serie di kerfuffles statistici con quote inferiori, come la valutazione dei venditori di aringhe olandesi. Ha molte altre cose a cui dedicare la sua attenzione: la vinificazione, una distilleria amatoriale, i nipoti. “Penso di aver raggiunto il punto in cui voglio passare più tempo nella foresta a raccogliere funghi, in realtà”, dice.
Spera che gli statistici più giovani si sentano obbligati ad aiutare quando le cattive statistiche portano all’ingiustizia, come ha fatto lui. “Ho sentito che nel caso Lucia avrei potuto fare la differenza”, dice Gill. “E questo quindi era quello che dovevo fare.”