Intel Labs e la Perelman School of Medicine della University of Pennsylvania (Penn Medicine) hanno portato a termine una ricerca congiunta utilizzando il federated learning, un approccio basato su intelligenza artificiale con machine learning distribuito, volto ad aiutare le organizzazioni sanitarie e di ricerca internazionali a identificare i tumori maligni al cervello. Si tratta del più grande studio di federated learning mai svolto, con un dataset globale proveniente da ben 71 organizzazioni dislocate nei cinque continenti, i cui risultati mostrano un miglioramento del 33% nella capacità di rilevare i tumori al cervello.
“Il federated learning ha un enorme potenziale in numerosi campi e in particolare in quello sanitario, come dimostra la nostra ricerca con Penn Medicine. La capacità di proteggere le informazioni e i dati sensibili apre la strada a studi e collaborazioni future, specialmente in quei casi in cui i dataset sarebbero altrimenti inaccessibili. Il nostro lavoro con Penn Medicine può avere ricadute positive sui pazienti di tutto il mondo e guardiamo con fiducia alla possibilità di continuare a esplorare le potenzialità del federated learning”. — Jason Martin, principal engineer, Intel Labs
Perché è importante il Federated Learning
L’accessibilità dei dati è da tempo un problema in campo medico a causa delle leggi locali e nazionali sulla privacy, come l’Health Insurance Portability and Accountability Act (HIPAA) negli Stati Uniti. Finora la condivisione di dati e ricerche mediche su grande scala era praticamente impossibile da realizzare senza compromettere informazioni sensibili sulla salute dei pazienti. L’hardware e il software di federated learning di Intel rispettano le normative sulla privacy preservando l’integrità e la sicurezza dei dati attraverso il confidential computing.
L’importante risultato ottenuto da Penn Medicine e Intel ha visto l’elaborazione di grandi volumi di dati nell’ambito di un sistema decentralizzato reso possibile dall’utilizzo della tecnologia di federated learning combinata a Intel Software Guard Extensions (SGX), consentendo di superare quelle barriere alla condivisione dei dati che storicamente hanno impedito ai ricercatori di collaborare in progetti analoghi di ricerca sul cancro. Il sistema affronta diverse problematiche di privacy lasciando i dati non elaborati all’interno delle infrastrutture di calcolo dei singoli enti, consentendo di inviare al server centrale solo gli aggiornamenti di modello calcolati a partire da un determinato gruppo di dati, e non i dati stessi.
“Puoi avere a disposizione tutta la potenza di calcolo del mondo, ma non servirebbe a niente senza una quantità sufficiente di dati da analizzare”, ha commentato Rob Enderle, principal analyst, Enderle Group. “L’impossibilità di analizzare dati già raccolti ha rallentato significativamente i progressi che l’AI potrebbe rendere possibili in campo medico. Questo studio di federated learning mostra un percorso sostenibile per consentire all’AI di realizzare il proprio potenziale, diventando lo strumento più efficace contro le malattie più complesse”.
Spyridon Bakas, PhD, assistente di patologia, medicina di laboratorio e radiologia presso la Perelman School of Medicine della University of Pennsylvania e autore senior della ricerca ha affermato: “In questo studio, il federated learning mostra la sua capacità di spostare il paradigma della sicurezza della collaborazione tra diverse istituzioni, dando accedesso al più grande e diversificato dataset di pazienti affetti da glioblastoma mai analizzato, assicurando al contempo la salvaguardia dei dati, che rimangono sempre negli istituti che li hanno raccolti. Quanti più dati riusciamo a inserire nei modelli di machine learning, tanto più precisi questi diventano, migliorando la nostra capacità di comprendere ed elaborare terapie per affrontare anche patologie rare come il glioblastoma”.
Per migliorare le terapie, i ricercatori necessitano di grandi quantità di dati medici e in buona parte dei casi i dataset richiesti vanno oltre la quantità di dati che possono essere raccolti da una singola organizzazione. La ricerca dimostra l’efficacia del federated learning su grande scala e i potenziali vantaggi per il settore sanitario. Tra questi il rilevamento precoce della malattia, che può migliorare la qualità e anche la speranza di vita del paziente.
I risultati della ricerca di Penn Medicine-Intel Labs sono stati pubblicati sulla testata peer-reviewed Nature Communications.
Informazioni sulla ricerca di Intel e Penn Medicine
Nel 2020, Intel e Penn Medicine hanno annunciato un accordo di cooperazione che prevedeva l’utilizzo del federated learning per migliorare il rilevamento dei tumori e le ricadute terapeutiche sul glioblastoma (GBM), il più comune e fatale dei tumori al cervello negli adulti con una sopravvivenza media di soli 14 mesi dopo una terapia standard. Benché le opzioni terapeutiche siano aumentate negli ultimi 20 anni, non si è ancora rilevato un miglioramento nei tassi di sopravvivenza. La ricerca è stata finanziata dal programma Informatics Technology for Cancer Research del National Cancer Institute, a sia volta parte dei National Institutes of Health negli Stati Uniti.
Penn Medicine e 71 enti medici e di ricerca internazionali hanno utilizzato l’hardware e il software di federated learning di Intel per migliorare il rilevamento delle forme più rare di tumore. Una nuova piattaforma AI allo stato dell’arte, denominata Federated Tumor Segmentation (FeTS) è stata utilizzata dai radiologi per determinare i confini di un tumore e identificare con maggiore precisione la “regione operabile”. I radiologi hanno annotato i dati rilevati utilizzando open federated learning (OpenFL), un’infrastruttura open source per istruire gli algoritmi di machine learning. La piattaforma è stata istruita utilizzando 3,7 milioni di immagini provenienti da 6.314 pazienti affetti da GBM nei 5 continenti, il più grande dataset relativo ai tumori al cervello mai realizzato.
I prossimi sviluppi
Con questo progetto Intel Labs e Penn Medicine hanno creato un proof of concept utilizzando il federated learning per ottenere conoscenza dai dati. Questa soluzione può avere un significativo effetto in campo medico-sanitario, particolarmente in altri tipi di ricerca sul cancro. Specificamente, Intel ha sviluppato il progetto open source OpenFL per consentire l’implementazione del federated learning su silos di dati reali, inserendoli con fiducia nel software Intel SGX. Inoltre, l’iniziativa FeTS è stata avviata sotto forma di rete collaborativa per fornire una piattaforma di sviluppo continuo e incoraggiare la collaborazione attraverso la piattaforma FeTS e il toolkit open source OpenFL, entrambi disponibili su GitHub.