Data Science incontra Life Science: utilizzare il Deep Learning per una migliore diagnosi del cancro

In un recente studio presentato in occasione della Conferenza “Strata Data” a San Jose, in California, i ricercatori di Dell Mauro Damo, Wei Lin, Ronaldo Braga e William Schneider hanno dimostrato che l’uso di macchine per analizzare le immagini mediche, in particolare gli organi umani malati, può ridurre al minimo il rischio di errori e accelerare la diagnosi della malattia.

Utilizzando più di 5.000 immagini a risonanza magnetica (MRI) scansionate lungo il piano trasversale dal Cancer Imaging Archive, i data scientists di Dell hanno tentato di identificare il cancro della vescica utilizzando un network neurale a convoluzione a sei strati (CNN). Tali networks hanno identificato con successo volti, oggetti e segnali stradali e sono utilizzati per la “vista” nei robot e per le auto a guida autonoma.

Lo studio Dell ha monitorato quattro dei quattordici tipi di tumori primari – T2a, T2b, T3a e T4a – in pazienti già diagnosticati con carcinoma della vescica. Sono stati utilizzati anche algoritmi per identificare differenze significative tra le immagini per valutare quali caratteristiche potrebbero essere rilevanti per il rilevamento del cancro alla vescica. Il cancro alla vescica, il quarto tumore più comune negli uomini, colpisce 430.000 persone e le loro famiglie ogni anno in tutto il mondo. Il costo medico diretto per la cura del cancro alla vescica è stato di $ 125 miliardi nel 2010 a livello globale.

Per condurre la ricerca, i membri del team hanno utilizzato un performante hardware e software open source, tra cui:

  • Server Dell PowerEdge con processori Intel Xeon E5-2680 a 2,7 GHz con 8 core e 384 GB
  • NVIDIA GRID K2 con 2 GPU
  • Linguaggio di script open source Python
  • Pacchetto open-source deep learning di TensorFlow 1.4
  • Pacchetto open-source per trasformazione di immagini SimpleITK

I ricercatori hanno imparato che la GPU e la memoria della CPU sono più importanti dei cicli nell’hardware e che gli errori di memoria sono molto comuni quando si lavora con dati medici. Per i modelli che richiedono settimane per funzionare, è preferibile migliorare la memoria e i cicli o utilizzare una piattaforma distribuita; in caso contrario, è preferibile disporre di più memoria per adattarsi a tutti i processi di inizializzazione dei pesi e mini batch.

Utilizzando la network neurale convoluzionale a sei strati (CNN), il modello di deep learning dello studio ha migliorato l’accuratezza della Top 1 dal 72,3 percento all’81,3 percento, mostrando il potenziale per esplorare tecniche simili in applicazioni pratiche. I ricercatori hanno notato che la raccolta di un maggior numero di dati nelle prime fasi del cancro, l’analisi di più tipi di tumori primari e l’uso di modelli CNN indipendenti per tutti i piani (coronale, trasversale e sagittale) probabilmente potrebbe milgiorare i risultati.

Per saperne di più su come il deep learning possa migliorare la ricerca e i processi nella sanità, servizi finanziari, vendita al dettaglio, produzione e altri settori, esplora le Dell Ready Solutions per AI, Machine e Deep Learning o contatta il rappresentante Dell al numero 1-866-438 -3622. Saremo lieti di mostrarti una demo nel nostro Dell HPC & AI Innovation Lab, che è all’avanguardia nel machine learning, testando nuove tecnologie e calibrando algoritmi e applicazioni per stare al passo con questa industria in continua evoluzione.

Janet Morss

Dell Ready Solutions

About the Author: Janet Morss

Passionate about data analytics, including machine learning and high performance computing, Janet Morss works in product marketing. Her favorite: Sharing the amazing impact our customers have on people's lives using technology. Prior to joining Dell EMC, Janet worked in HPE Server Strategy, Planning and Operations with a focus on SMB and Enterprise solutions. With multiple degrees and a love of learning, Janet is a start-up style marketer from Colorado who loves to snowboard.