Big-data per la raccolta ”real-life"
TEAM: Big-data per la raccolta ”real-life”
Team composition
Taem Leader: Gian Maria Zaccaria, PhD
Team members: Team leaders del Dipartimento di Area Medica e di Area Chirurgica, Raffaella Massafra, MSc; Annarita Fanizzi, PhD; Maria Colomba Comes PhD; Samantha Bove, MSc; Simona De Summa, PhD; Giuseppe Carella, MBA; Felice Clemente, MSc.
Work Program
La quantità di dati clinici e biologici accumulati nella pratica clinica quotidiana sta crescendo in modo esponenziale. Al giorno d'oggi, linee di ricerca indipendenti includono spesso flussi di lavoro incentrati sull'analisi di grandi set di dati clinici insieme alla genomica o trascrittomica per scopi prognostici/predittivi. Allo stesso modo, la complessità dei dati per una robusta prognosi/previsione in oncologia è notevolmente aumentata. I dati di “real-life” sono comunemente ottenuti da fonti frammentate come registri medici, registri elettronici, database monocentrici, annotazioni cartacee o relative alle biobanche. Sfortunatamente, una limitazione comune dei dati esistenti è la loro natura retrospettiva.
L’IRCCS Istituto “Giovanni Paolo II” partecipa al consorzio RedCap (https://www.project-redcap.org/). REDCap (Research electronic Data Capture) è un’applicazione web sicura per la costruzione e la gestione online di questionari e progetti di raccolta dati a supporto della ricerca clinica e traslazionale. Il sistema permette la progettazione di piattaforme di raccolta dati ovvero CRF (case report forms) elettroniche di
di studi osservazionali longitudinali o interventistici prospettici. RedCap permette una raccolta dati orientata all’elaborazione ottimizzando le risorse del data-management. Il sistema permette di definire interfacce di raccolta dati clinici e molecolari in funzione dei timepoint personalizzabili.
Il team di ricerca si occupa di implementare in modo strutturato una piattaforma di raccolta del dato “Real-life” in RedCap per le patologie oncologiche ed ematologiche. Tale piattaforma permetterà ai ricercatori dei singoli team di ricerca di poter validare le ipotesi scientifiche che richiedono la disponibilità di ampie coorti di validazione. Il team si compone di personale ingegneristico e matematico con capacità di programmazione per implementare:
- dei tool che automatizzino la raccolta del dato attraverso l’applicazione di tecnologie basate su NLP (Natural Language Processing) e OCR (Optical Character Recognition).
- dei modelli matematici che, sulla base degli endopoint clinici, identifichino nuovi profili prognostici.
Team networks: • Fondazione Italiana Linfomi (FIL); • ACC (Alleanza Contro il Cancro) Bioinformatics e Genomics; • Associazione Italiana di Fisica Medica (AIFM).
Collaborazioni attive:
- Istituto Nazionale di Fisica Nucleare (INFN).
- Radiodiagnostica ad indirizzo senologico, Policlinico Bari.
- Dip. di Ingegneria Elettrica e dell’Informazione, Politecnico di Bari.
- Dip. Interateneo di Fisica, Università degli Studi di Bari.
- Dip. di Matematica, Università degli Studi di Bari.
Key funding: Ricerca Corrente 2022- Ministero della Salute.
Key pubblications:
• Electronic case report forms generation from pathology reports by ARGO, automatic record generator for onco-hematology. G.M. Zaccaria, V. Colella, S. Colucci, F. Clemente, F. Pavone, M.C. Vegliante, F. Esposito, G. Opinto, A. Scattone, G. Loseto, C. Minoia, B. Rossini, A.M. Quinto, V.
Angiulli, L.A. Grieco, A. Fama, S. Ferrero, R. Moia, A. Di Rocco, F.M. Quaglia, V. Tabanelli, A. Guarini, S. Ciavarella S.Sci Rep. 2021 Dec 10;11(1):23823. doi: 10.1038/s41598-021-03204-z.PMID: 34893665.
• NR1H3 (LXRα) is associated with pro-inflammatory macrophages, predicts survival and suggests potential therapeutic rationales in diffuse large b-cell lymphoma. M.C. Vegliante, S. Mazzara, G.M. Zaccaria, S. De Summa, F. Esposito, F. Melle, G. Motta, M.R. Sapienza, G. Opinto, G. Volpe, A. Bucci, G. Gargano, A. Enjuanes, V. Tabanelli, S. Fiori, C. Minoia, F. Clemente, A. Negri, A. Gulino, G. Morello, A. Scattone, A.F. Zito, S. Tommasi, C. Agostinelli, U. Vitolo, A. Chiappella, A.M. Barbui, E. Derenzini, P.L. Zinzani, B. Casadei, A. Rivas-Delgado, A. López-Guillermo, E. Campo, A. Moschetta, A. Guarini, S.A. Pileri, S. Ciavarella. Hematol Oncol. 2022 Jul 18. doi: 10.1002/hon.3050.
• Spectrum of Germline Pathogenic Variants in BRCA1/2 Genes in the Apulian Southern Italy Population: Geographic Distribution and Evidence for Targeted Genetic Testing. M. Patruno, S. De Summa, N. Resta, M. Caputo, S. Costanzo, M. Digennaro, B. Pilato, R. Bagnulo, A. Pantaleo, C.
Simone, M.I. Natalicchio, E. De Matteis, P. Tarantino, S. Tommasi, A. Paradiso. Cancers. 2021, 13, 4714. DOI: 10.3390/cancers13184714.
• A ultrasound-based radiomic approach to predict the nodal status in clinically negative breast cancer patients. S. Bove, M.C. Comes, V. Lorusso, C. Cristofaro, V. Didonna, G. Gatta, F. Giotta, D. La Forgia, A. Latorre, M.I. Pastena, N. Petruzzellis, D. Pomarico, L. Rinaldi, P. Tamborra, A. Zito, A. Fanizzi, R. Massafra. Sci Rep 12, 7914 (2022). https://doi.org/10.1038/s41598-022-11876-4.
• Early prediction of neoadjuvant chemotherapy response by exploiting a transfer learning approach on breast DCE-MRIs. M.C. Comes, A. Fanizzi, S. Bove, V. Didonna, S. Diotaiuti, D. La Forgia, A. Latorre, E. Martinelli, A. Mencattini, A. Nardone, A.V. Paradiso, C.M. Ressa, P. Tamborra, V. Lorusso, R. Massafra. Sci Rep 11, 14123 (2021). https://doi.org/10.1038/s41598-021-93592-z.
• A clinical prognostic model based on machine-learning from the Fondazione Italiana Linfomi (FIL) MCL0208 Phase III Trial. G.M. Zaccaria, S. Ferrero, E. Hoster, R. Passera, A. Evangelista, E. Genuardi, D. Drandi. M. Ghislieri, D. Barbero, I. Del Giudice, M. Tani, R. Moia, S. Volpetti, M.G.
Cabras, N. Di Renzo, F. Merli, D. Vallisa, M. Spina, A. Pascarella, G. Latte, C. Patti, A. Fabbri, A. Guarini, U. Vitolo, O. Hermine, H.C. Kluin-Nelemans, S. Cortelazzo, M. Dreyling, and M. Ladetto. Cancers. 2021, 14, 188. DOI: https://doi.org/10.3390/cancers14010188.
• Developing and Validating a Simplified Score to Predict Early Relapse in Newly Diagnosed Multiple Myeloma (S-ERMM): Analysis from a Pooled Dataset of 2190 Patients. G.M. Zaccaria, L. Bertamini, A. Petrucci, M. Offidani, P. Corradini, A. Capra, A. Romano, A. M. Liberati, D. Mannina, P. de Fabritiis, N. Cascavilla, M. Ruggeri, R. Mina, F. Patriarca, G. Benevolo, A. Belotti, G. Gaidano, R. Hajek, A. Spencer, P. Sonneveld, P. Musto, M. Boccadoro, and F. Gay. Clinical Cancer Research. 2021; 27:3695-703. DOI: 10.1158/1078-0432.CCR-21-0134.