Federated Learning Enables Big Data for Rare Cancer Boundary Detection

Pati, Sarthak; Baid, Ujjwal; Edwards, Brandon; Sheller, Micah; Wang, Shih-Han; Reina, G Anthony; Foley, Patrick; Gruzdev, Alexey; Karkada, Deepthi; Davatzikos, Christos; Sako, Chiharu; Ghodasara, Satyam; Bilello, Michel; Mohan, Suyash; Vollmuth, Philipp; Brugnara, Gianluca; Preetha, Chandrakanth J; Sahm, Felix; Maier-Hein, Klaus; Zenk, Maximilian; Bendszus, Martin; Wick, Wolfgang; Calabrese, Evan; Rudie, Jeffrey; Villanueva-Meyer, Javier; Cha, Soonmee; Ingalhalikar, Madhura; Jadhav, Manali; Pandey, Umang; Saini, Jitender; Garrett, John; Larson, Matthew; Jeraj, Robert; Currie, Stuart; Frood, Russell; Fatania, Kavi; Huang, Raymond Y; Chang, Ken; Balana, Carmen; Capellades, Jaume; Puig, Josep; Trenkler, Johannes; Pichler, Josef; Necker, Georg; Haunschmidt, Andreas; Meckel, Stephan; Shukla, Gaurav; Liem, Spencer; Alexander, Gregory S; Lombardo, Joseph; Palmer, Joshua D; Flanders, Adam E; Dicker, Adam P; Sair, Haris I; Jones, Craig K; Venkataraman, Archana; Jiang, Meirui; So, Tiffany Y; Chen, Cheng; Heng, Pheng Ann; Dou, Qi; Kozubek, Michal; Lux, Filip; Michálek, Jan; Matula, Petr; Keřkovský, Miloš; Kopřivová, Tereza; Dostál, Marek; Vybíhal, Václav; Vogelbaum, Michael A; Mitchell, J Ross; Farinhas, Joaquim; Maldjian, Joseph A; Yogananda, Chandan Ganesh Bangalore; Pinho, Marco C; Reddy, Divya; Holcomb, James; Wagner, Benjamin C; Ellingson, Benjamin M; Cloughesy, Timothy F; Raymond, Catalina; Oughourlian, Talia; Hagiwara, Akifumi; Wang, Chencai; To, Minh-Son; Bhardwaj, Sargam; Chong, Chee; Agzarian, Marc; Falcão, Alexandre Xavier; Martins, Samuel B; Teixeira, Bernardo C A; Sprenger, Flávia; Menotti, David; Lucio, Diego R; LaMontagne, Pamela; Marcus, Daniel; Wiestler, Benedikt; Kofler, Florian; Ezhov, Ivan; Metz, Marie; Jain, Rajan; Lee, Matthew; Lui, Yvonne W; McKinley, Richard; Slotboom, Johannes; Radojewski, Piotr; Meier, Raphael; Wiest, Roland; Murcia, Derrick; Fu, Eric; Haas, Rourke; Thompson, John; Ormond, David Ryan; Badve, Chaitra; Sloan, Andrew E; Vadmal, Vachan; Waite, Kristin; Colen, Rivka R; Pei, Linmin; Ak, Murat; Srinivasan, Ashok; Bapuraj, J Rajiv; Rao, Arvind; Wang, Nicholas; Yoshiaki, Ota; Moritani, Toshio; Turk, Sevcan; Lee, Joonsang; Prabhudesai, Snehal; Morón, Fanny; Mandel, Jacob; Kamnitsas, Konstantinos; Glocker, Ben; Dixon, Luke V M; Williams, Matthew; Zampakis, Peter; Panagiotopoulos, Vasileios; Tsiganos, Panagiotis; Alexiou, Sotiris; Haliassos, Ilias; Zacharaki, Evangelia I; Moustakas, Konstantinos; Kalogeropoulou, Christina; Kardamakis, Dimitrios M; Choi, Yoon Seong; Lee, Seung-Koo; Chang, Jong Hee; Ahn, Sung Soo; Luo, Bing; Poisson, Laila; Wen, Ning; Tiwari, Pallavi; Verma, Ruchika; Bareja, Rohan; Yadav, Ipsa; Chen, Jonathan; Kumar, Neeraj; Smits, Marion; van der Voort, Sebastian R; Alafandi, Ahmed; Incekara, Fatih; Wijnenga, Maarten MJ; Kapsas, Georgios; Gahrmann, Renske; Schouten, Joost W; Dubbink, Hendrikus J; Vincent, Arnaud JPE; Bent, Martin J van den; French, Pim J; Klein, Stefan; Yuan, Yading; Sharma, Sonam; Tseng, Tzu-Chi; Adabi, Saba; Niclou, Simone P; Keunen, Olivier; Hau, Ann-Christin; Vallières, Martin; Fortin, David; Lepage, Martin; Landman, Bennett; Ramadass, Karthik; Xu, Kaiwen; Chotai, Silky; Chambless, Lola B; Mistry, Akshitkumar; Thompson, Reid C; Gusev, Yuriy; Bhuvaneshwar, Krithika; Sayah, Anousheh; Bencheqroun, Camelia; Belouali, Anas; Madhavan, Subha; Booth, Thomas C; Chelliah, Alysha; Modat, Marc; Shuaib, Haris; Dragos, Carmen; Abayazeed, Aly; Kolodziej, Kenneth; Hill, Michael; Abbassy, Ahmed; Gamal, Shady; Mekhaimar, Mahmoud; Qayati, Mohamed; Reyes, Mauricio; Park, Ji Eun; Yun, Jihye; Kim, Ho Sung; Mahajan, Abhishek; Muzi, Mark; Benson, Sean; Beets-Tan, Regina G H; Teuwen, Jonas; Herrera-Trujillo, Alejandro; Trujillo, Maria; Escobar, William; Abello, Ana; Bernal, Jose; Gómez, Jhon; Choi, Joseph; Baek, Stephen; Kim, Yusung; Ismael, Heba; Allen, Bryan; Buatti, John M; Kotrotsou, Aikaterini; Li, Hongwei; Weiss, Tobias; Weller, Michael; Bink, Andrea; Pouymayou, Bertrand; Shaykh, Hassan F; Saltz, Joel; Prasanna, Prateek; Shrestha, Sampurna; Mani, Kartik M; Payne, David; Kurc, Tahsin; Pelaez, Enrique; Franco-Maldonado, Heydy; Loayza, Francis; Quevedo, Sebastian; Guevara, Pamela; Torche, Esteban; Mendoza, Cristobal; Vera, Franco; Ríos, Elvis; López, Eduardo; Velastin, Sergio A; Ogbole, Godwin; Oyekunle, Dotun; Odafe-Oyibotha, Olubunmi; Osobu, Babatunde; Shu'aibu, Mustapha; Dorcas, Adeleye; Soneye, Mayowa; Dako, Farouk; Simpson, Amber L; Hamghalam, Mohammad; Peoples, Jacob J; Hu, Ricky; Tran, Anh; Cutler, Danielle; Moraes, Fabio Y; Boss, Michael A; Gimpel, James; Veettil, Deepak Kattil; Schmidt, Kendall; Bialecki, Brian; Marella, Sailaja; Price, Cynthia; Cimino, Lisa; Apgar, Charles; Shah, Prashant; Menze, Bjoern; Barnholtz-Sloan, Jill S; Martin, Jason; Bakas, Spyridon

doi:10.1038/s41467-022-33407-5

Computer Science > Machine Learning

arXiv:2204.10836 (cs)

[Submitted on 22 Apr 2022 (v1), last revised 25 Apr 2022 (this version, v2)]

Title:Federated Learning Enables Big Data for Rare Cancer Boundary Detection

Authors:Sarthak Pati, Ujjwal Baid, Brandon Edwards, Micah Sheller, Shih-Han Wang, G Anthony Reina, Patrick Foley, Alexey Gruzdev, Deepthi Karkada, Christos Davatzikos, Chiharu Sako, Satyam Ghodasara, Michel Bilello, Suyash Mohan, Philipp Vollmuth, Gianluca Brugnara, Chandrakanth J Preetha, Felix Sahm, Klaus Maier-Hein, Maximilian Zenk, Martin Bendszus, Wolfgang Wick, Evan Calabrese, Jeffrey Rudie, Javier Villanueva-Meyer, Soonmee Cha, Madhura Ingalhalikar, Manali Jadhav, Umang Pandey, Jitender Saini, John Garrett, Matthew Larson, Robert Jeraj, Stuart Currie, Russell Frood, Kavi Fatania, Raymond Y Huang, Ken Chang, Carmen Balana, Jaume Capellades, Josep Puig, Johannes Trenkler, Josef Pichler, Georg Necker, Andreas Haunschmidt, Stephan Meckel, Gaurav Shukla, Spencer Liem, Gregory S Alexander, Joseph Lombardo, Joshua D Palmer, Adam E Flanders, Adam P Dicker, Haris I Sair, Craig K Jones, Archana Venkataraman, Meirui Jiang, Tiffany Y So, Cheng Chen, Pheng Ann Heng, Qi Dou, Michal Kozubek, Filip Lux, Jan Michálek, Petr Matula, Miloš Keřkovský, Tereza Kopřivová, Marek Dostál, Václav Vybíhal, Michael A Vogelbaum, J Ross Mitchell, Joaquim Farinhas, Joseph A Maldjian, Chandan Ganesh Bangalore Yogananda, Marco C Pinho, Divya Reddy, James Holcomb, Benjamin C Wagner, Benjamin M Ellingson, Timothy F Cloughesy, Catalina Raymond, Talia Oughourlian, Akifumi Hagiwara, Chencai Wang, Minh-Son To, Sargam Bhardwaj, Chee Chong, Marc Agzarian, Alexandre Xavier Falcão, Samuel B Martins, Bernardo C A Teixeira, Flávia Sprenger, David Menotti, Diego R Lucio, Pamela LaMontagne, Daniel Marcus, Benedikt Wiestler, Florian Kofler, Ivan Ezhov, Marie Metz et al. (179 additional authors not shown)

View PDF

Abstract:Although machine learning (ML) has shown promise in numerous domains, there are concerns about generalizability to out-of-sample data. This is currently addressed by centrally sharing ample, and importantly diverse, data from multiple sites. However, such centralization is challenging to scale (or even not feasible) due to various limitations. Federated ML (FL) provides an alternative to train accurate and generalizable ML models, by only sharing numerical model updates. Here we present findings from the largest FL study to-date, involving data from 71 healthcare institutions across 6 continents, to generate an automatic tumor boundary detector for the rare disease of glioblastoma, utilizing the largest dataset of such patients ever used in the literature (25,256 MRI scans from 6,314 patients). We demonstrate a 33% improvement over a publicly trained model to delineate the surgically targetable tumor, and 23% improvement over the tumor's entire extent. We anticipate our study to: 1) enable more studies in healthcare informed by large and diverse data, ensuring meaningful results for rare diseases and underrepresented populations, 2) facilitate further quantitative analyses for glioblastoma via performance optimization of our consensus model for eventual public release, and 3) demonstrate the effectiveness of FL at such scale and task complexity as a paradigm shift for multi-site collaborations, alleviating the need for data sharing.

Comments:	federated learning, deep learning, convolutional neural network, segmentation, brain tumor, glioma, glioblastoma, FeTS, BraTS
Subjects:	Machine Learning (cs.LG); Image and Video Processing (eess.IV)
Cite as:	arXiv:2204.10836 [cs.LG]
	(or arXiv:2204.10836v2 [cs.LG] for this version)
	https://doi.org/10.48550/arXiv.2204.10836
Related DOI:	https://doi.org/10.1038/s41467-022-33407-5

Submission history

From: Brandon Edwards [view email]
[v1] Fri, 22 Apr 2022 17:27:00 UTC (33,783 KB)
[v2] Mon, 25 Apr 2022 20:07:43 UTC (39,217 KB)

Computer Science > Machine Learning

Title:Federated Learning Enables Big Data for Rare Cancer Boundary Detection

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Machine Learning

Title:Federated Learning Enables Big Data for Rare Cancer Boundary Detection

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators