Implementació d'un model de Machine Learning per la predicció del receptor d'estrogen en el càncer de mama
Autor/a
Otros/as autores/as
Fecha de publicación
2022-06Resumen
El càncer de mama és la neoplàsia maligna més freqüent entre les dones, i ocupa la primera posició pel que fa a mortalitat respecte als altres tipus de càncers. Per reduir els índexs de mortalitat, és summament important diagnosticar el càncer amb el menor temps possible. Una de les tendències creixents en els últims anys per ajudar en la diagnosi de malalties, és la intel·ligència artificial.
En aquest treball, es desenvoluparà un algoritme supervisat d’aprenentatge automàtic amb XGBoost, amb el propòsit de predir l’estatus del receptor d’estrogen, implicat en la classificació molecular del càncer de mama. Per avaluar l’eficàcia del model, es comparen els resultats amb els generats a través del model de regressió logística clàssica. S’obté un valor F, un dels mètodes estadístics utilitzats per determinar com de precís el model és, del 97% en el model de Machine Learning amb XGBoost, i un valor del 54% pel model clàssic. Així doncs, es conclou que el model d’aprenentatge automàtic generat amb XGBoost obté uns millors resultats a l’hora de classificar el receptor d’estrogen, i que és una eina potencial per generar prediccions, en la qual s’ha de continuar investigant i optimitzant, per a què pugui arribar a ser utilitzada no només en el camp de la medicina de diagnosi, sinó que també en altres àrees mèdiques.
Breast cancer (BC) is the most common malignant disease diagnosed in women. Amongst all the different types of cancer, it is considered one of the leading causes of death worldwide in females. Mortality rates are estimated to rise in the near future, hence the importance of an early diagnosis to reduce them. Artificial intelligence (AI), which is growing rapidly in the medical field, has emerged as a powerful tool for assisting diagnosis in healthcare.
This study aims to develop a machine learning supervised algorithm through the implementation of XGBoost for predicting estrogen receptor status, which is implied in breast cancer molecular identification. To evaluate the efficiency of this model, results are compared with the ones obtained through a classic logistic regression model. The F value, a statistical method to determine the accuracy of the model, is 97% for the machine learning algorithm, in contrast to the 54% obtained from the classical one. It is concluded that the XGBoost algorithm has the capacity to predict estrogen receptor status with a high correct rate, thus being a formidable tool to make predictions. Despite this fact, more research is needed to be focused on this field to optimize the algorithms, so that it can be used due to their benefits, not only in diagnostic medicine but also in other medical areas.
Tipo de documento
Proyecto / Trabajo fin de carrera o de grado
Lengua
Catalán
Palabras clave
Càncer
Intel·ligència artificial
Mama -- Càncer
Páginas
73 p.
Nota
Curs 2021-2022
Este ítem aparece en la(s) siguiente(s) colección(ones)
- Grau en Biotecnologia [139]
Derechos
Aquest document està subjecte a aquesta llicència Creative Commons
Excepto si se señala otra cosa, la licencia del ítem se describe como https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ca