Абдулрахаман А. Муса, Усман Малами Алию
По данным Международного агентства по исследованию рака, рак молочной железы у женщин стал ведущим типом рака во всем мире по числу новых случаев (около 2,1 миллиона), диагностированных в 2018 году.
Прогнозирование исхода заболевания — сложная задача. Методы добычи данных, как правило, упрощают сегмент прогнозирования. Автоматизированные инструменты сделали возможным сбор больших объемов медицинских данных, которые предоставляются медицинским исследовательским группам. Целью этого исследования было применение алгоритмов машинного обучения с использованием классификатора решения три и описательной статистики для оценки эффективности модели в прогнозировании вероятности метастазов рака у пациентов, которые обращаются поздно.
Материалы и метод: Набор данных о заболевании раком молочной железы был взят из отделения лучевой терапии и онкологии клинической больницы университета Усману Данфодийо, штат Сокото, Нигерия. Набор данных содержит 259 экземпляров и 10 атрибутов. Экспериментальные результаты этого исследования использовали классификатор решения три в программной среде IMB SPSS (версия 23). В эксперименте использовались два класса, и поэтому была применена матрица путаницы 2 × 2. Класс 0 = не метастазирует, класс 1 = метастазирует. Мы применили контролируемый подход к машинному обучению, в котором набор данных был разделен на два класса, которые обучают и тестируют с использованием 10-кратной перекрестной проверки.
Результаты: Показывает, что 259 случаев рака груди, 218 (84,2%) случаев не были метастазированы, а 41 (15,8%) случай был метастазирован в другие области тела. Общая точность модели составила 87%, чувствительность 88%, специфичность 75% и точность 98%
Заключение: На основании этих результатов алгоритм машинного обучения, использующий классификаторы с тремя решениями, предсказал, что 87% опухолей находятся на стадии IV, что указывает на возможность распространения опухоли на другие области тела.