Гонапа Васудха
Добыча данных — это процесс обнаружения закономерностей в больших наборах данных, включающий методы на стыке машинного обучения, статистики и систем баз данных. Добыча данных — это междисциплинарная подобласть компьютерной науки и статистики, общая цель которой — извлекать информацию (с помощью интеллектуальных методов) из набора данных и преобразовывать ее в понятную структуру для дальнейшего использования. Добыча данных — это этап анализа процесса «извлечения знаний в базах данных» или KDD. Помимо этапа сырого анализа, он также включает аспекты управления базами данных и данными, предварительную обработку данных, соображения о моделях и выводах, метрики интересности, соображения о сложности, постобработку обнаруженных структур, визуализацию и онлайн-обновление.