Наука

Що таке видобуток даних? »Його визначення та значення

Anonim

Видобуток даних або видобуток даних - це процес класифікації за великими наборами даних для виявлення закономірностей та встановлення взаємозв’язків для вирішення проблем за допомогою аналізу даних. Інструменти видобутку даних дозволяють компаніям прогнозувати майбутні тенденції.

При видобутку даних правила асоціації створюються шляхом аналізу даних для частих шаблонів, використовуючи критерії підтримки та впевненості, щоб знайти найважливіші взаємозв'язки в даних. Підтримка - це частота появи елементів у базі даних, тоді як достовірність - це кількість разів, коли твердження є точними.

Інші параметри видобутку даних включають аналіз послідовності або маршруту, класифікацію, кластеризацію та прогноз. Параметри послідовності або аналізу шляху шукають шаблони, в яких одна подія веде до іншої наступної події. Послідовність - це впорядкований список наборів елементів і є загальним типом структури даних, що зустрічається у багатьох базах даних. Параметр класифікації шукає нові шаблони і може призвести до зміни способу організації даних. Алгоритми класифікації передбачають змінні на основі інших факторів у базі даних.

Параметри групування візуально знаходять і документують групи раніше невідомих фактів. Групування групує набір об’єктів і об’єднує їх на основі того, наскільки вони схожі між собою.

Існують різні способи, за допомогою яких користувач може розгорнути кластер, розрізняючи кожну модель кластера. Заохочення параметрів в рамках видобутку даних може виявити закономірності в даних, які можуть призвести до розумних прогнозів щодо майбутнього, також відомих як прогнозована аналітика.

Методи видобутку даних використовуються в багатьох областях досліджень, включаючи математику, кібернетику, генетику та маркетинг. Хоча методи видобутку даних є засобом підвищення ефективності та прогнозування поведінки клієнтів, при правильному використанні бізнес може відрізнитись від своєї конкуренції за допомогою прогнозної аналітики.

Інтернет-видобуток, тип інтелектуального аналізу даних, що використовується в управлінні відносинами з клієнтами, інтегрує інформацію, зібрану традиційними методами та техніками інтелектуального аналізу даних через Інтернет. Веб-майнінг має на меті зрозуміти поведінку клієнтів та оцінити ефективність певного веб-сайту.