Гірництво даних просто filtering через великі суми сирих даних для корисної інформації що дає діла конкурентна перевага. Ця інформація складається суттєвих шаблонів та тенденцій що є вже у даних але раніше unseen.
Найбільший популярний інструмент використаний при гірництві штучна розвідка (AI), AI спроба технологій попрацювати шлях людський мозок праці,Роблячи розумні здогадки, вивчаючи прикладом, та використовуючим deductive міркування. Деякий з більше популярних AI методів використаних у гірництві даних включають neural мережі, clustering, та дерева рішення.
Neural мережі дивляться на правила використовуючих даних, котрий є базований на зв'язках знайден або на зразку встановлюють даних. В результаті,Програмне забезпечення постійно анализирует величина та порівнює це до інших факторів, та це порівнює ці фактори неодноразово до це знаходить шаблони з'являючі. Ці шаблони є відомі тому що панує, програмне забезпечення тоді шукає інші шаблони базовані на цих правилах або посилає тривогу коли ініціюють величину ударяється.
Clustering ділить даних у групи базовані на подібних особливостях або обмежених даних діапазони.Дуга пучків використані коли дані не помічається у шляху це сприятливо до гірництва. Наприклад, страхова компанія що захоче знайти приклади обману би не мають його записи помічений як fraudulent або не fraudulent. Але після того як аналізувати шаблони в межах пучку; гірницьке програмне забезпечення може стартувати рахувати правила що пункт котрий претензії виглядають як бути невірні.
Дерева рішення,Любіть пучки, відокремлюють даних у subsets та тоді аналізують subsets щоб розділити їх у подальший subsets, і так далі (для нечисленних більше рівнів), заключних subsets вистачають тоді малий що гірницький процес може знайти цікаві шаблони та співвідношення в межах даних.
Одного разу дані mined ототожнюється, це повинно бути очищене.Очищати даних визволяє це з дублікату інформація та помилкові дані. Знову, дані повинні бути збережені у однорідному форматі в межах відповідних категорій або сфер. Гірницькі інструменти можуть попрацювати з всіма типами зберігання даних, з великих складів даних до більш малих настільних баз даних до плоских файлів.Склади даних та дані marts методи зберігання що включають архивирование великі суми даних у шляху що встигає легкі до доступу коли необхідно.
Коли процес є повноцінне, гірницьке програмне забезпечення породжує доповідь. Аналітик іде над доповіддю побачити якщо подальша робота потреби бути зроблені, наприклад очищаючі параметри, використовуючи інші інструменти аналізу даних вивчити даних,Або навіть scrapping дані якщо це - unusable. Якщо ніяка подальша робота вимагається, доповідь переходить до виробників рішення для відповідної дії.
Потужність гірництва даних використовується для багато цілей, наприклад аналізуючих рішень Верховного Суду, відкриваючих шаблонів у охороні здоров'я, тягнучі оповідання про конкурентів з newswires, вирішуючи bottlenecks у виробничих процесах,Та аналізуючі наслідки у людські генетичні makeup, Там дійсно є ніяка межа до типу бізнесу або області навчання де гірництво даних не може бути благотворне.
đang được dịch, vui lòng đợi..