Duomenų gavyba

Kas yra duomenų gavyba:

Duomenų gavyba yra anglų kalbos terminas, susijęs su kompiuterių mokslu, kurio vertimas yra duomenų gavyba . Jis susideda iš funkcionalumo, kuris apibendrina ir organizuoja duomenis, suranda jiems tinkamus modelius, asociacijas, pokyčius ir anomalijas .

Terminas „ duomenų gavyba“ pirmą kartą atsirado 1990 m. Duomenų bazių bendruomenėse. Duomenų gavyba yra proceso analizės žingsnis, žinomas kaip KDD ( žinių atradimas duomenų bazėse ), jo pažodinis vertimas yra „Žinių atradimas duomenų bazėse“.

Duomenų gavyba gali būti suskirstyta į kelis pagrindinius žingsnius: tyrinėjimą, modelio kūrimą, modelio apibrėžimą ir patvirtinimą bei patikrinimą.

Duomenų gavyba yra palyginti nauja praktika skaičiavimo pasaulyje, ji naudoja informacijos paiešką, dirbtinį intelektą, modelio atpažinimą ir statistinius metodus, siekdama surasti koreliaciją tarp įvairių duomenų, kurie leidžia jums gauti naudingų žinių įmonei ar asmeniui. Įmonės atveju duomenų gavyba gali būti svarbi priemonė naujovėms ir pelningumui didinti.

Duomenų gavyba yra gana paplitusi didelėse duomenų bazėse, o jų naudojimo rezultatas gali būti rodomas per taisykles, hipotezes, sprendimų medžius, dendrogramus ir tt

Gerai atlikta duomenų gavyba turėtų atlikti tokias užduotis kaip: anomalijos aptikimas, asociacijos taisyklių mokymasis (priklausomybės modeliavimas), grupavimas, klasifikavimas, regresija ir apibendrinimas. Duomenų gavybos procesas paprastai vyksta naudojant duomenų saugykloje esančius duomenis .

Yra keletas įmonių ir programinės įrangos, skirtos duomenų gavybai, nes duomenų bazių modelių nustatymas tampa vis svarbesnis. Tačiau atitinkamų standartų nustatymas nėra unikalus kompiuterių pasauliui. Žmogaus smegenys naudoja panašų procesą, kad nustatytų modelius ir įgytų žinių.

Pastaraisiais metais duomenų gavyba plačiai naudojama mokslo ir inžinerijos srityse, tokiose kaip bioinformatika, genetika, medicina, švietimas ir elektrotechnika.

Duomenų gavybos koncepcija dažnai siejama su informacijos apie žmonių elgesį gavimu. Dėl šios priežasties kai kuriais atvejais duomenų gavyba kelia teisinius klausimus ir klausimus, susijusius su privatumu ir etika. Nepaisant to, daugelis žmonių teigia, kad duomenų gavyba yra etiškai neutrali, nes ji neturi jokių etinių pasekmių.

Nekilnojamojo duomenų gavybos pavyzdžiai

Duomenų gavybą dažnai naudoja įmonės ir organizacijos, kad gautų žinių apie vartotojus / darbuotojus / klientus. Pavyzdžiui, viešajame sektoriuje galima patikrinti tarp darbuotojo šeimyninę padėtį ir atlyginimą, kurį jis uždirba, kad pamatytų, ar tai turi įtakos jo santuokiniam gyvenimui.

Tokios įmonės, kaip prekybos centrų tinklai, gali naudoti šiuos kryžminius duomenis, kad nustatytų produktus, kurie yra įsigyti kartu. Jei klientas, kuris perka produktą X, taip pat perka produktą Y, gali būti, kad norėdami įsigyti prekę, klientas gali lengvai įsirengti du produktus.