Video: Jaha Tum Rahoge | Maheruh | Amit Dolawat & Drisha More | Altamash Faridi | Kalyan Bhardhan (Gruodis 2024)
Naujai atsiradęs „didžiųjų duomenų“ meemas niekada nebuvo apibrėžtas jokiu prasmingu ir apibrėžtu būdu. Tai pats amorfiškiausias naujas „buzz“ terminas, kokį mačiau dešimtmetį. Tai yra vienas iš tų „žiūrinčiojo akių“ terminų, naudojamų pagyvinti seminarą ir galiausiai suvilioti investuotojus.
Pradėkime nuo klausimo, ką reiškia dideli duomenys? Daug duomenų? Daugiau duomenų, nei galite tvarkyti? Amorfiniai duomenys? Nekontroliuojami duomenys? Naudingi duomenys analizei? Nenaudingi duomenys? Informacijos perkrova?
Jei pakankamai skaitote apie didelius duomenis, tai yra viskas aukščiau ir dar daugiau. Svarbiausia ne duomenys, o iššūkis, kaip tvarkyti duomenis ir ką daryti su pačiais duomenimis.
Kitaip tariant, kaip mes galime padaryti šią didžiulę krūvą duomenų, kuriuos mums pavyko sukaupti, naudingais naujais ir pelningais būdais? Duomenų telkiniai gali būti gaunami iš bet kurios vietos, naudojant įvairius skaičiavimo mechanizmus, tokius kaip „Facebook“ įrašai, NSA žurnalai, adresų sąrašai, klientai ir kt.
Aš tvirtinčiau, kad dauguma šio stulpelio skaitytojų patys yra didelių duomenų saugyklos. Aš ką tik nusipirkau 3 terabaitų diską atsarginei kopijai. Turiu daug duomenų, kuriuos turiu sukurti atsarginę kopiją! Dideli duomenys!
Naudinga priemonė, kurią įsivaizduoju, būtų didelis duomenų analizės įrankis, kurį policija galėtų naudoti, norėdama išsiaiškinti, ar esate kaltas dėl atsitiktinio nusikaltimo, peržiūrėdamas jūsų bylas. Arba bent jau raskite tai, kas jus suglumintų. Dideli duomenys!
Visa tai sugrįžta prie buvusio „American Express“ generalinio direktoriaus komentaro, kuris auditorijai teigė, kad jei įmonė norėtų (ir tai taikoma visoms kreditinių kortelių įmonėms), ji galėtų panaudoti jūsų asmeninius pirkimo įpročius ir tendencijas sudėti visą dokumentų rinkinį ir būtinai pasakykite, ar turite reikalų, ar ne. Dideli duomenys!
Iš to, ką aš galiu pasakyti, būtent tai ir daro dideli duomenys, kurie geriausiai šnipinėja asmenis.
Populiarus pramonės komentaras yra tas, kad kažkokios didžiulės duomenų bazės, kuriose yra informacijos apie jus, bus naudojamos jūsų naudai. Taip, jūs žinote, todėl gausite dalykų, kurie jus iš tikrųjų domina. Tikslinė reklama. Tai naudinga visiems!
Štai kaip tai veikia. Man įdomu nusipirkti naują fotoaparatą ir išgirsti apie naująjį „Bogus One“. Perskaičiau PCMag.com straipsnį apie fotoaparatą, tada einu į „Amazon“ ir pasidomiu kainomis bei vartotojų atsiliepimais. Panašu, kad niekam nepatinka fotoaparatas. Tai akivaizdus šūdas. Apžvalgininkai visi vengė fotoaparato. Pirkėjai nekenčia kameros. Tai nėra fotoaparatas, kurio noriu. Bet didžiųjų duomenų analizės programinė įranga nusprendžia man kiekviename mano aplankytame tinklalapyje pateikti šimtus skelbimų, kuriuose rodoma „Bogus One“ kamera. Dideli duomenys!
Tai blogiau. Jei viskas pasisuktų kita linkme ir nusprendžiau, kad fotoaparatas man patiko ir norėjau, o fotoaparatą įsigijau, vis tiek gaučiau skelbimų, raginančių mane nusipirkti fotoaparatą. Dideli duomenys!
Tikslinė „didelių duomenų“ reklama yra pati didžiausia „baloney“ apkrova.
Gerai, todėl pamirškime tą fiasko ir pereikime prie didelių duomenų naudojimo tendencijoms. Dideli duomenys gali rasti įvairių adatų įvairiuose šieno kupoluose. Taigi, jūs gautumėte kažką panašaus: keturiasdešimt procentų visų „Subaru“ pirkėjų yra vegetariai / veganai, o 80 procentų - demokratai. Tačiau, jei mes kalbame apie „Subaru Outback“, šis skaičius padidėjo atitinkamai iki 60 ir 90 procentų. Be to, jei automobilis nudažytas žalia spalva, jis padidėja iki 99 procentų vegetarų / veganų ir iki 99 procentų demokratų.
Didelės apimties duomenų teoretikai turėtų surengti lauko dieną seminare su šia informacija. Tačiau jis nepaiso visų kintamųjų, galinčių pakeisti skaičiavimus ir tendencijas, kurių yra begalė. Kiek laiko užtruks bet kuris iš šių stambių duomenų, jei „Subaru“ generalinis direktorius susitiks prie susirinkimo žaliame Outback'e ir pareikš, kad „Visi banginiai turi būti sunaikinti!“?
Net nereikia tiek daug pakeisti didelių duomenų išvadų dinamikos. Nepaisant to, ką sako „American Express“ vaikinas, duomenys iš tikrųjų yra akli. Štai kodėl gaunate jau įsigytų produktų skelbimus.
Didelių duomenų pakaktų, kad padarytumėte išvadas.
Jei kas nors nusiperka dešimt knygų, kaip pasigaminti bombą, ar tai reiškia, kad jis nori susprogdinti federalinį pastatą? O kas, jei jis būtų bombos šalinimo ekspertas ir tai nebuvo įtraukta į jo, kaip policijos konsultanto, pavadinimą? Dideli duomenys dar negali žinoti visko. Ji negali žinoti, ką galvoji. Aš galvoju, pavyzdžiui, kad „Bogus One“ kamera čiulpia. Dideli duomenys to negali žinoti, nebent esu tardomas. Ir aš galėčiau meluoti.
Nė vienas iš jų visuomenei neatrodo nei gerai, nei sveikai. Šuolis prie išvadų, prielaidų darymas, klaidingų prielaidų darymas. Sunaikinti visuomenę su nenaudingomis s.
Dideli duomenys, kaip aukšta sąvoka, niekada iki galo neapibrėžia savęs ir mirs apgailėtiną mirtį. Aš tikiuosi.