Turinys:
- 1. Nepamirškite logistikos
- 2. Atsiminkite savo duomenis
- 3. Algoritmai nėra stebuklingos kulkos
- 4. Naudokite Diverse Toolset
- 5. Eksperimentuokite su hibridiniu mokymu
- 6. Pigus nereiškia blogo
- 7. Neskambinkite AI
Video: Kokį kompiuterį pirkti Žaidimams? (Lapkritis 2024)
Pirmojoje mašininio mokymosi verslo vadovo (ML) dalyje paaiškinta, kaip skėtinė ML koncepcija yra kur kas labiau niuansuota verslo aplinkoje. Veiksmingiausios strategijos žvelgia į ML praktine prasme, pasitelkdamos ir sudėtingus gilaus mokymosi, ir mažiau intensyvius „pigaus mokymosi“ metodus, kad optimizuotų įmonės procesus ir įgytų apčiuopiamų verslo žinių (BI) įžvalgų.
Diegti ML jūsų verslo programose tikslas yra pagerinti jūsų esmę ar paspausti įmonės konkurencinį pranašumą. Bet didesnėje jūsų organizacijos schemoje maksimaliai išnaudodami laiką ir išteklius, kuriuos investuojate į šį procesą, perženkite algoritmus. Jūsų verslo IT sprendimus priimantys asmenys turi įsitikinti, kad viskas, atsižvelgianti į jūsų ML imperatyvus, pradedant nuo duomenų ir logistikos ir baigiant tuo, kaip jūs bendraujate su vartotojais, darniai dirba kartu, kad padidintų efektyvumą.
Ted Dunning, Ph.D., yra vyriausiasis programų architektas „MapR“, įmonės programinės įrangos įmonėje, siūlančioje įvairius „Big Data“ paskirstymus ir duomenų valdymo įrankius. Dunningas taip pat yra dviejų knygų apie tai, ką jis vadina „praktiniu mašinų mokymusi“, autorius, ir per daugelį metų sukūrė ML technologijas, įskaitant ID Analytics sukčiavimo aptikimo sistemą (įsigijo „LifeLock“) ir „Musicmatch Jukebox“ programinę įrangą, kuri vėliau tapo „Yahoo Music“. Šiuo metu jis taip pat eina „Apache Software Foundation“ inkubacinio viceprezidento pareigas.
Dunningas stebėjo, kaip ML erdvė vystosi per dešimtmečius, ir sužinojo daug apie tai, kas veikia, o kas ne praktinėje verslo aplinkoje. Žemiau Dunningas pateikia septynias geriausias praktikas, kurių reikia laikytis kuriant verslo sprendimus, pagrįstus ML.
1. Nepamirškite logistikos
Sėkmingas ML nėra vien tik tinkamo įrankio ar algoritmo pasirinkimas. Duningas teigė, kad taip pat turite išsiaiškinti, koks požiūris yra tinkamas, ir suprojektuoti jį konkrečiai situacijai, į kurią kreipiatės. Pavyzdžiui, Dunningas internetinėje rinkodaros kampanijoje kalbėjo apie ML, priešingai nei daug sudėtingesni scenarijai, tokie kaip algoritmai, kuriais vadovaujasi autonominis automobilis. Išleisti savo išteklius norint patobulinti algoritmą yra verta dėl automobilio rūpesčių, tačiau rinkodaros scenarijuje jūs pastebėsite kur kas geresnį pelną iš visos aplink jį esančios logistikos optimizavimo.
"Dažnai verslui tai suteikia logistika, o ne mokymasis. Tai yra ta dalis, kuriai turėtumėte skirti savo laiką ir išteklius", - sakė D. Duningas. "Algoritmo pritaikymas duotų jums nedidelį patobulinimą. Tačiau pakoregavę tuos duomenis, GUI ir tai, kaip jūs klausotės ir bendraujate su savo vartotojais, galite lengvai patobulinti 100 procentų. Praleisti laiką pataisyti algoritmą verta truputį, nes klauso jūsų vartotojų “.
Norėdami parodyti šį tašką, Dunning paaiškino, kaip jis kadaise įmonėje sukūrė modelį, skirtą atpažinti programų sukčiavimą (suklastotų sąskaitų su pavogtomis tapatybėmis atidarymą) įmonės klientų duomenų bazėje. Jo sukurtas modelis sulaukė puikių rezultatų, tačiau Duningas pastebėjo, kad tai labai smarkiai įvertino pareiškėjo lytį.
Paaiškėjo, kad logistika buvo išjungta. Pareiškėjas, pateikęs paraiškos procesą, užpildė savo lytį tik tada, kai jau tapo klientu ir buvo atlikęs daugybę atrankos veiksmų, norėdamas išfiltruoti sukčius. Taigi, panaudodamas lyčių sritį, ML modelis apgavo viso sukčiavimo proceso logistiką. Tai neturi nieko bendra su algoritmu ir viskas, kas susiję su tuo, kaip įmonė visų pirma rinko duomenis.
2. Atsiminkite savo duomenis
Dunning yra pilna įsimenamų išminties nutikimų. Pradėjęs nuo „logistikos, o ne mokymosi“, jis sakė, kad kita šios idėjos pusė yra „tai duomenys, o ne algoritmai“. Didelė dalis užtikrinant, kad jūsų ML algoritmai teikia vertingų įžvalgų, yra įsitikinimas, kad pateikiate jiems tinkamus duomenis. Duningas sakė: jei negaunate rezultato, kurio siekiate, dažniausiai taip yra todėl, kad naudojate ne teisingus duomenis.
„Žmonės susitvarko su ego ir yra susieti su tam tikrais algoritmais, tačiau šiais laikais dėl turimų įrankių visi ir jų motina gali ir sugalvoja visokių naujų algoritmų“, - sakė D. Duningas. "Duomenys yra daug svarbesni ir suteiks daug daugiau pastangų, nei be galo keisdami algoritmus. Jei dirbate su tokia sudėtinga problema kaip kalbos atpažinimas ar kompiuterinis matymas, tai yra vienas dalykas. Bet tai yra duomenų valdoma sritis. Daugelio scenarijų nauda bus daug didesnė, jei pakoreguosite gaunamus duomenis ir pakeisite klausimą. “
Būtent tai Dunningas padarė 2000-ųjų viduryje, statydamas vaizdo įrašų rekomendacijų variklį įmonėje, pavadintoje „Veoh Networks“. Komanda stengėsi nustatyti poras vartotojų sugeneruotų vaizdo įrašų, kuriuos žmonės spustelėjo daugiau nei tikėtasi, tačiau algoritmas neveikė. Jie galvojo apie muziką, kai vartotojai žino savo mėgstamus atlikėjus ir dainas pagal pavadinimą. Taigi jie pakeitė klausimą, pataisydami vartotojo sąsają, neliesdami paties algoritmo.
"Naudotojų sukurtuose vaizdo įrašuose niekas nepažįsta atlikėjų ir daugybė vaizdo įrašų turėjo šlamšto pavadinimus, kad gautų daugiau peržiūrų. Važiavimas dviračiu pagal algoritmo pataisas niekada nebūtų davęs gerų rezultatų", - teigė D. Duningas. „Tai, ką mes padarėme, buvo pakeista vartotojo sąsaja, kad kas 10 sekundžių būtų skleidžiamas švyturio signalas. Mes nustatėme, kad jei naudodamiesi švyturiu vietoj paspaudimų gavome pirminius rekomendacijos duomenis, gavome nuostabių rezultatų. Šis vienas pakeitimas buvo keliais atvejais didesnis. šimtas procentų pagerėjo įsitraukimas dėl rekomendacijų, be algoritminių pakeitimų “.
3. Algoritmai nėra stebuklingos kulkos
ML diegimai klesti dėl nuolatinių bandymų ir klaidų. Nesvarbu, kokie geri yra jūsų algoritmai, jei jūsų sistema sąveikauja su žmonėmis, tada ją reikės koreguoti laikui bėgant. Duningas pabrėžė, kad įmonės turėtų nuolat matuoti bendrą jų įgyvendinimo efektyvumą ir nustatyti pokyčius bei kintamuosius, kurie jį gerina ir blogina. Tai gali atrodyti kaip platuma, tačiau Dunningas teigė, kad nepaisant to, kaip akivaizdu, kad tai skamba, labai nedaug žmonių tai daro ar daro gerai.
„Daug žmonių nori įdiegti sistemą ar imtis kokių nors veiksmų ir nori, kad jų algoritmas veiktų nepriekaištingai amžinai“, - sakė D. Duningas. "Joks algoritmas nebus stebuklinga ženkle. Joks vartotojo sąsajos dizainas neprilips amžinai. Joks duomenų rinkimo metodas niekada nebus pakeistas. Visa tai gali įvykti ir įvykti. Verslas turi budriai matuoti, vertinti ir iš naujo įvertinti, kaip jų sistema veikia “.
4. Naudokite Diverse Toolset
Yra dešimtys ML įrankių, iš kurių daugelį galite naudoti nemokamai. Daugybėje „Apache Software Foundation“ (ASF) projektų, įskaitant „Mahout“, „Singa“ ir „Spark“, turite populiarių atvirojo kodo bibliotekų, tokių kaip „Caffe“, „H20“, „Shogun“, „TensorFlow“ ir „Torch“, ir ML bibliotekų. Tada yra prenumeratos parinktys, įskaitant „Amazon Machine Learning“, „BigML“ ir „Microsoft Azure Machine Learning Studio“. „Microsoft“ taip pat turi nemokamą „Cognitive Toolkit“.
Yra daugybė išteklių. Dunningas kalbėjo su daugybe verslo atstovų, duomenų mokslininkų ir ML praktikų ir visada jų klausia, kiek skirtingų sistemų ir įrankių jie naudoja. Vidutiniškai Dunningas teigė, kad dauguma jų naudoja mažiausiai 5–7 įrankius ir dažnai kur kas daugiau.
"Jūs negalite būti priklijuotas prie vieno įrankio. Turėsite naudoti kelis, ir tokiu atveju jums geriau sukurti savo sistemą taip, kad ji būtų agnostinė", - sakė D. Duningas. „Kiekvienas, kuris bando įtikinti, kad šis įrankis yra vienintelis jums reikalingas, parduoda jums prekių sąskaitą.
„Kitą savaitę gali nutikti kažkas, kas sujaukia obuolių krepšelį, o naujovių greičiu, kurį matome, tai tęsis mažiausiai dar penkerius – 10 metų“, - tęsė Dunningas. Pažvelkite į pigią mokymosi pavyzdį, kur galbūt pakartotinai naudojate esamą vaizdų klasifikatorių, norėdami analizuoti paveikslėlius kataloge. Tai gilus mokymasis, įmestas kompiuterinis matymas. Tačiau yra įrankių, kurie visa tai supakuoja. Jums reikia matuoti, vertinti ir naudoti įvairius įrankius, o jūsų infrastruktūra turi būti patenkinama “.
5. Eksperimentuokite su hibridiniu mokymu
Dunningas sakė, kad jūs taip pat galite maišyti pigų ir gilų mokymąsi kartu į kažką hibridinio. Pvz., Jei paimsite esamą kompiuterinės vizijos modelį ir iš naujo sukonstruosite kelis geriausius sluoksnius, kur priimamas sprendimas, tuomet galite pasirinkti esamą sistemą visiškai naujai naudojimo situacijai. Duningas atkreipė dėmesį į „Kaggle“ varžybas, kuriose varžovai pasielgė kaip tik tai; jie paėmė duomenų rinkinį ir viršuje parašė naują algoritmą, kuris padėjo kompiuteriui atskirti kates nuo šunų.
"Atskirti kates ir šunis yra labai subtilus dalykas, kai reikia ML algoritmo. Pagalvokite apie logiką: katės turi smailias ausis, bet taip pat turi vokiečių aviganiai. Šunys neturi dėmių, išskyrus dalmatinus ir tt. Tai gali būti gana sunku atpažinti. savaime “, - sakė Dunningas. "Laimėjęs vaikinas sukūrė sistemą, kuri tai padarė 99 procentų tikslumu. Bet mane labiau sužavėjo trečiasis asmuo. Užuot statydamas nuo nulio, jis perėmė esamą vaizdo atpažinimo programą iš kitos užduoties ir paėmė viršutinį sluoksnį ir įdėjo ten paprastą klasifikatorių. Jis pateikė kelis pavyzdžius. Greitai jis buvo 98 proc. tikslus, kad atskirtų kates nuo šunų. Visas procesas vaikinui užtruko tris valandas."
6. Pigus nereiškia blogo
Nepaisant atviros konotacijos, Duningas teigė, kad pigus mokymasis nereiškia blogo mokymosi. Laikas, kurį praleidžiate ML diegimui, nėra tiesiogiai susijęs su jo verslo verte. Svarbiausia kokybė, pasak jo, yra įsitikinti, kad procesas yra pakartojamas ir patikimas. Jei verslas sugeba to pasiekti neinvestuodamas nereikalingų išteklių, tai viskas yra dar geriau.
"Pigus nereiškia blogo. Jei jis veikia, tai veikia. Jei pigus ir veikia, tai yra puiku. Tačiau pastangos, kurias įdėjote jį pastatyti, neapibrėžia vertės. Tai yra sumos ir kainos klaida", - teigė D. Duningas.. "Vertę apibūdina tai, kaip ji pagerina verslą. Jei padidėja pelnas ar sumažėja išlaidos ar pagerėja konkurencinė padėtis. Tai yra poveikis, o ne pastangos."
7. Neskambinkite AI
Duningas pabrėžė, kad, kalbėdami apie šias metodikas, verslas turėtų naudoti tikslią terminiją: ML, kompiuterinį matymą ar gilų mokymąsi. Visa tai paprastai patenka į sąvoką „dirbtinis intelektas“, tačiau, pasak Dunningo, AI apibrėžimas yra tiesiog „dalykai, kurie dar neveikia“.
"Geriausias AI apibrėžimas, kurį aš kada nors girdėjau, yra tai, ko dar negalime paaiškinti. Daiktai, kurių mes nesiaiškinome", - sakė D. Duningas. "Kiekvieną kartą, kai tik imame ką nors veikti, žmonės sako:" O, tai ne AI, tai tik programinė įranga. Tai yra tik taisyklių variklis. Tai tikrai yra tik logistikos regresija ". Prieš sugalvodami ką nors išsiaiškinti, mes tai vadiname AI. Po to mes visada vadiname tai kažkuo kitu. Daugeliu atžvilgių AI yra geriau naudojamas kaip žodis kitai pasieniui, o AI visada bus kita pasienis. kur einame, o ne ten, kur jau pasiekėme “.