Turinys:
Video: Learn SQL in 1 Hour - SQL Basics for Beginners (Lapkritis 2024)
„Google“ dabar į savo „Google BigQuery“, įmonės petabyte (PB) mastelio debesų duomenų bazės pasiūlymą, įtraukė kompiuterinio mokymosi (ML) galimybes. Dabar praminta „BigQuery ML“, naujoji versija leidžia naudoti paprastus SQL (Struktūrizuotos užklausos kalbos) teiginius kuriant ir diegiant ML modelius nuspėjamai analizei.
Tai ne tik geros žinios duomenų mokslininkams, kurie naudojasi „Google“. Tai naudinga ir verslo operatoriams, norintiems patobulinti savo duomenų analizės galimybes, nes tai prideda dar vieną efektyvų konkurentą prie gana nedidelio pardavėjų, galinčių pateikti tokio lygio rafinuotumą per debesį, sąrašą. Kiti du labiausiai žinomi vardai yra „Amazon“ santykinių duomenų bazių tarnyba ir „Microsoft“ Azure SQL, daugiau jų galite rasti mūsų naujausioje debesų duomenų bazės paslaugų versijoje.
Visų duomenų pardavėjų ir pirkėjų nuolaidumas visada buvo įgūdžių spraga. Tai ypač pasakytina apie tuos, kurie domisi ML ir nuspėjamąja analitika, nes šioms disciplinoms dažnai reikalingos žinios apie naujas technologijas ir kalbų užklausa.
„Kiekvienam duomenų mokslininkui yra šimtai analitikų, dirbančių su duomenimis, ir dauguma naudojančių SQL“, - „PCMag“ pasakojo „Google Cloud“ produktų valdymo direktorius Sudhiras Hasbe. Kažkas turėjo duoti, jei norima atsikratyti duomenų analitikų armijos galios iš kliūties, kurią sukūrė per mažai ir per daug dirbę duomenų mokslininkai.
„Google“ atsakymas į šią dilemą nėra nieko stebėtino. Nors ML yra karšta tendencija ir visur rodoma visų rūšių produktuose, ji vis dar yra tvirtai duomenų srities mokslininkių teritorija. Daugybė pardavėjų žengė kelią supaprastinti technologiją, tačiau negraži tiesa, jūs galite ją supaprastinti labai daug, ir tai naudoti vis dar yra per sunku daugiau nei 99 procentams žmonių. Vis dėlto mes turime mokėti tuo naudotis, nes ML gali padaryti daugiau ir padaryti tai greičiau, nei gali super protingų žmonių grupė.
„Google“ sodina ML „Google BigQuery“, kad ji būtų arčiau duomenų. Taikymas iš dalies suteiks ML galimybes greičiau nei tradiciniai ML modeliai, nes duomenų analizė gali būti atliekama šaltinyje. Dabar beta versijoje „BigQuery ML“ suteikia galimybę analitikams (ir duomenų mokslininkams) vykdyti numatomą analizę, pvz., Numatyti pardavimus ir kurti klientų segmentus tiesiai virš duomenų, kur jie saugomi. Vien jau tai yra garbingas ir pastebimas atnaujinimas.
Tačiau „Google“ nuėjo dar daugiau, pridėdama galimybę, leidžiančią duomenų analitikams naudoti paprastus SQL teiginius kuriant ir diegiant ML modelius. Šiuo metu galimos prognozinės analizės tiesinės regresijos ir logistinės regresijos modeliai, nes tai yra du dažniausiai naudojami modeliai.
Štai iliustracija, kurią „Google“ pateikė norėdama parodyti, kaip duomenų analitikai pasinaudos šia galimybe:
Anot Hasbės, „Google“ planuoja laikui bėgant į šią galimybę įtraukti daugiau ML parinkčių. „Turime iš savo klientų išgirsti, kuriuos modelius jie nori, kad mes pridėtume, kad pirmiausia pateiktume naudingiausius“, - sakė jis.
Papildomi „Google BigQuery“ naujiniai
Po pagrindinio ML atnaujinimo sąrašo yra klasifikavimo galimybės, „BigQuery“ geografinės informacijos sistemos („BigQuery GIS“), nauja „Google Sheets“ duomenų jungtis ir nauja „Google Sheets“ duomenų jungtis.
Klasteriai taip pat yra beta versijos ir įgalina duomenų grupių optimizavimo juostoje kurti klasifikuotas lenteles, jungiančias eilutes su panašiais klasterio klavišais kartu. Tai sumažina išlaidas, nes pagerina našumą ir įgalina „Google BigQuery“ imti vartotoją tik už nuskaitytus duomenis, o ne už visą lentelę ar skaidinį.
Šiuo metu „ BigQuery GIS“ yra alfa ir naudojama geoerdviniams duomenims analizuoti. „Google Cloud“ komanda bendradarbiauja su „Google Earth Engine“ kurdama „BigQuery GIS“, tačiau jūs turite pateikti lentelę savo geografinius ir erdvinius duomenis. Tai nėra problema daugelyje pramonės sričių, įskaitant sujungtas automobilių sistemas, daiktų internetą (IoT), gamybą, mažmeninę prekybą, išmaniuosius miestus ir telematiką. Jau nekalbant apie vyriausybines agentūras, pradedant Aplinkos apsaugos agentūra (EPA) ir Nacionaline geoerdvinio-žvalgybos agentūra, baigiant Nacionaline vandenynų ir atmosferos administracija (NOAA) ir, žinoma, visomis karinėmis sritimis.
„BigQuery GIS“ naudoja „S2“ biblioteką, kurią dabar naudoja daugiau nei milijardas vartotojų, naudodamiesi įvairiais produktais, tokiais kaip „Google Earth Engine“ ir „Google Maps“. Jei jums reikia daugiau geografinių ir erdvinių duomenų, tada federalinė vyriausybė dalijasi didžiuliu jų kiekiu „GeoPlatform“.
Nauja „Google Sheets“ duomenų jungtis tikriausiai pradžiugins daugelį duomenų analitikų vien todėl, kad ji tokia praktiška kasdieniniam naudojimui. Galite pasiekti „Google BigQuery“ naudodamiesi „Google Sheets“ (skaičiuoklės programa) ir naudoti „Google Sheets“ įrankius, pvz., „Naršyti“, kuris yra kombinuotas bendradarbiavimas, duomenų vizualizavimas ir natūralios kalbos užklausų įrankis.
Dabar „Google BigQuery“ turi ir naują vartotojo sąsają (UI) beta versijoje. Vienas iš įdomesnių elementų yra vizualizacijos vienu spustelėjimu funkcija, kurią palaiko „Google Data Studio“. Bendrai tariant, tai puikus patobulinimų turas jau ir taip elegantiškoms paslaugoms. Šie patobulinimai bus išbandomi kitame PCMag „Duomenų bazės kaip paslaugos“ (DBaaS) sprendimų apžvalgos etape, po to, kai bus ištaisytos klaidos ir produktai peržengs atitinkamas alfa ir beta būsenas.
PCMag EIC Dan Costa aptaria duomenų ateitį: