Veepiinamine - analüüsi analoogia viib silla liiga kaugele

tilguti analüütika

Andmeid, nagu vett, on mitmel kujul. Inimese mõistus on arenenud, et välja filtreerida suurem osa meile saabuvatest andmetest, sest neid on lihtsalt nii palju.

Silmi ja kõrvu avades on andmeid kõikjal. Seina värvi, kliimaseadme heli ja naabri kohvi lõhna koheldakse nagu niiskust. Vesi on kogu aeg õhus, kuid pole kasulik sellele palju tähelepanu pöörata.

Kui vesi kondenseerub uduseks, sunnib see teid seda nägema ja muudab ümbritseva maailma mõistmise veelgi raskemaks. Mittetäielikud andmekogumid, rikutud andmed, halb teadus, valed järeldused ja kognitiivsed eelarvamused panevad kõik udus eksima.

Andmed langevad nagu vihm. Kui seda on vähe, on see metsikult ebarahuldav - täpselt nii palju, et teie auto määrduks ja vestlus segadusse läheks. Avastate end prillidelt koha pühkimas, kui keegi hõõgub mingist ebaselgest allikast juhuslikku andmepunkti.

  • Vananenud vesi madalas tiigis on ohtlik. Ebausaldusväärsest tarnest kogutud andmed, mida ei ole puhastatud ega normaliseeritud ja jäetud seisma, võivad kergesti viia vigaste järeldusteni.
  • A ühtlane nirisemine veest võib olla piisav söökla täitmiseks või metsaökosüsteemi säilitamiseks. Ainult kolm andmepunkti (saadetud e-kirjade arv, võrreldes avatud ja versus klõpsatud) abil saab turundusprogrammi säilitada.
  • A tervislikum vool Andmeid väikese oja kujul saab kasutada suplemiseks. Pidev andmevoog võimaldab võrdlusuuringuid ja ajaloolist võrdlust. Sihtlehe optimeerimine on võimalik stabiilsete konversiooniandmete abil.
    A tagasihoidlik jõgi saab veski jõul puitu saagida või nisu jahvatada. Soovitusmootor vajab ostukärude väärtuse suurendamiseks vaid käputäie lisajõgede usaldusväärset panust.
  • A juga on võimeline liikuma tohutult veoratta abil ja piisav teabe juurdevool võib juhtida reaalajas dünaamilist sisusüsteemi.
  • A jõgi see on piisavalt lai ja sügav, võib toetada tervet transporditööstust. Piisava hulga andmete abil saab reklaamvõrgustike, püsikliendikaardiprogrammi andmete kogujate ja andmevahendajate kaudu küpsiseid kogumina hõljuda praamid ja kaubalaevad.

Kui andmeid saabub eeldataval ajal eeldatavas koguses, saab neid hõivata, kanaliseerida ja kasutusele võtta. Kastmissüsteemid, tammid ja veehoidlad pakuvad kontrollitunnet ja võimaldavad kanalite, lüüside ja tammidega rajada üha laienevat infrastruktuuri. Andmeladud on üles ehitatud vähem usaldusväärsetele voogudele.

Puhtus on jumalakartuse kõrval

Puhas vesi on elutegevuse, niisutamise, elektrijaamade töötamise jne jaoks hädavajalik. Puhta mõiste võib sel eesmärgil muutuda; see on korras, kui vees on vetikaid, mis jahutavad elektrijaama, ja see ei ole vastuvõetav, kui joogivees on arseeni üle 10 miljardisosa.

Andmed on samad. Otsepostitusrakenduses pole teie isiku tiitli (härra, proua, proua) omamine tähtsusetu ... kui te ei postita arstidele. Kuid määrdunud andmed viivad teid iga kord üles.

USA peamise andmeteadlasena DJ Patil, esitage see esimese vooru CTO tippkohtumisel: „Kui te ei mõtle sellele, kuidas oma andmeid kohe alguses puhtana hoida, olete f ^ ¢ & ed. Ma garanteerin selle. Pärast fakti puhastamist võtab see vähemalt kuid. "

Kui kuumutate vett keemiseni, võib see jõustada kogu tööstusrevolutsiooni. Tundub, et andmed teevad sama asja. Sellest hetkest, kui arvutid suutsid nii salvestada kui ka arvutada, on andmeid kogutud nii kiiresti, kui selleks oleks võimalik salvestusseadmeid luua.

Data järv

Kui nende lisajõgede andmed voolavad läbi veskimootorite, jõuab see kõik järve, tammi taha. Kuna andmeid antakse välja kontrollitult, siis töötavad need andmetööstuse turbiinid; need andmetöötluse hiigelmootorid nimedega nagu Google ja Facebook. Siin põuda ei tule.

Ja lõpuks on sügav veekogu, mis ootab analüütiku sukeldumist. Sukeldumisvarustus ja oda püstol käes, analüütik uurib sügavust, kaardistab uue maa ja avastab uusi liike. See on väga põnev aeg olla andmete avastaja.

Sellepärast on nii paljud neist näidanud eMetricsi tippkohtumine alates 2002. aastast. Järgmine võimalus on Bostonis, 27. septembrist 1. oktoobrini 2015.

eMetrics Summit registreerimine

Bridge Too Far

Ja mis on andmete võimsusest järgmise Grand Canyoni nikerdamiseks? Aga struktureeritud andmete jääsulamine? Kuidas käitleme reovett maailmas, mis muutub üha privaatsemaks?

Need on küsimused teiseks korraks ja vesi silla all.

Mis sa arvad?

Sellel saidil kasutatakse rämpsposti vähendamiseks Akismetit. Vaadake, kuidas teie andmeid töödeldakse.