Hokker "grutte data" binne geweldich?

En wêrom is it in grut bedrach?

'Grutte gegevens' is de nije wittenskip fan it begripen en it praten fan minsklik gedrach troch it ûndersiikjen fan grutte munten fan netstruktuerde gegevens. Grutte gegevens binne ek bekend as 'predictive analytics'.

Analyze fan Twitterposts, Facebookfeesten, eBay-sykmasines, GPS-trackers en ATM-masines binne wat grutte data-foarbylden. Studearjen fan feiligheidsfideos, ferkearsgegevens, Wettermustern, fleanberikingen, mobiele tillefoansdoarpen, en hertklassesprekkers binne oare foarmen. Grutte gegevens binne in misledige nije wittenskip dy't wiken feroaret, en allinich in oantal eksperts begripe it allegear.

Wat binne guon foarbylden fan grutte data yn reguliere libben?

skermprint http://project.wnyc.org/transit-time

Hoewol de measte grutte dataprojekten tige ferminder binne, binne suksesfol foarbylden fan grutte gegevens dy't ynfloed binne op it deistich libben fan yndividuen, bedriuwen en regearingen:

Predicting virus-útbrekken: troch studearje sosjaal-polityk gegevens, waar- en klimaatgegevens, en sikehûs / klinyske gegevens, dizze wittenskippers prate hjoeddeis de denguefiver útbrekken mei 4 wiken foarôfgeand oan.

Ommersjoch Watch: dizze grutte dataprojektprofilen mochten slachtoffers, fertochten en kriminelen yn Washington, DC. Sawol as in manier om de ferstoarne en as bewustwêzen foar minsken te earjen, is dit grutte dataprojekt faszinabel.

Transit Travel Planning, NYC: WNYC radio programmator Steve Melendez kombinearret it online subwayplenning mei reisriden software. Syn skepping lit New Yorkers har lokaasje op 'e kaart klikke, en in prediction fan reisdoer foar treinen en subway sil ferskine.

Xerox ferlege har wurkferlies ferlies: Call center work is emosjoneel ferlern . Xerox hat ûndersiken fan gegevens studearre mei help fan profesjonele analysts, en no kinne se prestizearje hokker oproptsjinsten har wierskynlik mei it bedriuw it langstme ferbliuwe.

Stypje tsjinterrorisme: troch studearjen fan sosjale media, finansjele ynstellingen, fleanreserves, en feiligensgegevens, kinne rjochtshanneling terroristyske ferwachtingen prate en plak fine foardat se har ferkearde wurken dogge.

It oanpassen fan merk marketing op basis fan sosjale mediadebalken : minsken ferpleatse en gau gau harren online gedachten te dielen op in kroech, restaurant, of fitnessferiening. It is mooglik om dizze miljoenen sosjale mediaposten te studearjen en te jaan oan it bedriuw oer wat minsken tinke oan har tsjinsten.

Wa wurdt grutte data brûkt? Wat dogge se mei?

In protte monolitaatyske bedriuwen brûke grutte gegevens om harren oanbod en prizen oan te passen om de kwaliteit fan jo klant te maksimale.

Wêrom is grutte data sa in grut bedrach?

4 dingen meitsje grutte gegevens signifikant:

1. De gegevens binne massyf. It sil net passe op in iene fêste skiif , folle minder in USB-stof . It volumint fan gegevens fermindert wat de minske kin sjoen (tink oan in miljard miljard megabytes, en dan multiplisy dat troch mear miljarden).

2. De gegevens binne misledig en ûnstruktuer. 50% oant 80% fan grut data wurkje konvertearje en reinigje de ynformaasje dat socht en sorteare kin. Allinich in pear tûzen eksperts op ús planeet kinne folslein witte hoe't dizze gegevens opnaam wurde. Dizze saakkundigen hawwe ek tige spesjale ynstruminten, lykas HPE en Hadoop, om har kraft te dwaan. Miskien yn 10 jier, grutte dataekundigen wurde in dûm in dûsen wurden, mar no binne se in tige seldsumer soarte analysator en har wurk is noch altyd dúdlik en langstme.

3. De gegevens binne in wittenskip wurden ** dy't ferkocht en kocht wurde. Donaasjesplakjes besteane wêr't bedriuwen en partikulieren tûzenen fan sosjale media en oare gegevens kinne keapje. De measte gegevens binne wolkbasis, om't it te grut is om op ien inkele harde fyts te passen. Kooping fan gegevens is gewoanlik omtinken foar in abonnemintferbân wêr't jo yn in wolkeksservoar pleatst.

** De lieders fan grutte data-ark en ideeën binne Amazon, Google, Facebook, en Yahoo. Om't dizze bedriuwen safolle miljoenen minsken mei har online tsjinsten tsjinje, makket it sin dat se it sammelpunt wêze en de fisykearen efter grutte data analytys.

4. De mooglikheden fan grutte gegevens binne ûnfolslein. Miskien dat dokters sille ienris de hertoanfallen en sluten foar persoanen wiken foarhinne foardat se barre. Flugplannen en automobilkwollen kinne troch prestiktive analyzes fan har meganyske gegevens en ferkears- en wettermodellen reduzearre wurde. Online datearje kin ferbettere wurde troch it oanbieden fan grutte gegevensfoarstellers fan kompatibele persoanen foar jo. Muzikanten kinne ynsjoch krije yn wat de muzyk komposysje de meast tefreden is foar de feroarjende sma's fan doelgroepen. Nutritionisten sille kinne prestizje kinne hokker kombinaasje fan winkel kochte fiedings fergruttet of helpe de medyske betingsten fan in persoan. It oerflak is allinich skrassen, en ûntdekkingen yn grutte gegevens komme elke wike.

Grutte data is Messy

Monty Rakusen / Getty

Grutte gegevens binne predictive analytics: it konvertearjen fan massive ûnstruktuerde gegevens yn wat syk te sykjen en sortearjen. Dit is in mislike en chaotyske romte dy't in spesjaal soarte fan kennis en geduld nedich is.

Nim bygelyks de monolityske UPS-leveringstsjinst. De programmers op UPS-stúdzjegegevens fan har bestjoerders 'GPS en smartphones om de meast effisjente manieren te analysearjen om oan te passen oan ferkearsûngemak. Dizze GPS- en smartphone-data is gargantuan, en net automatysk klear foar analyze. Dizze gegevens ferpleatse yn ferskate GPS- en kaart-databases, troch ferskate smartphone-apparatuer. UPS-analysts hawwe moannen útjûn dat alle gegevens oerienkomme yn in formaat dat maklik sykjen en sortearre wurde kin. De ynspanning is lykwols wurdich. Tsjintwurdich hat UPS noch mear as 8 miljoen galon fan brânstof bewarre, om't se begûn mei dizze grutte data analytiken.

Omdat grutte gegevens misbrûkt binne en sa folle ynspannings nedich binne om te reinigjen en te meitsjen foar gebrûk, gegevens wittenskippers wurde ferneamd wurden 'datajagers' foar al it langstme wurk dat se dogge.

De wittenskip fan grutte gegevens en predictive analytics ferbettert alle wike, hoewol. Ferwiderje grutte gegevens om elk troch it jier 2025 frij tagonklik te wurden.

Is gjin grutte data in yndruklike bedriging foar privacy?

Feingersh / Getty

Ja, as ús wetten en yndividuele privacyfermogen net seldsum beheare, dan grutte data lûke yn persoanlike privacy. As it stiet, sjogge Google, YouTube en Facebook al jo tydlike online gewoanten . Jo smartphone en komputer libben liedt alle dagen digitale fuotprinten, en súksesfolle bedriuwen studearje dy fuotprinten.

De wetten oer grutte gegevens binne ûntwikkele. Privacy is in steat fan wêzens dat jo no persoanlike ferantwurdlikens nimme moatte, lykas jo net langer as standert rjocht ferwachtsje kinne.

Wat jo kinne dwaan om jo privacy te beskermjen:

De grutste single stap kinne jo oannimme om jo deistige gewoanten te meitsjen mei in VPN-netwurkferbining . In VPN-tsjinst sil jo sinjaal soargje dat jo identiteit en lokaasje yn elts gefal part fan maskers wurde maskearre. Dit sil jo net 100% anonym meitsje, mar in VPN sil sterk ferminderje hoefolle de wrâld jo online-gewoanten besjen kin.

Wêr kin ik mear witte oer grutte data?

Monty Raskusen / Getty

Grutte gegevens binne in nijsgjirrige ding foar minsken mei analytyske gedachten en in leafde foar tech. As jo ​​dit binne, besykje jo opnij dizze side fan interessante grutte dataprojekten.