Big Data 3 Vs - kontseptsioonid ja mudelid

Sisukord:

Big Data 3 Vs - kontseptsioonid ja mudelid
Big Data 3 Vs - kontseptsioonid ja mudelid

Video: Big Data 3 Vs - kontseptsioonid ja mudelid

Video: Big Data 3 Vs - kontseptsioonid ja mudelid
Video: WordPress è infinitamente meglio che Facebook! Video tutorial testimonial @SanTenChan - YouTube 2024, Aprill
Anonim

Mõiste "andmed" ei ole meile uus. See on üks peamisi asju, mida õpetatakse infotehnoloogia ja arvutite valimisel. Kui saate meenutada, loetakse andmeid toorainena. Kuigi juba kümme aastat on see termin Suured andmed on buzz nendel päevadel. Terminist ilmneb, et koormused ja koormate andmed on suured andmed ja seda saab töödelda erineval viisil, kasutades vajalike andmete hankimiseks erinevaid meetodeid ja tööriistu. Selles artiklis räägitakse Big Datai kontseptsioonist, kasutades 3 V-d, mida on maininud Doug Laney, andmehoidla valdkonnas tegutsev pioneer, kes loeb alustanud valdkonda Infotehnoloogia (Infotehnoloogia).

Enne kui jätkate, võite lugeda meie artikleid Big Data ja Big Datai põhitõdesid, et mõista sisuliselt. Suurte andmete kontseptsioonide täiendavaks selgitamiseks võivad nad selle postituse juurde lisada.
Enne kui jätkate, võite lugeda meie artikleid Big Data ja Big Datai põhitõdesid, et mõista sisuliselt. Suurte andmete kontseptsioonide täiendavaks selgitamiseks võivad nad selle postituse juurde lisada.

Big Data 3 Vs

Andmed, mis olid tohutul kujul, erinevate vahenditega kogunenud, esitati varem erinevates andmebaasides õigesti ja mõne aja pärast lammutati. Kui kontseptsioon ilmnes, et mida rohkem andmeid, seda lihtsam on teada saada - erinevat ja asjakohast teavet - kasutades õigeid vahendeid, hakkasid ettevõtted andmete säilitamist pikemateks perioodideks. See on nagu uute salvestusseadmete lisamine või pilve kasutamine, et säilitada andmeid mis tahes kujul andmete hankimisel: dokumendid, arvutustabelid, andmebaasid ja HTML jne. Siis korraldatakse õiged formaadid, kasutades tööriistu, mis võimaldavad töödelda suuri tükke Andmed

MÄRGE: Big Datai ulatus ei piirdu teie kogutud ja salvestatud andmetega teie ruumides ja pilves. See võib sisaldada andmeid erinevatest muudest allikatest, sealhulgas, kuid mitte ainult, avalikes huvides olevatelt objektidelt.

Big Data 3D-mudel põhineb järgmistel V-del:

  1. Köide: viitab andmete salvestamise juhtimisele
  2. Kiirus: viitab andmetöötluse kiirusele
  3. Erinevus: viitab erinevate, näiliselt sõltumatute andmekogumite rühmitamise andmetele

Järgmistes lõikudes selgitatakse Big Datai modelleerimist, rääkides üksikasjadest iga mõõtme (iga V) kohta.

A] Suurte andmete maht

Suurematest andmetest rääkides võiksite mõista, et see on tohutu teabe tohutu kogum. Kuigi see on tõsi, on ka andmete säilitamise kulud. Olulisi andmeid saab hoida nii ruumides kui ka pilves, viimane on paindlik valik. Kuid kas peate iga ja kõike hoidma?

Meta Groupi poolt avaldatud valgepaberi andmetel hakkab andmemahtude andmete hulk muutuma ebavajalikuks. Lisaks märgitakse, et tuleks säilitada ainult selline andmete hulk, mida ettevõtted kavatsevad kasutada. Muid andmeid võidakse kõrvale jätta või kui ettevõtted ei soovi loobuda väidetavalt mitteolulistest andmetest, võidakse neid tühjendada kasutamata arvutites ja isegi lintides, nii et ettevõtted ei pea selliseid andmeid säilitama.

Ma kasutasin "väidetavalt vähetähtsaid andmeid", sest ka mina usun, et mis tahes tüüpi andmeid võivad tulevikus nõuda - varem või hiljem - ja seega tuleb seda hoida kaua aega enne, kui tead, et andmed on tõepoolest tähtsusetu. Personaalselt annan ma vanad andmed kõvakettadesse minevikust ja mõnikord ka DVD-st. Peamised arvutid ja pilve ladustamine sisaldavad andmeid, mida pean oluliseks ja tean, et ma kasutan. Selliste andmete hulgas on kasutusel ka ükskõik milline andmetest, mis võivad mõne aasta pärast vanale kõvakettale jõuda. Eespool toodud näide on lihtsalt teie arusaamiseks. See ei sobi Big Data-i kirjeldusele, sest summa on suhteliselt väiksem, võrreldes ettevõtetega Big Data-ga.

B ] Kiirus suurtes andmetes

Andmete töötlemise kiirus on oluline tegur Big Data kontseptsioonide rääkimisel. On palju veebisaite, eriti e-kaubandust. Google oli juba tunnistanud, et kiirus, mille puhul lehe koormus on paremate paremusjärjestuste jaoks oluline. Peale pingeread, pakub kiirus kasutajatele ka mugavust, kui nad poodevad. Sama kehtib andmete kohta, mida töödeldakse muu teabe jaoks.

Rääkides kiirusest, on oluline teada, et see ei ületa ainult suuremat ribalaiust. See ühendab hõlpsasti kasutatavad andmed erinevate analüütiliste tööriistadega. Kergesti kasutatavad andmed tähendab mõnda kodutööd, et luua hõlpsasti töödeldavate andmete struktuure. Järgmine mõõde - Variety, levitab seda veelgi.

C] Suurte andmete valik

Andmete koormuse ja koormuse korral on oluline korraldada neid viisil, mis võimaldab analüüsi tööriistadel andmeid hõlpsalt töödelda. Samuti on olemas tööriistad andmete korraldamiseks. Ladustamise ajal võivad andmed olla struktureerimata ja mis tahes kujul. Teie jaoks on arusaadav, milline on tema suhe teiste andmetega teiega. Kui olete välja selgitanud seose, saate valida sobivad tööriistad ja teisendada andmed struktureeritud ja sorteeritud salvestusruumi soovitud vormi.

Image
Image

Kokkuvõte

Teisisõnu põhineb Big Data 3D mudelil kolm mõõdet: teie käsutuses olevad USABLE-andmed; andmete nõuetekohane märgistamine; ja kiirem töötlemine. Kui neid kolme hooldatakse, saab teie andmeid kergesti töödelda või analüüsida, et välja selgitada, mida soovite.

Eespool kirjeldatakse nii kontseptsioone kui ka Big Data 3D-mudelit. Teises lõigus seotud artiklid näitavad täiendavat toetust, kui olete kontseptsiooni uus.

Kui soovite midagi lisada, siis palun kommenteeri.

Soovitan: