Što je podatkovno jezero u Hadoopu?
Što je podatkovno jezero u Hadoopu?

Video: Što je podatkovno jezero u Hadoopu?

Video: Što je podatkovno jezero u Hadoopu?
Video: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, Prosinac
Anonim

A Hadoop podatkovno jezero je podaci platforma za upravljanje koja se sastoji od jednog ili više Hadoop grozdovima. Uglavnom se koristi za obradu i pohranu nerelacijskih podaci , kao što su datoteke zapisnika, internetski zapisi klikova, senzor podaci , JSON objekte, slike i objave na društvenim mrežama.

U tom smislu, koja je razlika između skladišta podataka i podatkovnog jezera?

Jezera podataka i podaci i skladišta se naširoko koriste za skladištenje velikih podaci , ali to nisu zamjenjivi pojmovi. A podatkovno jezero je golem bazen sirovina podaci , čija svrha još nije definirana. A Skladište podataka je spremište za strukturirane, filtrirane podaci koji je već obrađen za određenu svrhu.

Dodatno, što je arhitektura podatkovnog jezera? A Data Lake je spremište za pohranu koje može pohraniti veliku količinu strukturiranih, polustrukturiranih i nestrukturiranih podaci . Za razliku od hijerarhijske Dataware kuće gdje podaci je pohranjena u datotekama i mapama, Jezero podataka ima stan arhitektura.

S obzirom na to, što se podrazumijeva pod podatkovnim jezerom?

A podatkovno jezero je spremište za pohranu koje sadrži golemu količinu sirovog podaci u svom izvornom formatu dok ne bude potreban. Dok je hijerarhijski podaci skladišne trgovine podaci u datotekama ili mapama, a podatkovno jezero koristi ravnu arhitekturu za pohranu podaci . Uvjet podatkovno jezero često se povezuje s pohranom objekata orijentiranom na Hadoop.

Je li Elasticsearch podatkovno jezero?

A podatkovno jezero je jednostavno mjesto za parkiranje podaci dok vam ne zatreba, a mogao bi obuhvaćati HDFS (najčešći), pohranu objekata, NAS kutije ili bilo što drugo. Temeljno, Elasticsearch je alat za indeksiranje podaci , nije za skladištenje podaci sebe.

Preporučeni: