Kako se postiže lokalizacija podataka u Hadoopu?
Kako se postiže lokalizacija podataka u Hadoopu?

Video: Kako se postiže lokalizacija podataka u Hadoopu?

Video: Kako se postiže lokalizacija podataka u Hadoopu?
Video: Создание динамических веб-приложений с помощью Laravel, Эрик Оуян 2024, Svibanj
Anonim

Lokalizacija podataka u Hadoop . Uzmite primjer broja riječi, gdje se većina riječi ponavlja 5 ili više puta. U tom slučaju nakon faze Mapper, svaki izlaz mapera imat će riječi u rasponu od 5 Lacs. Ovaj potpuni proces pohranjivanja Mapper izlaza u LFS naziva se kao Lokalizacija podataka.

Imajući to na umu, što je lokalizacija podataka u Hadoopu?

Koncept od Podaci lokalitet u Hadoop podaci lokalitet u MapReduce odnosi se na sposobnost pomicanja izračuna blizu mjesta gdje je stvarna podaci nalazi se na čvoru, umjesto da se kreće velikim podaci na računanje. To smanjuje zagušenje mreže i povećava ukupnu propusnost sustava.

Također, kako se pohranjuju veliki podaci? Većina ljudi automatski povezuje HDFS, ili Hadoop distribuirani datotečni sustav, s Hadoop-om podaci skladišta. HDFS pohranjuje informacije u klastere koji se sastoje od manjih blokova. Ovi blokovi su pohranjene u fizičkom na licu mjesta skladištenje jedinice, kao što su interni diskovi.

Samo tako, kako se podaci pohranjuju u Hadoopu?

Na a Hadoop klaster, podaci unutar HDFS-a i MapReduce sustav smješteni su na svakom stroju u klasteru. Podaci je pohranjene u podaci blokova na DataNodes. HDFS ih replicira podaci blokove, obično veličine 128 MB, i distribuira ih tako da se repliciraju unutar više čvorova u klasteru.

Kako se datoteke spremaju u HDFS?

HDFS izlaže a datoteka imenskog prostora sustava i omogućuje da se korisnički podaci pohranjene u datoteke . Interno, a datoteka je podijeljen u jedan ili više blokova i ti blokovi su pohranjene u skupu DataNodes. NameNode se izvršava datoteka operacije imenskog prostora sustava poput otvaranja, zatvaranja i preimenovanja datoteke i imenike.

Preporučeni: