Što je AWS MapReduce?
Što je AWS MapReduce?

Video: Što je AWS MapReduce?

Video: Što je AWS MapReduce?
Video: Big Data Technologies. Лекция 3. MapReduce 2024, Studeni
Anonim

Amazon Elastic MapReduce (EMR) je Amazon Web Services ( AWS ) alat za obradu i analizu velikih podataka. Amazon EMR obrađuje velike podatke kroz Hadoop klaster virtualnih poslužitelja na Amazon Elastic Compute Cloud (EC2) i Amazon Simple Storage Service (S3).

Na ovaj način, kako radi AWS EMR?

Usluga pokreće broj Amazon EC2 instanci koje je odredio korisnik, koji se sastoji od jednog glavnog i više drugih čvorova. Amazon EMR pokreće Hadoop softver na ovim instancama. Glavni čvor dijeli ulazne podatke u blokove i distribuira obradu blokova na druge čvorove.

Osim gore navedenog, koja je razlika između ec2 i EMR-a? Za razliku od EMR , EC2 ne kategorizira slave čvorove u jezgre i čvorove zadataka. To povećava rizik od gubitka HDFS podataka u slučaju uklanjanja/gubljenja čvora. EC2 koristi Apache biblioteke (s3a) za pristup podacima na s3. S druge strane, EMR koristi AWS vlasnički kod za brži pristup s3.

Osim toga, je li AWS EMR u potpunosti upravljan?

Amazon Elastic MapReduce ( EMR ) je potpuno upravljano Hadoop i Spark platforma od Amazon Web usluga ( AWS ). S EMR , AWS korisnici mogu brzo pokrenuti Hadoop klastere s više čvorova za obradu velikih podataka.

Koristi li AWS Hadoop?

Amazon Web usluge koristi Apache otvorenog koda Hadoop distribuirana računalna tehnologija kako bi se olakšao pristup velikim količinama računalne snage za izvršavanje zadataka koji zahtijevaju velike količine podataka. Hadoop , open-source verziju Google MapReducea, već koriste tvrtke kao što su Yahoo i Facebook.

Preporučeni: