Može li Spark čitati lokalne datoteke?
Može li Spark čitati lokalne datoteke?

Video: Može li Spark čitati lokalne datoteke?

Video: Može li Spark čitati lokalne datoteke?
Video: Страшные истории. ЗАПЕРТАЯ КОМНАТА. Деревенские страшилки. Ужасы. Мистика. 2024, Travanj
Anonim

Dok Iskra podržava utovar datoteke od lokalni datotečni sustav, zahtijeva da datoteke dostupni su na istom putu na svim čvorovima u vašem klasteru. Neki mrežni datotečni sustavi, kao što su NFS, AFS i MapR-ov NFS sloj, izloženi su korisniku kao obični datotečni sustav.

Nakon toga, netko se također može pitati, kako mogu pokrenuti spark u lokalnom načinu rada?

U lokalni način , iskra poslovima trčanje na jednom stroju, a izvode se paralelno korištenjem višenitnog rada: ovo ograničava paralelizam na (najviše) broj jezgri u vašem stroju. Do trčanje poslovi u lokalni način , prvo morate rezervirati stroj putem SLURM-a u interaktivnom način rada i prijavite se na njega.

Osim gore navedenog, što je SC textFile? tekstualnu datoteku je metoda org. apache. SparkContext razred koji glasi a tekstualnu datoteku iz HDFS-a, lokalnog datotečnog sustava (dostupno na svim čvorovima) ili bilo kojeg URI-ja datotečnog sustava koji podržava Hadoop i vrati ga kao RDD nizova.

U tom smislu, što je spark datoteka?

The Spark File je dokument u kojem čuvate svu svoju kreativnu dobrotu. Definirao ga je autor Stephen Johnson. Dakle, umjesto da zapisujete bilješke na Post-it® usred noći ili posvećujete različite časopise idejama, sve svoje koncepte stavljate u jedan datoteka.

Što je paralelna iskra prikupljanja?

Kasnije ćemo opisati operacije na distribuiranim skupovima podataka. Paralelizirane zbirke kreiraju se pozivanjem JavaSparkContext 's paralelizirati metoda na postojećoj Kolekcija u vašem programu vozača. Elementi kolekcija kopiraju se kako bi se formirao distribuirani skup podataka s kojim se može raditi paralelno.

Preporučeni: