Spark Core

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/15

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 1:19 PM on 6/10/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

16 Terms

1
New cards

Créé une rdd allant de 1 à 10

rdd = sc.parallelize(range(1, 11))

2
New cards

Affiche le contenu d’une rdd

rdd.collect

3
New cards

Créer le carré de chaque élément d’une rdd

rdd.map(lambda x: x*x)

4
New cards

filtre les éléments pairs d’une rdd

rdd.filter(lambda x: x % 2 == 0)

5
New cards

Créer une rdd en séparant un texte en mots

sc.parallelize(text.split(“ “))

6
New cards

Transforme word en clé:valeur

.map(lambda word: (word, 1))

7
New cards

Regroupe par clé et additione les valeurs

.reduceByKey(lambda a,b : a + b)

8
New cards

Regroupe et agrège par clé

.reduceByKey

9
New cards

Trier par clé

.sortByKey

10
New cards

Somme par clé en utilisant un groupBy

.groupByKey.mapValues(sum)

11
New cards

Affiche la valeur la plus fréquente

.max(key = lambda x: x[1])

12
New cards

Créer un dataframe

.createDataFrame(data, schema = schema)

13
New cards

Trier var dans l’ordre décroissant

.orderBy(df.var.desc())

14
New cards

Calculer la somme des amount par pays d’un df

.agg(F.sum(“amount”).alias(“total_amounts”))

15
New cards

Faire une jointure interne de data sur user_id

join(data, on = “user_id”, how = “inner”)

16
New cards

Faire la somme de tous les éléments d’une rdd

rdd.reduce(lambda a,b : a + b)