Resilient Distributed Datasets w Apache Spark – Część 1

Dwa poprzednie wpisy były w głównej mierze teoretyczne. Najwyższa pora na pierwsze kody na blogu! Na tapet bierzemy podstawowy typ danych platformy Spark – RDD. Dlaczego akurat taki temat? Poznanie tych kolekcji umożliwia postawienie pierwszych kroków w Sparku, a zrozumienie ich działania pozwala na wydajne przetwarzanie danych.

Czytaj dalej „Resilient Distributed Datasets w Apache Spark – Część 1”