-
ESIS S.r.l.
-
Attestato di partecipazione
-
€ 1.500,00
-
32
-
E-learning
Descrizione
Premesse
Apache Spark è un framework open source per il calcolo distribuito sviluppato dall’AMPlab della Università della California e successivamente donato alla Apache Software Foundation.
A differenza del paradigma MapReduce, basato sul disco a due livelli di Hadoop, le primitive “in-memory” multilivello di Spark forniscono prestazioni fino a 100 volte migliori per talune applicazioni. Ciò permette ai programmi utente di caricare dati in un gruppo di memorie e interrogarlo ripetutamente, Spark è studiato appositamente per algoritmi di apprendimento automatico.
Obiettivi del corso
L’obiettivo del corso è quello di mettere i discenti in condizione di essere autonomi nella programmazione del linguaggio Spark, nelle sue varie componenti e di comprendere l’architettura del sistema distribuito.
Piano di lavoro
PRIMO GIORNO: Principali caratteristiche del linguaggio
- Metodologia e Sintassi di Base
- Moduli e Contesto processivo
- Esempi ed Esercitazioni pratiche
SECONDO GIORNO: Architettura e meccanismi di elaborazione
- Architettura del Cluster
- Spark, Scala e Python
- Esempi ed Esercitazioni pratiche
TERZO GIORNO: RDD, Dag Scheduler e Worker
- Resilient Distributed Dataset
- DAG Skeduler e Job Worker
- Esempi ed Esercitazioni pratiche
QUARTO GIORNO: Trasformazioni, Frame e Streaming
- Azioni e Trasformazioni
- Frame SQL, Modulo ML e Spark Streaming
- Esempi ed Esercitazioni pratiche
Requisiti di partecipazione
Prerequisiti e strumenti richiesti
Il corso è rivolto a personale informatico già in possesso di una buona esperienza di programmazione in uno dei linguaggi Java, Scala o Python. Durante il corso saranno comunque riviste le necessarie nozioni propedeutiche, per poi affrontare argomenti specifici del sistema Spark.