
Pelatihan Big Data Analytics with Apache Spark

Apache Spark adalah framework pemrosesan big data open source yang dibangun untuk mengatasi keterbatasan dari solusi map-reduce. Ide utama di balik Spark adalah menyediakan abstraksi memori yang memungkinkan kita untuk berbagi data secara efisien di berbagai tahapan proses map-reduce atau menyediakan berbagi data dalam memori.
Apache Spark telah menjadi salah satu framework pemrosesan big data yang terdistribusi di dunia. Spark dapat digunakan dalam berbagai cara, menyediakan native binding untuk bahasa pemrograman Java, Scala, Python, dan R, dan mendukung SQL, streaming data, pembelajaran mesin, dan pemrosesan grafik. Spark sangat diperlukan diberbagai industri, seperti bank, perusahaan telekomunikasi, perusahaan game, pemerintah, dan semua raksasa teknologi seperti Apple, Facebook, IBM, dan Microsoft.
Menurut para ahli di industri, Spark merupakan produk yang lebih maju daripada Hadoop – lebih mutakhir, dan dirancang untuk bekerja dengan memproses data di dalam memori dalam bentuk yang terbagi-bagi. Ini berarti transfer data dari physical memory, magnetic hard disc ke memori elektronik dapat dilakukan jauh lebih cepat – hingga 100 kali lebih cepat dalam beberapa operasi.
Oleh karena ini, Utrain Telkom University mengadakan Pelatihan Big Data Analytics with Apache Spark yang dilaksanakan pada Desember 2018.
Durasi Pelatihan : 3 Hari
Garis Besar Pelatihan :
- Pengantar Big Data Hadoop dan Spark
- Pengantar Scala untuk Apache Spark
- Pemrograman Fungsional dan Konsep OOPs di Scala
- Deep Dive into Apache Spark Framework
- Bermain dengan Spark RDD
- DataFrames dan Spark SQL
- Machine Learning menggunakan Spark MLlib
- Deep Dive ke dalam Spark MLlib
- Memahami Apache Kafka dan Apache Flume
 
							
Recent Comments