@article{Prabaswara_Saputra_2020, title={Analisis Data Sosial Media Twitter Menggunakan Hadoop dan Spark}, volume={4}, url={https://journal.uir.ac.id/index.php/ITJRD/article/view/4099}, DOI={10.25299/itjrd.2020.vol4(2).4099}, abstractNote={<div id="MathJax_Message" style="display: none;"> </div> <p><em>Big data</em> merupakan sumber data yang memiliki volume yang besar, variasi yang banyak, dan aliran data yang sangat cepat. Contoh big data antara lain data dari media sosial dan <em>query</em> pencarian <em>Google. </em>Data tersebut mampu melacak aktivitas penyakit dan data yang ada tersedia setiap saat. Pengolahan <em>big data</em> bukanlah suatu hal yang mudah, sehingga diperlukan suatu tools yang dapat membantu proses pengolahan terhadap big data. Salah satu <em>tools</em> tersebut adalah <em>hadoop</em><em>. </em>Meskipun kinerja <em>hadoop</em> lebih unggul daripada RDBMS tradisional, akan tetapi pengolahan data menggunakan <em>hadoop</em> belum maksimal. Sehingga, diperlukan pengolahan data yang lebih cepat. Salah satu cara untuk meningkatkan kecepatan pengolahan data ialah menerapkan <em>spark</em> untuk proses pengolahan data yang ada di HDFS (<em>Hadoop Distributed File System</em>). Pada penelitian ini dilakukan <em>plotting tren</em> dan pemetaan pada data Demam Berdarah <em>Dengue </em>(DBD) yang berasal dari media sosial <em>twitter.</em> Penelitian ini bertujuan untuk membuat visualisasi data yang diperoleh dari <em>twitter</em> dengan menggunakan <em>hadoop</em> dan <em>spark</em> dalam memantau perkembangan DBD di wilayah Asia Tenggara. Hasil dari <em>plotting </em>tren menunjukkan adanya hubungan yang kuat antara data <em>twitter</em>, data asli kejadian DBD yang diperoleh dari WHO<em>. </em>Penelitian ini juga melakukan pengujian performa <em>hadoop</em> dan <em>spark</em>. Semakin besar alokasi <em>memory executor</em> yang diterapkan serta semakin besar dan serupa alokasi maksimal <em>memory scheduler</em> yang diterapkan pada tiap node, maka waktu yang dibutuhkan untuk menyelesaikan <em>task</em> semakin singkat. Akan tetapi, pada titik tertentu konfigurasi <em>hadoop</em> dan <em>spark</em> menemui titik puncaknya, sehingga jika alokasi diperbesar menghasilkan hasil yang sama.</p>}, number={2}, journal={IT Journal Research and Development}, author={Prabaswara, Irfan Rizqi and Saputra, Ragil}, year={2020}, month={Mar.} }