Jurusan/Fakultas/Perguruan Tinggi : Teknologi Informasi/Teknik/Universitas Udayana
Mata Kuliah : Data Warehouse
Dosen : I Putu Agus Eka Pratama, ST MT
Data
Warehouse dan Big Data
Akhir-akhir ini, istilah 'big data'
menjadi topik yang dominan dan sangat sering dibahas dalam industri IT. Banyak
pihak yang mungkin heran kenapa topik ini baru menjadi pusat perhatian padahal
ledakan informasi telah terjadi secara berkelangsungan sejak dimulainya era
informasi. Perkembangan volume dan jenis data yang terus meningkat secara
berlipat-lipat dalam dunia maya Internet semenjak kelahirannya adalah fakta
yang tak dapat dipungkiri. Mulai data yang hanya berupa teks, gambar atau foto,
lalu data berupa video hingga data yang berasal system pengindraan. Lalu kenapa
baru sekarang orang ramai-ramai membahas istilah big data? Apa sebenarnya 'big
data' itu?
Big data merupakan evolusi dari data
warehouse dimana big data mencakup semua data warehouse namun data warehaose
tidak bisa disebut sebagai big data. Data berasal dari beberapa database
yaitu, data warehouse suatu perusahaan yang berisi data dari sistem yang keuangan
perusahaan, sistem pemasaran pelanggan, sistem penagihan, yang point-of-sales
sistem, dan sebagainya. sistem big data memanfaatkan sumber-sumber data baru
dan memungkinkan perusahaan untuk menganalisis dan mengambil nilai bisnis dari
set data besar. Big Data merupakan
sebuah ungkapan atau frase, yang digunakan untuk menggambarkan data yang
memiliki volume besar baik data terstruktur dan tidak terstruktur yang
sulit untuk diproses menggunakan teknik database dan perangkat lunak
tradisional. data yang besar memiliki potensi untuk membantu perusahaan dalam
meningkatkan operasi dan membuat segalanya menjadi lebih cepat dan karena
kelengkapan data nya dapat untuk membuat keputusan yang lebih cerdas.
Hadoop merupakan perangkat lunak framework
berbasis java yang bersifat open source. hadoop berguna sebagai penyimpanan
serta pemrosesan big data yang terdistribusi dalam sebuah cluster komputer.
Hadoop memiliki dua bagian utama yaitu bagian penyimpanan dan juga bagian
pemrosesan. hadoop memanipulasi data yang dimiliki untuk memungkinkan data
yang akan diproses agar lebih cepat dan lebih efisien dibandingkan dalam
arsitektur superkomputer yang lebih konvensional yang masih mengandalkan sistem
file paralel di mana perhitungan dan data yang terhubung melalui jaringan
berkecepatan tinggi.
Data mining dapat disebut sebagai knowledge discovery adalah sebuah proses memilah data dalam berbagai sudut pandang dan kemudian membuat sebuah kesimpulan dari data yang diteliti.
Data mining dapat berguna untuk menemukan hubungan atau pola dalam relasi database. Hasil dari data mining dapat menjadi bahan pertimbangan untuk menambah penghasilan maupun mengurangi pengeluaran. Penggunaan data mining dapat ditemui pada supermarket, mereka melihat barang apa yang paling banyak dibeli oleh tipe pelanggan yang mana pada waktu tertentu dan menggunakannya untuk memberikan diskon pada hari tertentu/waktu tertentu dan menentukan penempatan barang pada supermarket tersebut.
Referensi :
0 komentar:
Posting Komentar