Minggu, 01 Maret 2020

BI-cloudera

Solusi Big Data di Indonesia

31 Januari 2017 0 comment

Apa itu Big Data?

Big data adalah sebuah istilah yang digunakan untuk menggambarkan set data dalam ukuran yang sangat besar yang mungkin secara komputasi dianalisis untuk menemukan pola, trend, asosiasi, terutama dalam hubungannya terhadap interaksi dan tindakan manusia
Kumpulan data ini demikian besar dan kompleksnya sehingga aplikasi pemrosesan data tradisional tidak mampu memprosesnya. Pemrosesan ini termasuk analisis, pencarian, pengumpulan, pembagian, penyimpanan, transfer, visualisasi, query, pembaharuan data dan kerahasiaan informasi. Istilah Big Data secara sederhana mengacu ke predictive analytics, user behavior analysis dan metode analytics data yang mengambil data dalam bentuk terstruktur maupun tidak.
Big data berisikan berbagai jenis data dalam berbagai macam format:
  1. Structured data seperti relational database (RDBMS)
  2. Semi-Structured data seperti XML, JSON
  3. Unstructured data seperti Dokumen, metadata, video, gambar, audio, file teks, ebooks, email message, social media, jurnal dll.
Mengenai sejarah dan detail lain dari Big Data dapat ditemukan di berbagai sumber informasi lainnya dan tidak akan dibahas disini.

Bagaimana hubungan Big Data dan Data Warehouse?

Big Data dan Data Warehouse (DWH) merupakan dua hal yang sangat berbeda.
DWH memproses data-data dalam format terstruktur sementara Big Data mampu memproses data dalam format berbagai jenis.
DWH fokus kepada performance untuk mendapatkan data secepat mungkin sementara Big Data lebih berorientasi pada analisis data untuk pengembangan bisnis di masa depan.
Pada sisi teknologi DWH umumnya dilayani oleh vendor-vendor utama seperti: IBM, Oracle, Microsoft, SAP, dan lainnya sementara Big Data umumnya dilayani oleh komunitas open source
Big data tidak membutuhkan appliance dalam menjalankan fungsinya dan bisa mempergunakan commodity server sebagai pengganti sementara Data warehouse umumnya dipaketkan sebagai appliance.

Mengapa Big Data penting?

Analisis big data menjadi penting karena digunakan untuk pengambilan keputusan terkait bisnis. Big data juga membantu pebisnis untuk menemukan peluang-peluang bisnis baru yang tidak dapat dilihat dengan mempergunakan data tradisional saja.

Apa manfaat Big Data untuk Bank?

Bagi Bank adalah penting untuk belajar dari data masa lalu namun lebih penting lagi mempergunakan data tersebut untuk memprediksi bisnis di masa depan.
Beberapa use case bank di Indonesia yang mempergunakan Big Data adalah:
1. Customer Retention dan Acquisition
    Bank melakukan analisa data dan menargetkan iklan berbasiskan machine learnin
2. Menemukan anomali dalam transaksi
    Misalnya jika terjadi transaksi mencurigakan yang tidak cocok dengan profil dari si pengguna

Solusi Big Data di Indonesia

Secara umum solusi Big Data pasti mempergunakan solusi Hadoop.
Hadoop adalah open source software framework yang sangat terkenal dan merupakan inti dari Big Data Analytics. Hadoop menyediakan penyimpanan data enterprise dan analytics dengan skalabilitas yang hampir tidak terbatas. Karena sifat Hadoop adalah open source maka artinya semua orang boleh mempergunakan. Tetapi seiring dengan kemajuan dan pemanfaatannya yang seringkali mengalami penyesuaian di sisi klien maka menimbulkan Hadoop distribusi komersial.
Distribusi komersial Hadoop ini biasanya menambahkan fungsi-fungsi untuk mempermudah klien dalam melakukan pengembangan untuk penyimpanan data dan analitik maupun fungsi securitynya. Umumnya distribusi komersial ini mempergunakan skema subscription.
Distribusi komersial Hadoop umumnya juga menawarkan dukungan (support) terhadap sistem sehingga klien tidak perlu bergantung kepada komunitas open source, hal ini biasanya dibutuhkan oleh institusi yang menerapkan SLA (Service Level Agreement) dalam operasi mereka, seperti Bank.
Di Indonesia distribusi komersial Hadoop yang ada di pasar perbankan adalah:
1. Cloudera
Cloudera adalah vendor pertama yang menawarkan Hadoop sebagai sebuah paket dan terus menjadi trend dalam industri. Distribusi Cloudera CDH, yang berisi semua komponen open source, adalah distribusi Hadoop paling populer. Cloudera dikenal sebagai yang paling cepat berinovasi dengan pengembangan framework inti Cloudera - misalnya dengan menawarkan SQL-untuk-Hadoop dengan mesin query Impala nya. Yang lainnya termasuk user interface, security dan interface untuk integrasi dengan aplikasi pihak ketiga. Cloudera juga menawarkan dukungan untuk seluruh distribusi melalui layanan berlangganan mereka.
Perusahaan yang merupakan partner Cloudera di Indonesia adalah PT Mastersystem Infotama (http://www.mastersystem.co.id) dan PT Mitra Integrasi Informatika (http://www.mii.co.id/)
2. Hortonworks
Platform Hortonworks sepenuhnya open source - pada kenyataannya perusahaan ini dikenal sebagai perusahaan yang mengakuisisi perusahaan lain yang mempunya code yang berguna dan melepaskannya ke komunitas open source. Hal ini membuat Hortonworks menjadi sangat populer di pasar. Tahun ini Pivotal menghentikan pengembangan distribusi mereka sendiri dan baik Amazon maupun IBM kini menawarkan Hortonworks sebagai pilihan pada platform mereka, bersama distribusi Hadoop mereka sendiri. Platform Hortonworks juga merupakan inti dari Open Data Platform Initiative - sebuah kelompok yang menyederhanakan dan menstandarkan spesifikasi dalam ekosistem Big Data. Dalam jangka panjang sepertinya hal ini akan mendapatkan dukugan luas.
3. MapR
Seperti Hortonworks dan Cloudera, MapR adalah fokus sebagai penyedia platform, bukan managed services, seperti Amazon atau Microsoft. MapR mengintegrasikan sistem database mereka sendiri - MapR-DB yang diklaim adalah empat sampai tujuh kali lebih cepat dari database Hadoop biasa - HBase yang digunakan oleh kompetitor mereka. Karena kekuatan dan kecepatan inilah MapR sering dianggap sebagai pilihan yang terbaik untuk proyek Big Data yang ukurannya sangat besar.
Perusahaan yang merupakan partner MAPR di Indonesia adalah:  PT Packet Sistem Indonesia (https://www.packet-systems.com/) dan PT Fortius Solusi Informatika (http://www.fortius-si.co.id)
Reference: R&D TeknologiBank.com

Tidak ada komentar:

Posting Komentar