Memahami Dasar-dasar “Data Science” untuk Bisnis (Bagian 3)

Pada tulisan seri pertama sudah dijelaskan mengenak dasar teori dan komponen pendukung Data Science. Kemudian dalam seri kedua telah dijelaskan pula konsep Big Data sebagai salah satu keluaran dari ilmu Data Science. Tulisan ketiga ini akan membahas seputar penerapan konsep data driven dalam bisnis, yakni memahami tentang keuntungan bisnis membangun awareness seputar pengelolaan data serta kiat memanfaatkan data yang ada sehingga menghasilkan insight berharga.

Tujuan utama bisnis adalah pertumbuhan profit, dan untuk mencapai goal tersebut diperlukan berbagai pendekatan baik yang dilakukan dalam lini internal bisnis maupun eksternal. Lalu apa peran Data Science yang dapat dioptimalkan bisnis untuk mencapai tujuan tadi. Misalnya untuk meminimalkan risiko finansial. Sebagai contoh dalam bisnis e-commerce, memanfaatkan representasi data dengan metode Time Series Anomaly Detection dapat dimanfaatkan untuk mendeteksi fraud secara real-time.

Manfaat lain untuk memberikan efisiensi dalam sistem dan proses produksi. Menggunakan beberapa tipe analisis (akan dibahas kemudian), pemangku keputusan bisnis dapat melihat tren data yang ada, kemudian menciptakan sebuah proses yang lebih efisien dan terstruktur. Kemudian manfaat lain dari penerapan Data Science dalam bisnis adalah untuk meningkatkan penjualan, dengan menemukan cara terbaik untuk strategi up-sell dan cross-sell, meningkatkan loyalitas konsumen, hingga mengoptimalkan konversi dari setiap kanal promosi. Dan masih banyak manfaat lainnya.

Tipe analisis data dalam bisnis

Setelah bisnis memiliki awareness akan data –sebut saja sudah mengakomodasi pengelolaan data secara optimal—lalu apa langkah selanjutnya? Yakni memilih pendekatan analisis sesuai dengan kebutuhan yang ingin dicapai. Dalam konsep Data Science ada beberapa tipe analisis data yang paling sering digunakan untuk kebutuhan bisnis, di antaranya:

  1. Descriptive Analytics; analisis ini mengacu pada histori data sekaligus data yang ada saat ini. Umumnya digunakan untuk menjawab pertanyaan semacam “Apa yang terjadi dengan ABC?”, “Apa yang terjadi jika XYZ?”, dan sebagainya.
  2. Diagnostic Analytics; analisis ini digunakan untuk menyimpulkan kejadian berdasarkan lansiran data terkait. Digunakan untuk menjawab pertanyaan semacam “Mengapa ABC terjadi saat XYZ?”, “Apa yang salah dengan strategi DEF?”, dan sebagaiya.
  3. Predictive Analytics; analisis ini mencoba menyimpulkan sebuah tren dan kejadian di masa depan mengacu pada data-data historis yang ada. Model ini cenderung lebih kompleks dari dua tipe sebelumnya, karena memerlukan pemodelan dan analisis yang lebih mendalam.
  4. Prescriptive Analytics; analisis ini digunakan untuk mengoptimalkan proses, struktur dan sistem melalui informasi yang dihasilkan dari Predictive Analytics. Pada dasarnya memberi tahu kepada bisnis tentang hal apa yang perlu dilakukan untuk mengantisipasi kejadian yang ada datang.

Untuk merealisasikan implementasi analisis bisnis, umumnya bisnis dihadapkan pada dua kendala. Pertama ialah menemukan sumber daya/talenta yang berkompeten. Dan yang kedua tentang bagaimana cara mengomunikasikan hasil analisis. Strategi pepnyelesaiannya bisnis dapat membangun budaya kerja yang menerima produk analisis. Edukasi kepada setiap pegawai juga harus diprioritaskan, untuk memutuskan atau melakukan sesuatu yang terukur, berdasarkan data dan analisis.

Tentang Business Intelligence

Berkaitan dengan optimasi data, mungkin istilah Business Intelligence (BI) dewasa ini menjadi perbincangan hangat, pasalnya banyak perusahaan ataupun startup mulai membangun divisi khusus berkaitan dengan BI. Kendati sama-sama memiliki cara dengan mengoptimalkan data, BI secara definisi sedikit berbeda dengan Data Science. Perbedaannya dengan Data Science ialah pada pendekatan, teknologi dan fungsinya. Tujuan utama BI adalah mengonversi data menjadi insight bisnis yang dapat digunakan pemimpin bisnis atau manajer dalam membuat keputusan yang terukur.

BI umumnya terdiri dari data yang bersifat transaksional, yang secara natural data tersebut dilahirkan dari sebuah proses bisnis. Pengelolaan data tersebut dapat menjawab beberapa pertanyaan, misalnya dari data penjualan dan pemasaran dapat dijawab pertanyaan “Taktik pemasaran seperti apa yang lebih efektif? Mengapa?”, dari data personalia dapat dijawab pertanyaan “Siapa karyawan yang paling produktif? Dan mana yang paling tidak produktif?”, dan lain sebagainya.

Perbedaan lainnya antara BI dan Data Science, termasuk pada sumber data. Konsep BI hanya mengelola data terstruktur saja, untuk keluarannya pun BI menuntut adanya laporan (biasanya berupa dashboard) yang memvisualisasikan data untuk dibaca orang yang bahkan tidak memahami konsep pengelolaan data.

Merekrut talenta data untuk bisnis

Ada beberapa kualifikasi penting yang harus dipenuhi oleh seorang Data Scientist atau Business Analyst yang akan direkrut untuk memenuhi kebutuhan bisnis, kemampuan utama yang dibutuhkan –dalam hal ini hardskill atau kemampuan teknis—meliputi:

  1. Analisis Kuantitatif; termasuk di dalamnya pengetahuan tentang permodelan matematika, statistika, simulasi, dan peramalan. Kemampuan matematika menjadi dasar kemampuan analisis dan manipulasi data.
  2. Kemampuan Pemrograman; pada dasarnya untuk mengelola data semua dilakukan dengan sintaks pemrograman tertentu –misalnya R, SQL, Python dll—maka kemampuan pemrograman menjadi salah satu komponen kunci yang harus dipahami.
  3. Pengetahuan Bisnis; ini sangat kustom, pemahamannya bergantung bidang bisnis apa yang ditangani, karena untuk menjadikan hasil analisisnya lebih mudah dipahami dan relevan.

Dalam praktiknya, beberapa perusahaan menempatkan tim Business Analyst dalam sebuah divisi khusus untuk mengakomodasi seluruh kebutuhan berkaitan dengan data. Beberapa di antaranya menempatkan pada setiap divisi bisnis, karena disadari kebutuhan data untuk masing-masing area berbeda, dan kadang butuh keahlian khusus untuk mengoperasikan, atau bahkan membaca data yang ada.


Di seri keempat nanti, akan dibahas bagaimana teknik ekstraksi data sehingga menghasilkan sebuah inisght yang bermanfaat. Simak terus DailySocial untuk seri artikel selanjutnya tentang Memahami Dasar-dasar “Data Science” untuk Bisnis.

Baca juga:

algoritma dan Misi Mencetak Tenaga “Data Scientist” Berkualitas di Indonesia

Makin maraknya kehadiran startup hingga layanan e-commerce yang berbasis teknologi saat ini, memunculkan posisi baru yang memiliki peranan penting dalam bisnis. Mulai dari data analyst, data engineer, dan data scientist, semua posisi tersebut makin di cari namun terbilang masih sedikit jumlahnya.

Melihat potensi tersebut, algoritma, startup yang fokus kepada program dan kegiatan pendidikan untuk data scientist, hadir di Indonesia. Meskipun masih baru berjalan selama 4 bulan, algoritma memiliki visi untuk mencetak tenaga muda profesional yang ahli dalam pengolahan data.

“Saat ini untuk melihat dan mengolah data tidak cukup lagi menggunakan cara-cara lama, data semakin tidak teratur dan bersifat real-time, sehingga sudah harus dilakukan pendekatan yang lebih modern bukan lagi menggunakan cara konvensional,” kata Co-Founder dan Course Producer algoritma Samuel Chan kepada DailySocial.

Nama Samuel Chan sebelumnya dikenal sebagai Founder dan CEO HyperGrowth, yang merupakan perusahaan teknologi yang mengembangkan solusi otomasi pemasaran untuk pengiklan mobile dan perusahaan aplikasi mobile. Hypergrowth juga sempat mengembangkan Growthbot. Setelah menjalankan bisnis selama 3 tahun, Samuel memutuskan melakukan pivoting dari Hypergrowth menjadi algoritma.

Bersama tim dan formula yang diklaim terbaik, Samuel Chan dan Co-founder-nya, Nayoko Wicaksono, mendirikan algoritma sebagai platform untuk belajar dan mengenal lebih jauh data science.

“Kita telah melakukan komunikasi yang intensif dengan investor ketika memutuskan untuk melakukan pivoting. Hal tersebut dilakukan untuk memastikan bahwa model bisnis yang baru lebih menjanjikan dan dengan tim yang ada saat ini memiliki potensi yang cerah untuk dikembangkan,” kata Samuel.

Aktif menggelar workshop dan kelas data science

Masih kurangnya wadah atau platform yang menghadirkan kesempatan untuk belajar soal data science dan pengetahuan terkait lainnya, tenaga data scientist asal Indonesia masih sangat minim sehingga harus mengimpor tenaga data scientist dari negara lain.

“Saya melihat lingkungan kita saat ini belum memiliki tenaga yang cukup siap menghadapi perubahan teknologi saat ini. Dengan alasan itulah tim dari algoritma ingin merubah keadaan sesuai dengan visi dan misi kita,” kata Samuel.

Saat ini algoritma telah memiliki sekitar 450 peserta yang telah mengikuti kegiatan workshop. Tidak hanya di Jakarta, tetapi juga di luar kota, seperti Surabaya. Sudah 13 workshop yang digelar oleh algoritma, dan dalam waktu dekat akan meluncurkan workshop terbaru tentang Python-based workshops. Secara keseluruhan algoritma menyediakan pelatihan untuk R and PYTHON juga pilihan untuk kursus dan bootcamps  data science.

algoritma juga sudah memiliki sekitar 22 klien korporasi sejak pertama diluncurkan. Meskipun masih sangat belia, algoritma disebutkan sudah memiliki tim solid berjumlah 12 orang.

“Dalam waktu 5 tahun ke depan ketika otomasi mulai menggantikan pekerjaan rutin manusia, algoritma ingin menjadi bagian dalam hal menyiapkan tenaga kerja yang handal dan terlatih,” tutup Samuel.

Implementasi Lanjutan Big Data, Go-Jek Segera Rilis Prediksi Pemesanan Makanan untuk Mitra Pengemudi

Sebagai bentuk implementasi dari pemanfaatan big data, Go-Jek segera merilis fitur prediksi permintaan pesanan makanan untuk layanan Go-Food. Nantinya mitra pengemudi akan diberitahu oleh sistem Go-Jek lokasi restoran mana saja dalam kurun waktu 30 menit mendatang, akan ramai dipesan pengguna. Rencananya tambahan fitur ini akan siap diterapkan pada satu bulan mendatang.

“Sebulan lagi bakal live. Driver akan dapat notifikasi dalam 30 menit mendatang, lokasi restoran mana yang akan banyak di-order pengguna,” terang Co-Founder & Head of Business Intelligence Go-Jek Kevin Aluwi kepada DailySocial.

[Baca juga: Kevin Aluwi Ceritakan Peran “Business Intelligence” dalam Bisnis GO-JEK]

Pengembangan fitur ini, menurut Kevin, akan sangat berdampak pada upaya perusahaan untuk terus meningkatkan pelayanan kepada pengguna. Apalagi, di tengah ketatnya persaingan dengan aplikasi ride hailing lainnya di tanah air, mau tak mau harus membuat Go-Jek terus berinovasi dengan cepat.

Kehadiran tim Business Intelligence yang kini dipimpinnya membuat proses pengambilan keputusan tim Go-Jek jadi lebih cepat, tepat sasaran, dan lebih efisien.

Tak hanya digunakan untuk meningkatkan pelayanan ke pengguna, tim Business Intelligence juga menerapkan big data untuk konsumen maupun karyawan Go-Jek itu sendiri. Misalnya, untuk mengetahui performa karyawan Go-Jek telah tersedia survei yang digunakan dalam menilai kualitas diri.

“Ini baru kita kerjain, ini [data science HRD] menarik. Gimana kita ngerti performance karyawan dan tim, serta membangun tim berdasarkan hasil survei yang diklaim pribadi. Ke depannya, kami akan terapkan penilaian lebih detil, bagaimana menilai performa dari data yang diklaim karyawan dibandingkan dengan masukan dari orang lain.”

Adapun pemanfaatan data science untuk konsumen, sambung Kevin, banyak diarahkan untuk kebutuhan tim pemasaran Go-Jek dalam mengakuisisi konsumen baru dengan memberikan voucher gratis. Mengingat, aplikasi sangat erat kaitannya dengan churn rate yang tinggi.

“Kita bisa pakai [data] untuk drive konsumen yang kita lihat rawan untuk churn, kita kasih mereka voucher gratis. Itu ada analisanya [dari data yang kita kumpulkan].”

Bangun budaya perusahaan berbasis data

Kevin menuturkan migrasi Go-Jek yang kini menjadi data-driven company merupakan suatu kebutuhan yang perlu dilakukan sebagai perusahaan teknologi. Big data menjadi suatu budaya yang perlu dibangun sejak Go-Jek berdiri. Hal ini dimaksudkan agar ke depannya seluruh karyawan Go-Jek dapat berkomunikasi berdasarkan data, bukan asumsi.

“Mandat pertama dari [tim Business Intelligence] adalah memberikan visibilitas ke seluruh tim apa yang sedang terjadi. Membantu menjawab persoalan yang dihadapi tim Go-Food, operasional, CS, kondisi kita sekarang gimana sih. Mau memastikan karyawan mengerti kondisi organisasi, fungsi mereka, dan ujung-ujungnya lebih dipakai untuk push decision agar bisnis lebih baik.”

Data konsumen yang dikumpulkan tim Business Intelligence pun bermacam-macam, seperti data aktivitas para mitra pengemudi dan pengguna. Contohnya, lokasi penjemputan, drop off-nya, jarak yang ditempuh, dan sebagainya. Seluruh data tersebut kemudian diolah dan dianalisa menjadi bahasa sederhana yang dapat segera ditindaklanjuti.

“Karena ujung-ujungnya driver itu kunci dari bisnis kita. Bisnis kita cuma bisa berpengaruh dengan level service yang tinggi apabila jumlah drivernya banyak. Kuncinya kita harus investasi di akusisi driver, setelah itu demand-nya akan datang. Ini fungsi utama dari hadirnya tim BI,” pungkas Kevin.

Application Information Will Show Up Here

Algoritma Adakan Workshop Bahas Pilihan Karier sebagai Data Scientist

Banyak yang bertanya-tanya, apa saja yang bisa dilakukan seorang data scientist sehingga disebut sebagai pekerjaan paling seksi di abad ke-21. Pekerjaan ini disebut seksi karena tingkat permintaan (demand) terhadap data scientist jauh melebihi tingkat penawaran (supply). Jadi orang-orang yang memenuhi kualifikasi sebagai seorang data scientist, yakni yang mampu mengolah data menjadi informasi hingga dapat melakukan prediksi dari data yang ada, akan dibayar dengan gaji yang tidak sedikit. Dengan kata lain pula dapat dikatakan bahwa data scientist dibutuhkan di mana-mana karena segudang pilihan karier yang menanti.

Pilihan pertama seorang data scientist adalah mengabdi pada perusahaan tertentu sebagai pekerja tetap. Biasanya pilihan karier ini banyak dipilih karena merupakan jenis pekerjaan yang aman. Pilihan kedua adalah sebagai konsultan independen untuk proyek data science. Untuk jenis pekerjaan ini, seorang data scientist harus berusaha membangun reputasi dan kredibilitas sehingga dipercayai publik. Pilihan ketiga adalah menciptakan tools data science sendiri. Tools atau aplikasi ini dapat berupa mesin prediksi saham, mesin analitik traffic sebuah situs, mesin visualisasi data dan lain-lain.

Namun demikian, sebenarnya pilihan karier data scientist bukan hanya itu saja. Ada banyak lagi jenis pilihan profesi yang bisa dirintis oleh seorang data scientist. Untuk membahas hal ini, Algoritma mengadakan sebuah workshop yang berjudul “Data Scientist Career Path” pada tanggal 5 Oktober 2017, pukul 18:00-20:00 WIB, bertempat di Freeware Suites, Equity Tower lantai 18, Jakarta. Workshop ini akan dipandu oleh Samuel Chan, Course Producer dan Co-Founder Algoritma.

Fix_Banner Event-Rectangle_Kickstart Sept 20

Tak ketinggalan pula, semua peserta workshop akan belajar ngoding dengan bahasa R. Samuel Chan akan mengajarkan data visualisasi dan machine learning bagi para peserta workshop.

Jika tertarik untuk datang ke workshop ini, info lengkap dan pendaftarannya dapat mengunjugi tautan berikut: https://goo.gl/FnfVCo.

––

Disclosure: DailySocial merupakan media partner untuk acara data science dari Algoritma.

Memahami Dasar-dasar “Data Science” untuk Bisnis (Bagian 2)

Sebelumnya, dalam seri pertama telah dibahas tentang komponen dasar dari sebuah rangkaian dan komponen yang mengisi Data Science. Pada bagian ini akan dibahas dasar salah satu implementasi Data Science yang paling dibutuhkan saat ini, yakni Big Data.

Istilah Big Data dewasa ini bukan hal baru lagi, khususnya dalam penerapan Data Science di korporasi. Sesuai namanya, Big Data mengindikasikan pada sebuah pemrosesan data besar yang tidak bisa ditampung melalui mekanisme basis data konvensional (misalnya RDBMS). Dalam Big Data ada istilah mendasar yang sering disingkat dengan 3Vs yang menjadi karakteristik utama, yakni Volume, Velocity dan Variety.

Volume merujuk pada limitasi besaran data yang akan diolah. Kemampuan Big Data dapat mengolah data dengan ukuran terabyte (1012 bytes) atau petabyte (1015 bytes). Mengapa data bisa berukuran sebesar itu, faktor Velocity (atau kecepatan interaksi data) yang akan mengukur. Velocity adalah volume data pada skala waktu tertentu, yang didapatkan dari berbagai sumber, misal dari data transaksi, data perekaman sensor, atau data yang dihasilkan dari sebuah log mesin.

Dari yang sudah sering ditangani selama ini, Velocity dapat mencapai kisaran 30 kilobyte sampai 30 gigabyte per detik. Bahkan banyak Data Engineer membutuhkan latensi yang lebih dapat, misalnya 100 milliseconds dalam perekaman data. Tren ini diyakini akan terus berkembang, menghasilkan data yang lebih besar, seiring dengan model pemrosesan real-time yang banyak diterapkan di berbagai lini bisnis dalam sebuah perusahaan. Perangkat lunak seperti Apache Sqoop, Apache Kafka atau Apache Flume menjadi beberapa yang terpopuler untuk mengolah pergerakan data besar tersebut.

Kemudian yang ketiga ialah Variety, ini berkaitan dengan jenis data –seperti yang telah dibahas dalam materi sebelumnya, umumnya akan ditemui tiga jenis data, yakni terstruktur, semi-terstruktur dan tidak terstruktur. Saking besarnya kumpulan data dari berbagai sumber dan varian, dalam ilmu Big Data ada istilah “Data Lake”. Istilah tersebut banyak digunakan oleh praktisi Big Data untuk merujuk pada sebuah sistem penyimpanan data non-hierarkis yang menampung data multi-struktur dengan sebuah arsitektur penyimpanan tertentu. Hadoop Distributed File System (HDFS) adalah salah satu contoh arsitektur penyimpanan yang sering digunakan untuk mendukung kebutuhan tersebut.

Sedikit tentang Hadoop di dalam konsep Big Data

Hadoop adalah sebuah kerangka kerja open source untuk mendukung aplikasi berbasis Big Data. Ketika orang mengatakan menggunakan Hadoop maka itu mengacu pada sebuah ekosistem perangkat lunak meliputi HDFS untuk penyimpanan data, Map Reduce untuk pemrosesan data dalam jumlah besar, Spark untuk pemrosesan data secara real-time, dan YARN (Yet Another Resource Negotiator) untuk dukungan manajemen sumber daya.

Dalam sebuah implementasi yang paling sederhana, dari sebuah sumber data MapReduce akan diterapkan untuk melakukan dua hal, yakni memetakan data dan mereduksi data. Dalam tugasnya memetakan data, MapReduce mendelegasikan data ke pada sebuah “key-value, termasuk melakukan transformasi data atau memilah data sesuai yang dibutuhkan. Sedangkan dalam tugasnya mereduksi, MapReduce akan mengagregasi data pada sebuah dataset sehingga memenuhi standar yang ada.

Jika studi kasusnya kepada sebuah data pasif, skenario di atas akan sudah cukup, tinggal memasukkan ke HDFS untuk selanjutnya diproses. Akan tetapi tantangan masa kini dalam penerapan Big Data adalah data real-time. Sehingga MapReduce perlu sebuah pendamping, dalam hal ini Spark sebagai sebuah in-memory computing application. Di dalamnya pengguna dapat melakukan banyak hal, termasuk melakukan query, analisis dan eksplorasi data, termasuk menjalankan algoritma tertentu misalnya Machine Learning.

Penggunaan rangkaian alat Hadoop juga memerlukan sebuah kompetensi pemrograman. Pada dasarnya Hadoop dikembangkan dari Java, akan tetapi dari perkembangannya kini bahasa lain seperti Scala, Python dan SQL telah dielaborasikan ke dalam proses pengelolaannya. MapReduce secara native menggunakan Java, sedangkan Spark menggunakan Scala. Namun sekarang juga sudah ada dukungan PySpark sehingga dapat mengelola Spark dengan pemrograman berbasis Python. Sedangkan untuk pengelolaan di HDFS tetap menggunakan SQL.

Sebelum melangkah lebih jauh

Melakukan implementasi Big Data dalam sebuah unit bisnis memang membutuhkan waktu, bahkan beberapa perusahaan menempatkan implementasi Big Data pada long-term vision, karena prosesnya harus berelaborasi dengan kegiatan lain dalam unit bisnis. Namun sebelum melangkah lebih jauh dan mempelajari teknisnya secara lebih mendalam, perlu diketahui terlebih dulu tentang visi Data Science dari sebuah bisnis. Mungkin akan cukup beragam namun setidaknya mencakup tiga hal, yakni (1) mengidentifikasi tantangan bisnis, (2) memecahkan masalah bisnis dengan pendekatan data, dan (3) meningkatkan keuntungan di seluruh lini bisnis.

Big Data adalah bentuk penerapan Data Science dalam skala besar. Untuk mengawali awareness tentang data sebenarnya bisa dilakukan dengan cara yang paling sederhana. Sebagai contoh akan mengangkat studi kasus bisnis media. Hal paling awal yang dapat dilakukan ialah mengidentifikasi sumber data yang ada, apakah itu dari basis data yang dihasilkan melalui Content Management System (CMS), data trafik pengunjung yang didapat melalui Anaytic Tools, atau bahkan data dari luar –misalnya identifikasi tren topik dari media sosial atau mesin pencari.

Berikutnya, tentukan masalah apa yang ingin dipecahkan. Sebagai contoh, media tersebut memiliki topik bulanan untuk sebuah opini. Maka tugas Data Science di sini bisa saja berbentuk menghubungkan tren data di media sosial tentang popularitas suatu tema dihubungkan dengan popularitas tulisan-tulisan sebelumnya berkaitan dengan tema tersebut. Jika datanya sudah lebih terstruktur, misalnya dalam format CSV, maka alat seperti R Studio akan memudahkan dalam visualisasi.

Bahasa R sendiri salah satu bagian mendasar ketika seseorang ingin mempelajari tentang Data Science. Banyak cara yang dapat dilakukan untuk mempelajarinya, mulai dari menggunakan sumber online di internet, buku atau mengikuti kursus khusus yang dilaksanakan bersama trainer tersertifikasi. Di Indonesia, salah satu pelatihan tentang Data Science dilakukan oleh Algoritma. Beberapa waktu lalu Algoritma mengadakan pelatihan Data Science Fundamental dan Data Science for Financial Business. Selain disajikan bahasan secara konsep, para peserta diajak langsung mencoba melakukan programming dengan bahasa R untuk pengelolaan dan visualisasi data.

Kecakapan dalam memvisualisasikan data sangat penting, karena data yang berbentuk visual akan lebih mudah dibaca. Dari sini –menyambung studi kasus di atas—maka dapat dilanjutkan dengan sebuah diskusi oleh pimpinan redaksi atau tim editorial tentang pertimbangan untuk memilih tema tersebut. Kira-kira seperti itu konsep sederhana yang dapat diterapkan dari ilmu Data Science, yang paling sederhana.

Pada seri berikutnya akan dibahas tentang bagaimana sebuah bisnis/perusahaan mengubah pola dan proses di dalamnya sehingga menjadi lebih data-driven. Akan disampaikan juga contoh penerapan yang telah berhasil dilakukan oleh startup sukses dari Indonesia.

––

Disclosure: DailySocial merupakan media partner dari Algoritma.

Disclaimer: Tulisan ini mengambil sampel dari berbagai sumber, termasuk dari sumber buku cetak dan tulisan online di internet.

Baca juga:

Kevin Aluwi Ceritakan Peran “Business Intelligence” dalam Bisnis GO-JEK

Untuk turus menuai sukses, bisnis harus terus berinovasi. Hal tersebut juga dilakukan oleh startup on-demand lokal tersukses GO-JEK. Salah satu yang kini tengah dikembangkan dan dioptimalkan ialah divisi Business Intelligence untuk mengoptimalkan sistem pengelolaan data di lingkup internal GO-JEK. Seperti diketahui bersama, bahwa data menjadi sangat penting untuk sebuah keputusan bisnis dalam bisnis digital saat ini. Hasil pengelolaan data mampu memberikan proyeksi tepat berdasarkan data historis yang dimiliki.

Dalam diskusi mingguan yang diadakah oleh DailySocial #SelasaStartup, dihadirkan Kevin Aluwi selaku Co-Founder & Head of Business Intelligence GO-JEK sebagai narasumber. Spesial untuk membahas bagaimana GO-JEK memanfaatkan data untuk mengoptimalkan sistem bisnis. Salah satu yang diimplementasikan ialah menerapkan konsep big data, hal ini dilakukan lantaran GO-JEK selalu mendapatkan data dengan velocity yang sangat besar, dan harus mampu dibaca secara cepat dan cermat.

Mengawali implementasi data untuk pelaporan

Sama layaknya improvisasi teknologi pada umumnya, implementasi data di GO-JEK dilakukan secara berangsur. Kala itu data pertumbuhan dan transaksi sangat dibutuhkan untuk bukti pelaporan terhadap investor –terutama di awal fundraising GO-JEK. Selain datanya banyak dan besar, variasinya juga cukup beragam, mulai dari data pengemudi, rekam jejak, jenis makanan yang dibeli dan lain sebagainya.

Kala itu GO-JEK memfokuskan divisi data khusus untuk membuat laporan tersebut. Karena investor membutuhkan laporan mingguan dan bulanan mengenai kinerja dari layanan GO-JEK. Hingga akhirnya Kevin merasa bahwa seharusnya optimasi data ini dapat dimanfaatkan secara lebih mendalam untuk meningkatkan performa bisnis.

Pada akhirnya Business Intelligence mulai menjadi divisi khusus yang fokus pada pengolahan data secara lebih terstruktur. Kini sudah ada tim yang didedikasikan khusus sebagai data science dan data engineer untuk tidak hanya sekedar melaporkan data yang masuk, tapi lebih dari itu. Termasuk untuk memproyeksikan berbagai hal dengan data yang dimiliki.

Keputusan tepat di tengah persaingan yang kuat

Kevin menceritakan, pada pertengahan tahun 2015 ia melihat kebutuhan untuk adanya analisis data produktif dari keseluruhan operasi layanan. Hal tersebut dibutuhkan untuk melihat tren penggunaan layanan, hingga melihat kecenderungan konsumen secara lebih personal terhadap layanan yang digemari.

Namun pada saat itu misi tim engineer masih difokuskan untuk memastikan bahwa aplikasi GO-JEK tidak mengalami crash, demi menjamin operasi bisnisnya lancar. Hal ini dirasa krusial, karena harus berhadapan dengan pesaing yang kuat. Sehingga keandalan benar-benar menjadi fokus setiap anggota tim.

Saat layanan GO-JEK sudah sangat stabil, kini tim engineer mulai menjalankan peran khusus di masing-masing area. Salah satunya tim yang dipimpin Kevin, yakni untuk menjalankan sebuah kegiatan intelijen bisnis untuk memaksimalkan potensi perolehan konsumen dari layanan yang dimiliki GO-JEK. Proses tersebut dimulai dengan mengolah data, memvisualisasikan data, hingga membaca data tersebut menjadi sebuah insight berharga.

Salah satu manfaat dari penerapan business intelligence kini GO-JEK dapat membuat sebaran mitra pengemudi menjadi lebih merata. Hal ini untuk memastikan konsumen dapat dengan cepat mendapatkan pengemudi. Kasus lama, biasanya pengemudi menggerombol di area tertentu saja, akibatnya di area lain sering tidak ada pengemudi terdekat.

Dengan data ini, GO-JEK dapat menyesuaikan policy misalnya di jam-jam rame pada area tertentu, untuk menggiring pengemudi di sana, bisa memberikan bonus khusus untuk mitra yang mengambil pesanan dari area tersebut. Dan masih banyak skenario lain yang bisa dioptimalkan dengan hasil pengelolaan data bisnis.

Siap menerapkan data science di departemen SDM

Selain untuk operasional, data sicence juga mulai diterapkan ke area yang lebih luas, salah satunya pada divisi sumber daya manusia (SDM). Data-data didapat dari statistik performa tim dan hasil evaluasi yang dilakukan. Semua kinerja tim dapat disimpulkan hasilnya dengan sebuah sistem cerdas atas apa yang telah ia kerjakan di dalam lini bisnis, sehingga lebih terukur dan lebih memahami aspek-aspek yang perlu diperkuat.

 

Algoritma Akan Adakan Talkshow Bahas Data Science di Industri Finansial

Seiring dengan perkembangan teknologi, data di berbagai industri juga semakin bertambah, terlebih di lini industri kritis seperti finansial. Ada banyak sekali jenis data yang berkembang dalam industri finansial, misalnya transaksi pelanggan, pertimbangan risiko keuangan, perhitungan biaya institusi, dan lain-lain. Bayangkan kalau jenis data yang berbeda-data ini dikalikan dengan jumlah pelanggan di sebuah perusahaan yang menggunakan fasilitas teknologi finansial, betapa banyaknya data yang ada untuk sekelompok orang saja.

Sebagai contoh, seseorang membeli baju dari salah satu platform e-commerce. Untuk melakukan pembayaran, ia memilih pembayaran melalui kartu kredit dari sebuah bank. Data transaksi ini tentu saja harus direkam oleh platform e-commerce yang bersangkutan untuk kepentingan pelaporan transaksi, hingga pengambilan keputusan dalam rangka optimalisasi sistem pembayaran.

Semua data para pelanggan yang mempunyai pengalaman transaksi di satu perusahaan tertentu pasti bermanfaat bagi industri tersebut. Namun data tersebut akan bernilai guna jika data bisa dikumpulkan dengan baik dan diolah secara tepat sesuai dengan tujuan penggunaan data.

Untuk mempelajari kiat mengoptimalkan potensi dari data tersebut, Algoritma bersama dengan Midtrans dan Julo akan mengadakan talkshow bertemakan “Data Science in the Financial Industry”.

Pembicara dalam talkshow ini terdiri dari Monalisa Gosumolo (Head of Data Science di Midtrans) dan Martijn Wieriks (Head of Analytics di Julo). Keduanya akan membahas perkembangan data science dalam industri finansial, aplikasi data dan analisis dalam industri finansial, hingga kesempatan yang mungkin bisa kamu pelajari untuk meniti karier di bidang data science.

Acara ini akan digelar pada 20 September 2017, di Spacemob, Gama Tower lantai 33, Jakarta Selatan. Acara ini terbatas hanya untuk 50 peserta dan berasal dari kalangan mana pun, mulai dari mahasiswa, karyawan, dan startup. Untuk pendaftaran dan informasi lebih lanjut dapat diakses melalui tautan berikut: https://goo.gl/AgdQGB.


Disclosure: DailySocial merupakan media partner acara Data Science oleh Algoritma.

Memahami Dasar-dasar “Data Science” untuk Bisnis (Bagian 1)

Data is a new currency. Kalimat tersebut akhir-akhir ini santer diperbincangkan dikaitkan dengan gerakan transformasi digital, mengisyaratkan betapa bernilainya data bagi sebuah langkah strategis bisnis. Namun jika dirunut, urgensi pemanfaatan data sebenarnya tak lain muncul dari komoditas data itu sendiri sebagai objek digital. Saat ini data bisa diperoleh dari mana saja, dari perangkat komputasi yang sehari-hari digunakan, dari penggunaan komputer, ponsel, kamera, hingga perangkat berbasis sensor yang terpasang di dinding.

Tren tersebut menghadirkan dua jabatan baru dalam lini teknologi, yakni Data Engineer dan Data Scientist. Data Engineer memiliki tugas utama untuk menemukan cara dalam menangkap, mengumpulkan dan memadatkan sebuah data dari sumbernya. Domain pekerjaannya termasuk membangun dan mengelola sebuah sistem yang menjadi produsen data, hingga data-data tersebut berada di dalam sebuah tempat untuk dikelola lebih lanjut.

Sedangkan Data Scientist memiliki misi mengolah data tersebut menghasilkan pengetahuan yang bernilai dan dapat diaplikasikan. Sehingga dapat disimpulkan, bahwa Data Science merupakan sebuah proses memproduksi pengetahuan data (data insight). Adapun karakteristik dari pengetahuan data tersebut ialah sebuah simpulan yang dapat dilaksanakan (actionable), memberikan simpulan atau prediksi yang dapat dimengerti untuk beragam kebutuhan spesifik.

Dasar ilmu Data Science

Untuk menjadi seorang Data Scientist diperlukan pemahaman tentang beberapa hal, yakni kemampuan analisis menggunakan konsep matematika dan statistik, kemampuan pemrograman untuk pengolahan data, dan pemahaman pada subjek spesifik pada bidang bisnis yang digeluti. Karena menangani kebutuhan di bidang tertentu, Data Scientist sering direpresentasikan pada sebuah istilah yang lebih rinci, misalnya ad-tech data scientist, political analyst, head of banking digital analyst dan sebagainya.

Terkait dengan dasar ilmu, matematika menjadi penting sebagai landasan metode deterministik untuk operasi perhitungan kuantitatif (numerik). Aplikasinya dalam Data Science untuk membangun model keputusan, menyusun prakiraan hingga memperhitungkan sebuah prediksi. Memahami dasar kalkulus dan aljabar linier menjadi porsi wajib saat seseorang ingin memulai terjun ke dalam analisis data. Karena keduanya teori paling fundamental yang akan banyak digunakan.

Pemahaman tentang metode statistik digunakan sebagian besar untuk memahami tentang makna data, termasuk untuk melakukan validasi hipotesis dari pengetahuan yang dihasilkan data, menyimulasikan skenario, hingga membantu penyusunan sebuah prakiraan. Wajib hukumnya untuk memahami ilmu statistik dasar. Dalam penerapannya, konsep matematika dan statistika berjalan beriringan, mengharuskan pengelolanya jeli menyisipkan formula sesuai dengan pemrosesan data yang dibutuhkan.

Kemampuan pemrograman atau coding –setidaknya tingkat dasar—juga harus dimiliki. Kode yang dituliskan nantinya akan digunakan untuk menginstruksikan komputer dalam memanipulasi, menganalisis dan memvisualisasikan data yang telah dirapikan.

Kegiatan mengelola data

Sumber data sangat beragam, implikasinya data yang dihimpun juga bervariasi. Dalam standar data digital, setidaknya tipikal data tersebut terbagi ke dalam tiga jenis:

  1. Data terstruktur (structured data); yakni data yang sudah dikelola, diproses dan dimanipulasi dalam RDBMS (Relational Database Management System). Misalnya data tabel hasil masukan formulir pendaftaran di sebuah layanan web.
  2. Data tidak terstruktur (unscructured data); yakni berupa data mentah yang baru didapat dari beragam jenis aktivitas dan belum disesuaikan ke dalam format basis data. Misalnya berkas video yang didapat dari kamera.
  3. Data semi terstruktur (semistructured data); yakni berupa data yang memiliki struktur, misalnya berupa tag, akan tetapi belum sepenuhnya terstruktur dalam sistem basis data. Misalnya data yang memiliki keseragaman tag, namun memiliki isian yang berbeda didasarkan pada karakteristik pengisi.

Data Engineer bertugas untuk menyelaraskan ketiga tipe data tersebut, termasuk di dalamnya mengatur skema data. Mengapa merapikan data tersebut menjadi tugas penting? Ketika berbicara data dengan ukuran yang sangat besar, efisiensi perlu dilakukan dalam arsitektur data, tujuannya untuk memberikan kemudahan sekaligus kecepatan dalam pengelolaan serta akses data. Bagi Data Scientist, salah satu validitas data juga ditentukan dari seberapa relevan sumber data yang dimiliki, baik sebagai pelengkap ataupun pembanding.

Sementara itu, kegiatan analisis data dilakukan dengan bahasa Python atau R untuk memanipulasi data dan menggunakan SQL untuk melakukan query (termasuk membuat relasi) pada sumber data. Coding dilakukan kala sumber data telah menjadi ekstensi berkas yang siap diolah. Secara universal terdapat empat format umum yang dapat diterima hampir semua sistem analisis data, yaitu Comma-separated Values (CSV), Scripts (*.py, *.ipynb, *.r dll), berkas aplikasi tabel (*.xlsx, *.qgs dll), dan berkas pemrograman web (*.html, *.svg dll).

Keluaran Data Science untuk siapa saja

Salah satu keterampilan yang wajib dimiliki seorang Data Scientist adalah komunikasi, baik secara lisan atau tertulis. Seluruh pengetahuan dari data harus disampaikan dengan baik, tanpa kemampuan komunikasi yang benar, maka kebutuhan tersebut tidak akan tersalurkan. Kemampuan komunikasi termasuk di dalamnya menjelaskan berbagai unsur yang kompleks sehingga mudah untuk dipahami oleh pengguna data, termasuk ketika membuat visualisasi grafik dan narasi.

Perkembangan operasi bisnis digital yang sangat masif saat ini pada akhirnya membuat Data Science tidak hanya dilaksanakan oleh perusahaan besar saja, akan tetapi startup digital pun memandangnya sebagai sebuah bagian penting untuk mendampingi keputusan strategi bisnis. Sebagai ilustrasi, beberapa contoh penerapan Data Science dalam bisnis di antaranya untuk membantu sistem bisnis secara keseluruhan, tujuannya untuk meningkatkan ROI (Return of Investment) dengan memberikan gambaran tentang aktivitas terukur.

Contoh lagi untuk membantu pemasaran bisnis. Dari data yang histori yang telah terhimpun, sebuah pengetahuan dapat dibuat untuk menghasilkan analisis prediktif mengidentifikasi strategi apa saja yang efektif dijalankan, sehingga pemasar dapat mengeliminasi berbagai jenis tindakan yang tidak memberikan banyak dampak bagi performa penjualan. Di lain sisi, berbagai strategi baru sangat mungkin ditemukan dengan melihat tren data yang ada. Dan masih banyak contoh model implementasi lainnya termasuk untuk production-costs optimization, pricing model optimization, recommendation engine, fraud detection, dll.

Baca juga:

Algoritma, Kejora HQ, dan AWS Akan Adakan Workshop “Data Science” bagi Pemula

Era digital melahirkan banyak hal baru, tidak hanya yang berdampak pada teknologi penopang proses bisnis di atasnya, akan tetapi keluaran dari proses bisnis itu sendiri yang dapat diolah lebih lanjut, yakni data. Dewasa ini juga muncul istilah “data is the new currency“, mengisyaratkan betapa bernilainya data untuk berbagai kebutuhan strategis, untuk beragam jenis kebutuhan.

Namun data hanya sebagai data tanpa melalui proses pengolahan. Data Science adalah orang yang bertugas mengumpulkan, memproses, mengompilasi, dan memvisualisasikan data yang dari berbagai sumber untuk menghasilkan sebuah pengetahuan yang berguna. Misalnya dalam bisnis e-commerce, data aktivitas pembeli dalam website dapat dijadikan rujukan untuk mendesain antar muka yang sesuai. Menu mana yang paling sering digunakan, atau produk apa yang pada akhirnya mudah ditemukan.

Contoh lain untuk dunia pendidikan misalnya, data yang terkumpul dapat dilakukan untuk pengambilan keputusan. Misalnya untuk menambah jam mata pelajaran apa untuk persiapan menyambut ujian akhir, atau membeli buku genre apa di perpustakaan sesuai yang paling banyak diminati pembaca, dan lain sebagainya. Data yang sudah diolah dapat menyimpulkan banyak hal, dari aktivitas-aktivitas yang pernah dilakukan dalam bisnis.

Untuk memberikan pemahaman lebih lanjut terkait Data Science dan proses di dalamnya, lembaga pelatihan khusus pengolahan data Algoritma, bekerja sama dengan Kejora HQ dan Amazon Web Services mengadakan workshop bertajuk “Kickstart Series: Building Machine Learning Applications“. Tiga hal yang menjadi bahasan utama dalam acara ini, yakni pemrograman dasar bahasa R, pengenalan visualisasi data, dan teknik machine learning.

Workshop ini akan dipandu oleh Samuel Chan dan Seon Young. Samuel Chan adalah co-founder dan course producer di Algoritma. Sementara itu, Seon Young adalah Developer/Startup Specialist Solutions Architect di Amazon Web Services. Di workshop ini, Seon Young juga akan mengenalkan Machine Learning Service di Amazon, visualization tools untuk menciptakan model machine learning tanpa harus belajar algoritma machine learning yang sulit. Salah satu hasil akhirnya, Seon akan mengajarkan bagaimana prediksi dapat ditemukan dari berbagai aplikasi menggunakan API sederhana.

Workshop ini akan diselenggarakan pada tanggal 5 September 2017 pada pukul 17:45 di Kejora HQ. Para peserta disarankan untuk membawa laptop serta memasang R dan RStudio untuk kebutuhan praktik. Workshop ini didesain untuk dihadiri oleh 100 orang, baik untuk kalangan mahasiswa, karyawan, sampai startup. Seusai dengan misinya Algoritma ingin menjadikan Data Science dapat dipelajari oleh siapa saja. Info lebih lanjut dan pendaftaran, kunjungi tautan berikut http://bit.ly/algoDS0905.

Kickstart Series: Building Machine Learning Applications


Disclosure: DailySocial merupakan media partner acara Kickstart Series – Building Machine Learning Applications

Memulai Pemanfaatan Data dalam Bisnis untuk Menyambut Tren Otomatisasi

Tidak ada yang menyangkal bahwa teknologi membawa perubahan besar bagi perusahaan dalam menjalankan bisnisnya, atau bagi orang memulai bisnis. Teknologi dalam hal ini tidak hanya bisa membantu bisnis berinovasi ke luar (produk, pemasaran, dan lain-lain) tetapi juga membantu bisnis memperkuat kemampuan mereka mengelola. Salah satu yang mulai naik daun di kalangan bisnis adalah pengelolaan data. Teknologi berpengaruh untuk bagaimana bisnis bisa mengambil sesuatu yang lebih dari data yang semakin beragam dan mudah didapatkan berkat teknologi yang ada.

Data sekarang lebih dinamis. Baik dari segi cara pengumpulan dan jenis datanya. Data konsumen misalnya, data ini lebih akurat sejak para konsumen mulai menenteng perangkat mobile mereka. Ini merupakan keuntungan tersendiri bagi bisnis. Mereka bisa langsung terhubung dengan para konsumen, baik itu melalui email atau sarana live chat yang ada. Masalah selanjutnya yang muncul, bagaimana perusahaan bisa mengoptimalkan data, bukan hanya mengonsumsinya tetapi juga bisa membuatnya berevolusi.

Mengumpulkan data sebanyak-banyaknya untuk menjadi bahan pertimbangan inovasi selanjutnya dari bisnis adalah sebuah kewajiban. Mengelolanya dan membuat sesuatu yang lebih canggih dari sana adalah tugas selanjutnya.

Otomatisasi proses dasar

Untuk bisa mencapai tahap selanjutnya dari pemanfaatan data bisnis yang mengelola data bisa dimulai dari melakukan optimalisasi pengumpulan data. Misalnya, kita sebagai bisnis sering memantau harga dari para pesaing untuk menentukan harga terbaik yang bisa ditawarkan. Jika dilihat lebih dekat, proses ini merupakan proses berulang. Sangat potensial untuk dibuat otomatisasi. Jadi kita bisa lebih intens memantau perubahan harga tersebut. Hal ini juga bisa diterapkan pada saat kita memantau tren yang ada. Baik itu tren produk yang sedang diminati di masyarakat atau tren penurunan pembelian.

Analisis yang terstruktur

Melimpahnya data dan perkembangan teknologi pengolahan data membawa dampak positif pada perkembangan analisis yang di dapat. Data yang melimpah dan data yang tervalidasi adalah dua komponen penting menghasilkan sebuah hasil analisis yang baik.

Tugas dari manajer selanjutnya adalah menyusun data sedemikian rupa untuk menjadi sebuah sumber data tepercaya kemudian membuat analisis yang lengkap dan terstruktur. Sebagai contoh, bisnis bisa dengan mudah memunculkan produk apa yang sedang ramai di pasaran, termasuk produk alternatif yang digemari konsumen. Dengan informasi semacam itu manajer bisa dengan mudah mendapatkan gambaran seperti apa sebenarnya produk yang diinginkan.

Otomatisasi dan data menjadi jembatan untuk teknologi AI

Setelah melihat berhasil menerapkan otomatisasi dalam mendapatkan data dan membuat sebuah skema analisis terstruktur salah satu inovasi yang bisa diterapkan untuk mengoptimalkan kembali proses data dan analisis adalah penerapan teknologi AI (Artificial Intelegence).

Dengan menggunakan teknik machine learning data bisa lebih optimal diolah. Data-data tersbeut akan menghasilkan beberapa keputusan-keputusan yang berkaitan. Misalnya soal barang yang paling sering dilihat. Dengan menggunakan teknik ini bisnis bisa menghadirkan sebuah barang yang bisa dijadikan alternatif bagi konsumen. Tentu ini akan menjadi pengalaman tersendiri bagai konsumen.