Algoritma Adakan Workshop Bahas Pilihan Karier sebagai Data Scientist

Banyak yang bertanya-tanya, apa saja yang bisa dilakukan seorang data scientist sehingga disebut sebagai pekerjaan paling seksi di abad ke-21. Pekerjaan ini disebut seksi karena tingkat permintaan (demand) terhadap data scientist jauh melebihi tingkat penawaran (supply). Jadi orang-orang yang memenuhi kualifikasi sebagai seorang data scientist, yakni yang mampu mengolah data menjadi informasi hingga dapat melakukan prediksi dari data yang ada, akan dibayar dengan gaji yang tidak sedikit. Dengan kata lain pula dapat dikatakan bahwa data scientist dibutuhkan di mana-mana karena segudang pilihan karier yang menanti.

Pilihan pertama seorang data scientist adalah mengabdi pada perusahaan tertentu sebagai pekerja tetap. Biasanya pilihan karier ini banyak dipilih karena merupakan jenis pekerjaan yang aman. Pilihan kedua adalah sebagai konsultan independen untuk proyek data science. Untuk jenis pekerjaan ini, seorang data scientist harus berusaha membangun reputasi dan kredibilitas sehingga dipercayai publik. Pilihan ketiga adalah menciptakan tools data science sendiri. Tools atau aplikasi ini dapat berupa mesin prediksi saham, mesin analitik traffic sebuah situs, mesin visualisasi data dan lain-lain.

Namun demikian, sebenarnya pilihan karier data scientist bukan hanya itu saja. Ada banyak lagi jenis pilihan profesi yang bisa dirintis oleh seorang data scientist. Untuk membahas hal ini, Algoritma mengadakan sebuah workshop yang berjudul “Data Scientist Career Path” pada tanggal 5 Oktober 2017, pukul 18:00-20:00 WIB, bertempat di Freeware Suites, Equity Tower lantai 18, Jakarta. Workshop ini akan dipandu oleh Samuel Chan, Course Producer dan Co-Founder Algoritma.

Fix_Banner Event-Rectangle_Kickstart Sept 20

Tak ketinggalan pula, semua peserta workshop akan belajar ngoding dengan bahasa R. Samuel Chan akan mengajarkan data visualisasi dan machine learning bagi para peserta workshop.

Jika tertarik untuk datang ke workshop ini, info lengkap dan pendaftarannya dapat mengunjugi tautan berikut: https://goo.gl/FnfVCo.

––

Disclosure: DailySocial merupakan media partner untuk acara data science dari Algoritma.

Memahami Dasar-dasar “Data Science” untuk Bisnis (Bagian 1)

Data is a new currency. Kalimat tersebut akhir-akhir ini santer diperbincangkan dikaitkan dengan gerakan transformasi digital, mengisyaratkan betapa bernilainya data bagi sebuah langkah strategis bisnis. Namun jika dirunut, urgensi pemanfaatan data sebenarnya tak lain muncul dari komoditas data itu sendiri sebagai objek digital. Saat ini data bisa diperoleh dari mana saja, dari perangkat komputasi yang sehari-hari digunakan, dari penggunaan komputer, ponsel, kamera, hingga perangkat berbasis sensor yang terpasang di dinding.

Tren tersebut menghadirkan dua jabatan baru dalam lini teknologi, yakni Data Engineer dan Data Scientist. Data Engineer memiliki tugas utama untuk menemukan cara dalam menangkap, mengumpulkan dan memadatkan sebuah data dari sumbernya. Domain pekerjaannya termasuk membangun dan mengelola sebuah sistem yang menjadi produsen data, hingga data-data tersebut berada di dalam sebuah tempat untuk dikelola lebih lanjut.

Sedangkan Data Scientist memiliki misi mengolah data tersebut menghasilkan pengetahuan yang bernilai dan dapat diaplikasikan. Sehingga dapat disimpulkan, bahwa Data Science merupakan sebuah proses memproduksi pengetahuan data (data insight). Adapun karakteristik dari pengetahuan data tersebut ialah sebuah simpulan yang dapat dilaksanakan (actionable), memberikan simpulan atau prediksi yang dapat dimengerti untuk beragam kebutuhan spesifik.

Dasar ilmu Data Science

Untuk menjadi seorang Data Scientist diperlukan pemahaman tentang beberapa hal, yakni kemampuan analisis menggunakan konsep matematika dan statistik, kemampuan pemrograman untuk pengolahan data, dan pemahaman pada subjek spesifik pada bidang bisnis yang digeluti. Karena menangani kebutuhan di bidang tertentu, Data Scientist sering direpresentasikan pada sebuah istilah yang lebih rinci, misalnya ad-tech data scientist, political analyst, head of banking digital analyst dan sebagainya.

Terkait dengan dasar ilmu, matematika menjadi penting sebagai landasan metode deterministik untuk operasi perhitungan kuantitatif (numerik). Aplikasinya dalam Data Science untuk membangun model keputusan, menyusun prakiraan hingga memperhitungkan sebuah prediksi. Memahami dasar kalkulus dan aljabar linier menjadi porsi wajib saat seseorang ingin memulai terjun ke dalam analisis data. Karena keduanya teori paling fundamental yang akan banyak digunakan.

Pemahaman tentang metode statistik digunakan sebagian besar untuk memahami tentang makna data, termasuk untuk melakukan validasi hipotesis dari pengetahuan yang dihasilkan data, menyimulasikan skenario, hingga membantu penyusunan sebuah prakiraan. Wajib hukumnya untuk memahami ilmu statistik dasar. Dalam penerapannya, konsep matematika dan statistika berjalan beriringan, mengharuskan pengelolanya jeli menyisipkan formula sesuai dengan pemrosesan data yang dibutuhkan.

Kemampuan pemrograman atau coding –setidaknya tingkat dasar—juga harus dimiliki. Kode yang dituliskan nantinya akan digunakan untuk menginstruksikan komputer dalam memanipulasi, menganalisis dan memvisualisasikan data yang telah dirapikan.

Kegiatan mengelola data

Sumber data sangat beragam, implikasinya data yang dihimpun juga bervariasi. Dalam standar data digital, setidaknya tipikal data tersebut terbagi ke dalam tiga jenis:

  1. Data terstruktur (structured data); yakni data yang sudah dikelola, diproses dan dimanipulasi dalam RDBMS (Relational Database Management System). Misalnya data tabel hasil masukan formulir pendaftaran di sebuah layanan web.
  2. Data tidak terstruktur (unscructured data); yakni berupa data mentah yang baru didapat dari beragam jenis aktivitas dan belum disesuaikan ke dalam format basis data. Misalnya berkas video yang didapat dari kamera.
  3. Data semi terstruktur (semistructured data); yakni berupa data yang memiliki struktur, misalnya berupa tag, akan tetapi belum sepenuhnya terstruktur dalam sistem basis data. Misalnya data yang memiliki keseragaman tag, namun memiliki isian yang berbeda didasarkan pada karakteristik pengisi.

Data Engineer bertugas untuk menyelaraskan ketiga tipe data tersebut, termasuk di dalamnya mengatur skema data. Mengapa merapikan data tersebut menjadi tugas penting? Ketika berbicara data dengan ukuran yang sangat besar, efisiensi perlu dilakukan dalam arsitektur data, tujuannya untuk memberikan kemudahan sekaligus kecepatan dalam pengelolaan serta akses data. Bagi Data Scientist, salah satu validitas data juga ditentukan dari seberapa relevan sumber data yang dimiliki, baik sebagai pelengkap ataupun pembanding.

Sementara itu, kegiatan analisis data dilakukan dengan bahasa Python atau R untuk memanipulasi data dan menggunakan SQL untuk melakukan query (termasuk membuat relasi) pada sumber data. Coding dilakukan kala sumber data telah menjadi ekstensi berkas yang siap diolah. Secara universal terdapat empat format umum yang dapat diterima hampir semua sistem analisis data, yaitu Comma-separated Values (CSV), Scripts (*.py, *.ipynb, *.r dll), berkas aplikasi tabel (*.xlsx, *.qgs dll), dan berkas pemrograman web (*.html, *.svg dll).

Keluaran Data Science untuk siapa saja

Salah satu keterampilan yang wajib dimiliki seorang Data Scientist adalah komunikasi, baik secara lisan atau tertulis. Seluruh pengetahuan dari data harus disampaikan dengan baik, tanpa kemampuan komunikasi yang benar, maka kebutuhan tersebut tidak akan tersalurkan. Kemampuan komunikasi termasuk di dalamnya menjelaskan berbagai unsur yang kompleks sehingga mudah untuk dipahami oleh pengguna data, termasuk ketika membuat visualisasi grafik dan narasi.

Perkembangan operasi bisnis digital yang sangat masif saat ini pada akhirnya membuat Data Science tidak hanya dilaksanakan oleh perusahaan besar saja, akan tetapi startup digital pun memandangnya sebagai sebuah bagian penting untuk mendampingi keputusan strategi bisnis. Sebagai ilustrasi, beberapa contoh penerapan Data Science dalam bisnis di antaranya untuk membantu sistem bisnis secara keseluruhan, tujuannya untuk meningkatkan ROI (Return of Investment) dengan memberikan gambaran tentang aktivitas terukur.

Contoh lagi untuk membantu pemasaran bisnis. Dari data yang histori yang telah terhimpun, sebuah pengetahuan dapat dibuat untuk menghasilkan analisis prediktif mengidentifikasi strategi apa saja yang efektif dijalankan, sehingga pemasar dapat mengeliminasi berbagai jenis tindakan yang tidak memberikan banyak dampak bagi performa penjualan. Di lain sisi, berbagai strategi baru sangat mungkin ditemukan dengan melihat tren data yang ada. Dan masih banyak contoh model implementasi lainnya termasuk untuk production-costs optimization, pricing model optimization, recommendation engine, fraud detection, dll.

Baca juga:

Tentang Peran Talenta Ilmuwan Data dalam Teknologi Big Data

Kemarin, 7-8 Desember 2016, idBigData kembali menggelar Konferensi Big Data Indonesia untuk ketiga kalinya dengan tema “Leveraging National Capacities and Capabilities”.  Ajang yang digelar selama dua hari di Auditorium BPPT, Jakarta ini menghadirkan banyak pembicara berpengalaman dengan topik menarik untuk disimak. Salah satunya adalah topik “The Evolving Roles of Chief Data Scientist” yang dibawakan Deputy Research and Big Data Telkom Komang Aryasa di hari pertama yang juga menyoroti masih kurangnya talenta data scientist (ilmuwan data) di Indonesia.

Teknologi big data telah menjadi hype di industri teknologi digital dalam beberapa tahun belakangan ini. Pengapliaksikan yang luas dan manfaat yang dirasakan dalam membantu mengambil keputusan bisnis telah menjadi dorongan kuat untuk mengimplementasikan teknologi ini dalam perusahaan, termasuk perusahaan rintisan yang kini menjamur di Indonesia. Bersamaan dengan hype-nya tersebut, peran baru dalam tim pun muncul, yakni peran ilmuwan data yang bisa mengolah hingga menceritakan data.

Komang menjelaskan “Saat ini pertumbuhaan data itu sudah luar biasa, terutama dengan banyak hadirnya layanan-layanan online. […] Sekarang ini kita banyak dihadapkan kepada data-data unstructured [dan ditutut] untuk mencari sesuatu dalam data itu, mencari insight. Objectifnya sama dengan small data yang lebih terstuktur, tetapi datanya jadi lebih kompleks.”

Prediksi Volume data hingga 2020 / DailySocial
Prediksi Volume data hingga 2020 / DailySocial

“Volume data akan terus meningkat dan sekarang ini kita sedang bekerja dengan 80% data unstructured. Diperkirakan, hingga 2020 nanti kita akan sangat banyak bekerja dengan data untuk mencari ‘sesuatu’ di sana. Dengan demikian, talenta-talenta untuk mengolah data itu ke depannya akan semakin banyak dibutuhkan,” lanjut Komang.

Talenta yang dimaksud oleh Komang adalah data scientist (ilmuwan data) yang mampu mengolah, menganalisa data, dan pada akhirnya memberikan value pada data tersebut untuk bisa diceritakan. Di awal persentasinya, Komang sendiri menakankan bahwa Value adalah nilai terpenting dalam data karena pada akhirnya itu yang akan ditanya oleh jajaran direksi.

Komang mengatakan, “Dalam big data, ada tiga V umum yaitu Variety, Velocity, dan Volume, tetapi beberapa peneliti menambahkan V lain seperti Veracity, Visualization, Variability, dan Value. […] Namun, saya menganggap yang paling penting itu adalah Value […] karena at the end of the day, BoD [Board of Director] akan menanyakan, apa value-nya?”

Peran Ilmuwan data dalam teknologi big data

Kompetensi Data Scientist / DailySocial
Kompetensi Data Scientist / DailySocial

Pada dasarnya, ilmuwan data memiliki peran penting dalam memberikan value dari data-data yang diolahnya. Untuk melakukan hal tersebut, menurut Komang, ada empat kompetensi yang pelu dipenuhi yaitu Technical Skill, Data Analyst, Business Acumen, dan Story Telling.

Technical Skill mencakup kemampuan Computer Science, Programming, dan Database. Data Analyst mencakup kemampuan Mathematic, Statistic, dan Modeling. Business Acumen mencakup Communication, Technology Alignment, dan Strategic & Performance. Terakhir adalah Story Telling yang mencakup Creativity, Story Telling, dan Visual Design.

“Story Telling ini sangat penting karena dari sini data yang tidak benar bisa menjadi benar kalau ceritanya bagus. Kalau ceritanya tidak bagus, data benar juga bisa menjadi salah. […] Bagaimana kita meyakinkan top level management kita, itu adalah dengan story telling yang bagus,” jelas Komang.

Namun, Komang juga menyadari bahwa untuk mencari orang yang memiliki kompetensi sekomples itu bukan perkara yang mudah. Solusinya, menurut dia, adalah dengan membentuk tim yang terdiri dari beberapa grup yang memiliki kompetensi-kompetensi  dari seorang ilmuwan data. Grup atau tim inilah yang kemudian akan dipimpin oleh Chief of Data Scientist.

Peran Chief of data Scientist sendiri telah mengalami pergeseran. Komang menjelaskan bahwa peran Chief of Data Scientist telah berevolusi dari technology executive embedded in business menjadi business executive responsible for new technology and revenue generation. Sementara tugasnya dalam memimpin tim bisa dilihat dari sisi bisnis dan teknologi.

Evolusi tugas Chief of Data Scientist / DailySocial
Evolusi tugas Chief of Data Scientist / DailySocial

Di sisi bisnis, seorang Chief of Data Scientist harus bisa creating business and product vision hingga menjadi owner of P & L [Product & License] yang dibuatnya. Sedangkan dari sisi teknologi, dia harus bisa creatingscience & technology vision, hiring top scientist and technologist, hingga mengambil keputusan untuk memaksimalkan gross margin.

Namun, ada satu tantangan yang akan dihadapi. Komang menyampaikan bahwa berdasarkan data yang diperolehnya dari McKinsey, diperkirakan akan terjadi kekurangan talenta ilmuwan data ke depannya. Hal ini diantisipasi oleh kampus-kampus di luar negeri dengan mulai menghadirkan jurusan baru, Business Analytics. Pertanyaan yang masih terseisa adalah, bagaimana dengan Indonesia? Apakah sudah melakukan hal yang sama atau belum?

Ini harus segara di antisipasi karena ke depannya kehadiran talenta-talenta yang bisa menyerap dan melakukan pengolahan data yang kompleks (big data) akan memegang peranan yang penting dalam pengambilan keputusan bisnis.


Disclosure: DailySocial adalah media partner Konferensi Big Data Indonesia 2016