Algoritma Adakan Workshop Bahas Pilihan Karier sebagai Data Scientist

Banyak yang bertanya-tanya, apa saja yang bisa dilakukan seorang data scientist sehingga disebut sebagai pekerjaan paling seksi di abad ke-21. Pekerjaan ini disebut seksi karena tingkat permintaan (demand) terhadap data scientist jauh melebihi tingkat penawaran (supply). Jadi orang-orang yang memenuhi kualifikasi sebagai seorang data scientist, yakni yang mampu mengolah data menjadi informasi hingga dapat melakukan prediksi dari data yang ada, akan dibayar dengan gaji yang tidak sedikit. Dengan kata lain pula dapat dikatakan bahwa data scientist dibutuhkan di mana-mana karena segudang pilihan karier yang menanti.

Pilihan pertama seorang data scientist adalah mengabdi pada perusahaan tertentu sebagai pekerja tetap. Biasanya pilihan karier ini banyak dipilih karena merupakan jenis pekerjaan yang aman. Pilihan kedua adalah sebagai konsultan independen untuk proyek data science. Untuk jenis pekerjaan ini, seorang data scientist harus berusaha membangun reputasi dan kredibilitas sehingga dipercayai publik. Pilihan ketiga adalah menciptakan tools data science sendiri. Tools atau aplikasi ini dapat berupa mesin prediksi saham, mesin analitik traffic sebuah situs, mesin visualisasi data dan lain-lain.

Namun demikian, sebenarnya pilihan karier data scientist bukan hanya itu saja. Ada banyak lagi jenis pilihan profesi yang bisa dirintis oleh seorang data scientist. Untuk membahas hal ini, Algoritma mengadakan sebuah workshop yang berjudul “Data Scientist Career Path” pada tanggal 5 Oktober 2017, pukul 18:00-20:00 WIB, bertempat di Freeware Suites, Equity Tower lantai 18, Jakarta. Workshop ini akan dipandu oleh Samuel Chan, Course Producer dan Co-Founder Algoritma.

Fix_Banner Event-Rectangle_Kickstart Sept 20

Tak ketinggalan pula, semua peserta workshop akan belajar ngoding dengan bahasa R. Samuel Chan akan mengajarkan data visualisasi dan machine learning bagi para peserta workshop.

Jika tertarik untuk datang ke workshop ini, info lengkap dan pendaftarannya dapat mengunjugi tautan berikut: https://goo.gl/FnfVCo.

––

Disclosure: DailySocial merupakan media partner untuk acara data science dari Algoritma.

Memahami Dasar-dasar “Data Science” untuk Bisnis (Bagian 2)

Sebelumnya, dalam seri pertama telah dibahas tentang komponen dasar dari sebuah rangkaian dan komponen yang mengisi Data Science. Pada bagian ini akan dibahas dasar salah satu implementasi Data Science yang paling dibutuhkan saat ini, yakni Big Data.

Istilah Big Data dewasa ini bukan hal baru lagi, khususnya dalam penerapan Data Science di korporasi. Sesuai namanya, Big Data mengindikasikan pada sebuah pemrosesan data besar yang tidak bisa ditampung melalui mekanisme basis data konvensional (misalnya RDBMS). Dalam Big Data ada istilah mendasar yang sering disingkat dengan 3Vs yang menjadi karakteristik utama, yakni Volume, Velocity dan Variety.

Volume merujuk pada limitasi besaran data yang akan diolah. Kemampuan Big Data dapat mengolah data dengan ukuran terabyte (1012 bytes) atau petabyte (1015 bytes). Mengapa data bisa berukuran sebesar itu, faktor Velocity (atau kecepatan interaksi data) yang akan mengukur. Velocity adalah volume data pada skala waktu tertentu, yang didapatkan dari berbagai sumber, misal dari data transaksi, data perekaman sensor, atau data yang dihasilkan dari sebuah log mesin.

Dari yang sudah sering ditangani selama ini, Velocity dapat mencapai kisaran 30 kilobyte sampai 30 gigabyte per detik. Bahkan banyak Data Engineer membutuhkan latensi yang lebih dapat, misalnya 100 milliseconds dalam perekaman data. Tren ini diyakini akan terus berkembang, menghasilkan data yang lebih besar, seiring dengan model pemrosesan real-time yang banyak diterapkan di berbagai lini bisnis dalam sebuah perusahaan. Perangkat lunak seperti Apache Sqoop, Apache Kafka atau Apache Flume menjadi beberapa yang terpopuler untuk mengolah pergerakan data besar tersebut.

Kemudian yang ketiga ialah Variety, ini berkaitan dengan jenis data –seperti yang telah dibahas dalam materi sebelumnya, umumnya akan ditemui tiga jenis data, yakni terstruktur, semi-terstruktur dan tidak terstruktur. Saking besarnya kumpulan data dari berbagai sumber dan varian, dalam ilmu Big Data ada istilah “Data Lake”. Istilah tersebut banyak digunakan oleh praktisi Big Data untuk merujuk pada sebuah sistem penyimpanan data non-hierarkis yang menampung data multi-struktur dengan sebuah arsitektur penyimpanan tertentu. Hadoop Distributed File System (HDFS) adalah salah satu contoh arsitektur penyimpanan yang sering digunakan untuk mendukung kebutuhan tersebut.

Sedikit tentang Hadoop di dalam konsep Big Data

Hadoop adalah sebuah kerangka kerja open source untuk mendukung aplikasi berbasis Big Data. Ketika orang mengatakan menggunakan Hadoop maka itu mengacu pada sebuah ekosistem perangkat lunak meliputi HDFS untuk penyimpanan data, Map Reduce untuk pemrosesan data dalam jumlah besar, Spark untuk pemrosesan data secara real-time, dan YARN (Yet Another Resource Negotiator) untuk dukungan manajemen sumber daya.

Dalam sebuah implementasi yang paling sederhana, dari sebuah sumber data MapReduce akan diterapkan untuk melakukan dua hal, yakni memetakan data dan mereduksi data. Dalam tugasnya memetakan data, MapReduce mendelegasikan data ke pada sebuah “key-value, termasuk melakukan transformasi data atau memilah data sesuai yang dibutuhkan. Sedangkan dalam tugasnya mereduksi, MapReduce akan mengagregasi data pada sebuah dataset sehingga memenuhi standar yang ada.

Jika studi kasusnya kepada sebuah data pasif, skenario di atas akan sudah cukup, tinggal memasukkan ke HDFS untuk selanjutnya diproses. Akan tetapi tantangan masa kini dalam penerapan Big Data adalah data real-time. Sehingga MapReduce perlu sebuah pendamping, dalam hal ini Spark sebagai sebuah in-memory computing application. Di dalamnya pengguna dapat melakukan banyak hal, termasuk melakukan query, analisis dan eksplorasi data, termasuk menjalankan algoritma tertentu misalnya Machine Learning.

Penggunaan rangkaian alat Hadoop juga memerlukan sebuah kompetensi pemrograman. Pada dasarnya Hadoop dikembangkan dari Java, akan tetapi dari perkembangannya kini bahasa lain seperti Scala, Python dan SQL telah dielaborasikan ke dalam proses pengelolaannya. MapReduce secara native menggunakan Java, sedangkan Spark menggunakan Scala. Namun sekarang juga sudah ada dukungan PySpark sehingga dapat mengelola Spark dengan pemrograman berbasis Python. Sedangkan untuk pengelolaan di HDFS tetap menggunakan SQL.

Sebelum melangkah lebih jauh

Melakukan implementasi Big Data dalam sebuah unit bisnis memang membutuhkan waktu, bahkan beberapa perusahaan menempatkan implementasi Big Data pada long-term vision, karena prosesnya harus berelaborasi dengan kegiatan lain dalam unit bisnis. Namun sebelum melangkah lebih jauh dan mempelajari teknisnya secara lebih mendalam, perlu diketahui terlebih dulu tentang visi Data Science dari sebuah bisnis. Mungkin akan cukup beragam namun setidaknya mencakup tiga hal, yakni (1) mengidentifikasi tantangan bisnis, (2) memecahkan masalah bisnis dengan pendekatan data, dan (3) meningkatkan keuntungan di seluruh lini bisnis.

Big Data adalah bentuk penerapan Data Science dalam skala besar. Untuk mengawali awareness tentang data sebenarnya bisa dilakukan dengan cara yang paling sederhana. Sebagai contoh akan mengangkat studi kasus bisnis media. Hal paling awal yang dapat dilakukan ialah mengidentifikasi sumber data yang ada, apakah itu dari basis data yang dihasilkan melalui Content Management System (CMS), data trafik pengunjung yang didapat melalui Anaytic Tools, atau bahkan data dari luar –misalnya identifikasi tren topik dari media sosial atau mesin pencari.

Berikutnya, tentukan masalah apa yang ingin dipecahkan. Sebagai contoh, media tersebut memiliki topik bulanan untuk sebuah opini. Maka tugas Data Science di sini bisa saja berbentuk menghubungkan tren data di media sosial tentang popularitas suatu tema dihubungkan dengan popularitas tulisan-tulisan sebelumnya berkaitan dengan tema tersebut. Jika datanya sudah lebih terstruktur, misalnya dalam format CSV, maka alat seperti R Studio akan memudahkan dalam visualisasi.

Bahasa R sendiri salah satu bagian mendasar ketika seseorang ingin mempelajari tentang Data Science. Banyak cara yang dapat dilakukan untuk mempelajarinya, mulai dari menggunakan sumber online di internet, buku atau mengikuti kursus khusus yang dilaksanakan bersama trainer tersertifikasi. Di Indonesia, salah satu pelatihan tentang Data Science dilakukan oleh Algoritma. Beberapa waktu lalu Algoritma mengadakan pelatihan Data Science Fundamental dan Data Science for Financial Business. Selain disajikan bahasan secara konsep, para peserta diajak langsung mencoba melakukan programming dengan bahasa R untuk pengelolaan dan visualisasi data.

Kecakapan dalam memvisualisasikan data sangat penting, karena data yang berbentuk visual akan lebih mudah dibaca. Dari sini –menyambung studi kasus di atas—maka dapat dilanjutkan dengan sebuah diskusi oleh pimpinan redaksi atau tim editorial tentang pertimbangan untuk memilih tema tersebut. Kira-kira seperti itu konsep sederhana yang dapat diterapkan dari ilmu Data Science, yang paling sederhana.

Pada seri berikutnya akan dibahas tentang bagaimana sebuah bisnis/perusahaan mengubah pola dan proses di dalamnya sehingga menjadi lebih data-driven. Akan disampaikan juga contoh penerapan yang telah berhasil dilakukan oleh startup sukses dari Indonesia.

––

Disclosure: DailySocial merupakan media partner dari Algoritma.

Disclaimer: Tulisan ini mengambil sampel dari berbagai sumber, termasuk dari sumber buku cetak dan tulisan online di internet.

Baca juga:

Algoritma Akan Adakan Talkshow Bahas Data Science di Industri Finansial

Seiring dengan perkembangan teknologi, data di berbagai industri juga semakin bertambah, terlebih di lini industri kritis seperti finansial. Ada banyak sekali jenis data yang berkembang dalam industri finansial, misalnya transaksi pelanggan, pertimbangan risiko keuangan, perhitungan biaya institusi, dan lain-lain. Bayangkan kalau jenis data yang berbeda-data ini dikalikan dengan jumlah pelanggan di sebuah perusahaan yang menggunakan fasilitas teknologi finansial, betapa banyaknya data yang ada untuk sekelompok orang saja.

Sebagai contoh, seseorang membeli baju dari salah satu platform e-commerce. Untuk melakukan pembayaran, ia memilih pembayaran melalui kartu kredit dari sebuah bank. Data transaksi ini tentu saja harus direkam oleh platform e-commerce yang bersangkutan untuk kepentingan pelaporan transaksi, hingga pengambilan keputusan dalam rangka optimalisasi sistem pembayaran.

Semua data para pelanggan yang mempunyai pengalaman transaksi di satu perusahaan tertentu pasti bermanfaat bagi industri tersebut. Namun data tersebut akan bernilai guna jika data bisa dikumpulkan dengan baik dan diolah secara tepat sesuai dengan tujuan penggunaan data.

Untuk mempelajari kiat mengoptimalkan potensi dari data tersebut, Algoritma bersama dengan Midtrans dan Julo akan mengadakan talkshow bertemakan “Data Science in the Financial Industry”.

Pembicara dalam talkshow ini terdiri dari Monalisa Gosumolo (Head of Data Science di Midtrans) dan Martijn Wieriks (Head of Analytics di Julo). Keduanya akan membahas perkembangan data science dalam industri finansial, aplikasi data dan analisis dalam industri finansial, hingga kesempatan yang mungkin bisa kamu pelajari untuk meniti karier di bidang data science.

Acara ini akan digelar pada 20 September 2017, di Spacemob, Gama Tower lantai 33, Jakarta Selatan. Acara ini terbatas hanya untuk 50 peserta dan berasal dari kalangan mana pun, mulai dari mahasiswa, karyawan, dan startup. Untuk pendaftaran dan informasi lebih lanjut dapat diakses melalui tautan berikut: https://goo.gl/AgdQGB.


Disclosure: DailySocial merupakan media partner acara Data Science oleh Algoritma.

Algoritma, Kejora HQ, dan AWS Akan Adakan Workshop “Data Science” bagi Pemula

Era digital melahirkan banyak hal baru, tidak hanya yang berdampak pada teknologi penopang proses bisnis di atasnya, akan tetapi keluaran dari proses bisnis itu sendiri yang dapat diolah lebih lanjut, yakni data. Dewasa ini juga muncul istilah “data is the new currency“, mengisyaratkan betapa bernilainya data untuk berbagai kebutuhan strategis, untuk beragam jenis kebutuhan.

Namun data hanya sebagai data tanpa melalui proses pengolahan. Data Science adalah orang yang bertugas mengumpulkan, memproses, mengompilasi, dan memvisualisasikan data yang dari berbagai sumber untuk menghasilkan sebuah pengetahuan yang berguna. Misalnya dalam bisnis e-commerce, data aktivitas pembeli dalam website dapat dijadikan rujukan untuk mendesain antar muka yang sesuai. Menu mana yang paling sering digunakan, atau produk apa yang pada akhirnya mudah ditemukan.

Contoh lain untuk dunia pendidikan misalnya, data yang terkumpul dapat dilakukan untuk pengambilan keputusan. Misalnya untuk menambah jam mata pelajaran apa untuk persiapan menyambut ujian akhir, atau membeli buku genre apa di perpustakaan sesuai yang paling banyak diminati pembaca, dan lain sebagainya. Data yang sudah diolah dapat menyimpulkan banyak hal, dari aktivitas-aktivitas yang pernah dilakukan dalam bisnis.

Untuk memberikan pemahaman lebih lanjut terkait Data Science dan proses di dalamnya, lembaga pelatihan khusus pengolahan data Algoritma, bekerja sama dengan Kejora HQ dan Amazon Web Services mengadakan workshop bertajuk “Kickstart Series: Building Machine Learning Applications“. Tiga hal yang menjadi bahasan utama dalam acara ini, yakni pemrograman dasar bahasa R, pengenalan visualisasi data, dan teknik machine learning.

Workshop ini akan dipandu oleh Samuel Chan dan Seon Young. Samuel Chan adalah co-founder dan course producer di Algoritma. Sementara itu, Seon Young adalah Developer/Startup Specialist Solutions Architect di Amazon Web Services. Di workshop ini, Seon Young juga akan mengenalkan Machine Learning Service di Amazon, visualization tools untuk menciptakan model machine learning tanpa harus belajar algoritma machine learning yang sulit. Salah satu hasil akhirnya, Seon akan mengajarkan bagaimana prediksi dapat ditemukan dari berbagai aplikasi menggunakan API sederhana.

Workshop ini akan diselenggarakan pada tanggal 5 September 2017 pada pukul 17:45 di Kejora HQ. Para peserta disarankan untuk membawa laptop serta memasang R dan RStudio untuk kebutuhan praktik. Workshop ini didesain untuk dihadiri oleh 100 orang, baik untuk kalangan mahasiswa, karyawan, sampai startup. Seusai dengan misinya Algoritma ingin menjadikan Data Science dapat dipelajari oleh siapa saja. Info lebih lanjut dan pendaftaran, kunjungi tautan berikut http://bit.ly/algoDS0905.

Kickstart Series: Building Machine Learning Applications


Disclosure: DailySocial merupakan media partner acara Kickstart Series – Building Machine Learning Applications

Tak Hanya Merespons, Teknologi FingerAngle Bisa Baca Arah Datangnya Sentuhan

Berkat 3D Touch Apple, iPhone generasi terbaru kini bisa mengetahui besarnya tekanan sentuhan. Cukup tambahkan app seperti Plum-O-Meter, smartphone dapat digunakan untuk menimbang bobot. Sayang sekali teknologi tersebut masih terbilang eksklusif, dan secara umum, touchscreen masih belum mampu menjadi teknik input optimal karena sejumlah keterbatasan.

Kabar baiknya, penemuan tim Qeexo dari Carnegie Mellon University berpeluang membawa pemakaian touchscreen ke level yang lebih ideal. Para ahli di sana memperkenalkan FingerAngle, teknologi yang memungkinkan handset tak cuma merespons, namun menerka arah datangnya sentuhan. Dan hebatnya lagi, Anda tidak perlu membeli smartphone baru buat menggunakannya.

Solusi Qeexo dihadirkan dalam bentuk algoritma via software, membuka kemampuan smartphone untuk membaca arah dan perputaran jari secara tiga dimensi saat didekatkan ke display di poros pitch dan yaw. Potensinya sangat besar, jauh melampaui kapabilitas 3D Touch yang terbatas buat mengidentifikasi tekanan, karena gesture bisa dihasilkan hanya melalui gerakan satu jari.

FingerAngle 01

Smartphone dapat mengetahui bagian jari mana yang disentuhkan, dan teknik tersebut dimanfaatkan Qeexo untuk menentukan orientasi ‘relatif’ ke layar. Solusi ini sangat pintar: Biasanya kita memerlukan dua jari buat memutar arah display, tidak masalah jika perangkat mempunyai panel berukuran lebar, tapi akan jadi kendala ketika diterapkan pada smartwatch.

Lewat algoritma FingerAngle, smartwatch bisa mendeteksi rotasi sewaktu Anda menggerakan jari, meskipun sebetulnya posisinya tidak berubah. Melalui teknik serupa, kita dapat menyesuaikan volume atau zoom-in dan zoom-out cukup dengan memutar jari searah/berlawanan jarum jam. Contoh lainnya adalah untuk mengonfigurasi sudut perspektif, misalnya dalam aplikasi Google Street View.

Namun walaupun FingerAngle tersaji berbasis sotfware, jangan harap ia bisa langsung diimplementasikan ke handset via instalasi app standard. FingerAngle harus dipasang terlebih dulu di di firmware, diintegrasikan ke perangkat lunak produsen supaya dapat bekerja. Qeexo sudah mulai melakukan kerjasama dengan beberapa nama. Karya mereka sebelumnya, Fingersense, sudah diimplementasikan Huawei ke handset P8, Honor 7 dan Mate S.

Qeexo belum memberi tahu kapan FingerAngle akan didistribusikan dan smartphone/tablet/smartwatch apa yang pertama kali mengusungnya, semoga saja developer siap merilisnya di tahun depan .

Via Gizmodo.

Hemat Belasan Gigabyte Dengan Beralih ke Windows 10

Melalui Windows 10, Microsoft fokus pada upaya penyelarasan pengalaman pengguna dan fungsionalitas antar perangkat berbeda. OS anyar itu menyajikan interface lebih baik dan Microsoft sudah memamerkan beragam fitur canggih di sana. Tapi dari pengumuman terbaru, Windows 10 tampaknya juga akan melepaskan beban pikul ruang penyimpanan data PC Anda. Continue reading Hemat Belasan Gigabyte Dengan Beralih ke Windows 10