AI Dapat Memprediksi Apakah Anda Tertarik dengan Sebuah Film Berdasarkan Trailer-nya

Trailer adalah salah satu senjata promosi utama sebuah film. Lewat sebuah trailer, kita dapat sedikit mengetahui plot ceritanya, mengenali sejumlah pemerannya, hingga pada akhirnya mendapat gambaran guna memutuskan apakah film tersebut layak dinikmati di bioskop ketika tayang nanti.

Dari sisi sebaliknya, pihak produser film rupanya juga dapat memanfaatkan trailer untuk memprediksi kalangan penonton seperti apa yang bakal tertarik dengan film buatan mereka. Ide ini telah dibuktikan oleh 20th Century Fox, yang mengembangkan sistem kecerdasan buatan (AI) untuk melaksanakan tugas tersebut.

Dari kacamata sederhana, AI tersebut mampu ‘mengekstrak’ informasi-informasi dari film seperti warna, iluminasi, wajah, objek dan lanskap; untuk kemudian diformulasikan menjadi prediksi demografi penonton yang tertarik. Yang namanya AI, kemampuan semacam ini tentu didapat dari hasil pelatihan intensif yang dilakukan pengembangnya.

Sistemnya sendiri mengandalkan GPU Nvidia Tesla P100 untuk mengolah data yang sudah pasti masif, dibantu oleh deep learning framework TensorFlow dan cuDNN dari Nvidia. Kombinasi ini memungkinkan sistem untuk ‘mencerna’ ratusan trailer film yang dirilis dalam beberapa tahun terakhir, beserta jutaan riwayat kehadiran penonton di bioskop.

Dengan bangga Fox mengklaim bahwa mereka adalah studio pertama yang menerapkan alat bantu unik semacam ini. Mereka percaya bahwa sistem ini bakal sangat membantu pihak produser dalam mengambil keputusan-keputusan yang berkaitan dengan promosi sebuah film, sebab mereka sudah tahu kira-kira jenis penonton yang bakal tertarik.

Sumber: Nvidia. Gambar header: Pixabay.

Google Luncurkan AIY Vision Kit, Perangkat Computer Vision DIY Berbasis Raspberry Pi

Usai memperkenalkan VR headset super-simpel Cardboard di tahun 2014, Google kembali bereksperimen dengan karton. Namun demikian, proyeknya kali ini jauh lebih kompleks karena melibatkan sederet komponen elektronik, dan lagi material karton di sini hanya bersifat kosmetik saja.

Namanya AIY Vision Kit, dan perangkat ini merupakan bagian dari salah satu program eksperimental terbaru Google, yaitu AIY Project. Sebelumnya, Google memulai debut program ini melalui AIY Voice Kit, yang premisnya menawarkan dukungan perintah suara dan integrasi Google Assistant pada perangkat berbasis Raspberry Pi.

Untuk Vision Kit, premisnya tidak jauh berbeda dan masih mengandalkan Raspberry Pi. Hanya saja, topik yang menjadi fokus kali ini adalah computer vision. Google melihat proyek ini sebagai cara murah dan sederhana untuk menerapkan teknologi computer vision tanpa perlu mengandalkan koneksi ke jaringan cloud.

AIY Vision Kit

Vision Kit ditujukan untuk penghobi DIY alias do-it-yourself. Paket penjualannya mencakup casing karton, papan sirkuit VisionBonnet, tombol arcade RGB, speaker piezoelektrik, lensa wide-angle dan makro, mur untuk menyambungkan ke tripod dan beragam komponen penyambung lain.

Sisanya, pengguna harus menyiapkannya sendiri, mulai dari Raspberry Pi Zero W, kamera Raspberry Pi, SD card, dan power supply. Kalau sudah lengkap, barulah Vision Kit siap diprogram lebih lanjut.

AIY Vision Kit

Komponen utama Vision Kit adalah papan sirkuit VisionBonnet itu tadi, yang mengemas chip Intel Movidius MA2450. Chip ini punya konsumsi daya yang amat kecil, akan tetapi sanggup menerapkan computer vision dengan menjalankan sejumlah neural network secara lokal, alias tanpa sambungan internet.

Google sendiri menyediakan tiga model neural network yang bisa langsung dipakai. Yang pertama untuk mengenali ribuan benda umum. Yang kedua untuk mengenali wajah dan ekspresinya. Yang terakhir untuk mendeteksi manusia, kucing atau anjing. Selebihnya, pengguna bebas ‘melatih’ model neural network-nya sendiri menggunakan software open-source TensorFlow.

AIY Vision Kit

Sejauh ini Anda mungkin bertanya, “apa manfaat praktisnya?” Banyak, salah satunya untuk mengidentifikasi beragam jenis tanaman maupun hewan. Selain itu, Vision Kit juga bisa dimanfaatkan untuk mengecek apakah anjing Anda kabur dari halaman belakang, atau mengecek apakah tamu-tamu yang datang tampak terkesan dengan dekorasi rumah Anda berdasarkan ekspresi mukanya.

Google berencana memasarkan AIY Vision Kit ke komunitas maker mulai awal Desember ini. Harganya dipatok $45, sekali lagi belum termasuk chip Raspberry Pi dkk yang saya sebutkan tadi.

Sumber: Google.

Google Tunjukkan Kebolehan AI dalam Mendeskripsikan Foto dengan Akurasi 94 Persen

Layanan macam Google Photos populer berkat integrasi AI dengan kemampuan mengenali objek dalam foto, yang kemudian diterjemahkan menjadi fitur tagging otomatis. Ini baru satu manfaat yang bisa diambil dari teknologi image recognition, masih ada kegunaan lain seperti misalnya memberikan deskripsi lisan untuk kaum tuna netra.

Seberapa akurat sebenarnya AI bisa mengenali objek dalam gambar? Berdasarkan pengakuan tim Google Research, akurasinya kini sudah mencapai angka 93,9 persen. Menariknya, semua ini bisa dinikmati oleh semua pihak developer, bukan cuma Google saja.

Yup, Google terus menyempurnakan teknologi di balik mesin pembelajaran open-source-nya, TensorFlow, kali ini dengan algoritma “Show and Tell” yang memungkinkan developer untuk melatih AI dalam mengenali dan mengidentifikasi beragam objek dalam gambar.

Setelah dilatih, sistem dapat mengidentifikasi dan mendeskripsikan objek dalam foto yang belum pernah dilihat sebelumnya / Google Research
Setelah dilatih, sistem dapat mengidentifikasi dan mendeskripsikan objek dalam foto yang belum pernah dilihat sebelumnya / Google Research

Setelah dilatih dengan tiga foto anjing yang berbeda dan deskripsinya masing-masing misalnya, sistem ternyata sanggup mengidentifikasi dan mendeskripsikan foto yang belum pernah dilihatnya secara akurat. Hal ini sekaligus menjadi bukti bahwa sistem yang baru dapat memahami objek sekaligus konteks secara lebih mendalam.

Baru dua tahun yang lalu, AI Google hanya bisa mengidentifikasi objek dengan akurasi 89,6 persen. Sekarang, tidak cuma akurasinya yang bertambah, tetapi juga kemampuannya mengembangkan informasi yang sudah didapat – hasil latihannya bersama manusia – untuk mendeskripsikan foto yang benar-benar baru, lalu mengekspresikannya secara lisan dengan cara yang lebih alami.

Sumber: Engadget dan Google Research.

Lewat Proyek Magenta, Google Kembangkan AI Berjiwa Seni

Kecintaan dan komitmen Google terhadap kecerdasan buatan (AI) sangatlah besar. Kalau tidak, mereka tidak akan ambil pusing demi merilis TensorFlow secara open-source maupun memperkenalkan versi baru Google Assistant yang lebih cerdas.

AI memang memegang banyak peran dalam kinerja produk-produk Google. Contoh yang paling gampang adalah hasil pencarian dan rekomendasi lagu yang diberikan pada layanan Google Play Music, tidak ketinggalan juga algoritma penyortir foto dalam Google Photos.

Namun kini Google ingin menggali potensi AI lebih dalam lagi. Problem teknis mungkin mudah saja diselesaikan oleh AI, tapi bagaimana dengan pekerjaan yang membutuhkan kreativitas? Bagaimana dengan seni? Apakah AI juga bisa bermain musik atau malah melukis?

Pertanyaan-pertanyaan itulah yang menjadi alasan di balik lahirnya proyek bernama Magenta. Magenta pada dasarnya merupakan upaya riset Google dalam mengembangkan AI yang berjiwa seni, yang bisa menciptakan karya seni dengan sendirinya.

Magenta dipimpin oleh Douglas Eck, seorang peneliti yang sebelumnya bertanggung jawab atas rekomendasi musik dalam Google Play Music. Beliau kini ingin melihat apakah AI juga bisa menciptakan musik di samping sekadar memberikan rekomendasi berdasarkan riwayat dan selera pengguna.

Merupakan bagian dari tim Google Brain, Magenta memanfaatkan teknologi yang dikemas dalam TensorFlow. Proyek ini pun juga akan dijalankan secara open-source, mengundang para peneliti maupun akademisi lain untuk ikut berpartisipasi via GitHub.

Tujuan akhirnya tentu untuk mencari tahu apakah AI benar-benar bisa berkarya di bidang seni atau tidak. Nantinya tim berencana merilis aplikasi Magenta yang akan menampilkan seni rupa maupun musik gubahan AI dari proyek Magenta.

Sumber: Popular Science dan Quartz.

Mesin Pembelajaran TensorFlow Kini Terbuka untuk Semua Orang

Bukan rahasia lagi bahwa Google, Apple, Microsoft dan termasuk Facebook saling bersaing untuk jadi yang terdepan dalam teknologi piranti lunak pintar, dengan secara agresif mengembangkan kecerdasan buatan melalui platformnya masing-masing.

Teknologi inilah yang selama ini memungkinkan aplikasi-aplikasi mobile kembangan mereka melakukan banyak hal baru layaknya mekanisme sel otak yang mampu berpikir, belajar dan berkembang.

Namun Google sepertinya sadar bahwa teknologi ini bisa lebih berkembang dan berguna bila berada di tangan orang yang tepat di luar sana. Di tangan pengembang-pengembang kreatif yang jenius, para peneliti dan ilmuwan. Untuk itulah, kemarin tepat di hari Senin (9/11/2015) Google resmi merilis mesin pembelajaran TensorFlow yang selama ini digunakan secara internal sebagai program open source. Melepaskan parameter piranti lunaknya itu untuk para pengembang, peneliti dan akademisi yang berkompeten.

Dalam pernyataan resminya Google berharap langkah ini dapat membantu orang-orang yang berkepentingan untuk memperoleh alat yang tepat dalam melakukan banyak hal, membantu akselerasi riset dan pengembangan mesin pembelajaran sehingga membuat teknologi bekerja lebih baik untuk semua orang.

TensorFlow sendiri menjadi tool andalan Google setelah generasi pertama DistBelief, dalam membenamkan kecerdasan sejumlah aplikasi seperti pengenalan suara di aplikasi Google dan foto di Photos. Ia juga berada di balik fitur penjawab email Smart Reply yang diumumkan minggu lalu.

Langkah ini diambil setelah pada bulan Januari lalu Facebook menempuh cara serupa dengan merilis tool kecerdasan buatan dan mesin pembelajaran ke komunitas open source.

TensorFlow sendiri dipastikan kini berlisensi Apache 2.0, bekerja dengan baik di perangkat komputer dan smartphone. Ia dirancang untuk berjalan dengan baik di prosesor, grafis, desktop, server dan platform komputasi mobile yang ada.

Google bahkan telah memberikan serangkaian tutorial dan bagan aliran data untuk menggambarkan bagaimana cara kerja sistem ini.

Sumber gambar header Venturebeat.