Alat dan bahan adalah yang utama baru kemudian teknik mengolahnya. Di dalam dunia masak-memasak juga demikian. Secanggih apapun resep yang dibuat untuk membuat makanan, tetap kelezatan atas masakan itu ditentukan oleh dua hal yaitu bahan dan juga selera penikmatnya. Dalam dunia riset juga tidak jauh berbeda. Kita menggunakan data kurang dari 100 sampel atau mungkin data yang lebih besar, katakanlah 100 juta sampel, maka penentu atas hasilnya tetap bukanlah jumlah datanya tetapi bagaimana kualitas data itu. Jadi rasanya tidak salah kalau saya mengatakan bahwa ilmu big data itu bukan semata-mata metode melainkan bagaimana kita mentreatment data. Treatment data bisa juga diartikan sebagai manipulasi data. Lagi-lagi saya menekankan dengan menulis ulang bahwa manipulasi data di dalam statistik bukanlah bentuk kejahatan intelektual. Itu adalah bagian dari proses operasionalisasi data agar bisa diolah. Yang masuk kategori kriminal adalah dikala melakukan fabrikasi data, yaitu membuat data-data yang sebenarnya tidak ada menjadi ada.

Baik, kembali ke data. Meskipun kualitas data adalah kunci atas suatu hasil namun kenyataannya kita juga akan bertemu dengan mereka yang disebut dengan penikmat ‘masakan’. Di dalam riset, penikmat masakan itu adalah pembaca yang terus dihauskan oleh informasi-informasi terbaru. Jadi teringat istilah ini food for thought: makanan (bahan/materi) untuk dipikirkan. Karena pikiran memang berfungsi untuk berfikir bukan untuk menyimpan energi seperti perut. Kembali ke analogi makanan tadi, seorang penikmat makanan tentu ingin menikmati kualitas makanan yang bagus, sesuai dengan keinginan dan kemampuannya tentunya. Sama dengan hasil riset, meskipun hasil luaran sama namun dikala ada 2 artikel menyajikan bahan yang berbeda dengan jumlah populasi yang berbeda, maka penikmatnya akan dihadapkan pada pilihan. Tentu tidak akan jauh berbeda dengan kita dikala disodorkan sate ayam yang berasal dari daging ayam dan juga sate jamur rasa ayam. Tentu kita akan memiliki preferensi atasnya. Bagi yang belum menikmati sate jamur rasa ayam, bolehlah mencoba menikmati rasa sintetisnya. Setelahnya bagaimana? tentu akan cenderung pada yang utama. Itulah peran data, akan mengarah pada inovasi-inovasi yang mungkin akan menjadi makanan untuk dipikirkan/ dipertimbangkan. Kembali ke contoh sampel data 100 dan 100 juta di atas. Meskipun hasil analisisnya sama, tetapi penikmat riset tentu cenderung akan memilih yang 100 juta karena dianggap lebih meyakinkan. Di sini selera penikmat akan berperan.

Tetapi sekali lagi, penentu kualitas hasil/ output tetaplah data yang selama ini sering kurang diperhatikan sampai ada ilmu khusus tentang data (data science). Dalam bahasa sederhana ilmu data itu sebenarnya adalah ilmu untuk ‘utak-atik’ data. Dari yang disajikan dalam bentuk baris kemudian ditransformasi dalam bentuk kolom, itu juga bagian dari permainan ini. Dan apakah itu selalu menjadi bagian dari metodologi riset? – Saya rasa tidak, mungkin di sekolah-sekolah khusus data science atau statistik terapan saja, itu baru dibahas. Di balik regresi, ada data yang harus dikelompokkan berdasarkan variabel. Di balik citra satelit yang disajikan di paper, ada ekstraksi warna berdasarkan band. Di balik tampilan 3D surface bumi ada pemodelan DEM dan masih banyak olah data statistik lainnya yang begitu disederhanakan oleh software-software berbayar ataupun gratisan. Ambil contoh analisis statistik Moran’s I di ArcGIS, di balik grafik lengkung kemudian tertulis: dispersed, random, dan clustered setidaknya ada 3 tahap analisis statistik tersembunyi. Penjelasan singkatnya begini: dari data poin kemudian diukur jarak antar poin, setelah menentukan tetangga terdekat, baru diukur kekuatan kedekatannya. Dari 3 tahapan itu baru masuk ke rumus Moran’s I dan ketemulah hasilnya. Pengelompokan titik menjadi penentu besaran nilai. Itu semua adalah gambaran mengenai bagaimana kualitas data berperan di balik hasil yang selama ini kita nilai.

Tahap selanjutnya adalah alat. Kita bisa menggoreng kerupuk di teflon, di wajan atau mungkin di mesin penggorengan (deep fryer). Apakah hanya dengan alat itu? – Coba kita pakai lembaran seng yang dibeli dari toko material, ditekuk sedemikian rupa agar bisa cekung. Di cekungan itu kita isi minyak goreng dan kemudian kita gunakan untuk menggoreng kerupuk. Apakah kerupuk tetap akan matang? – Tentu bisa, karena matangnya kerupuk bukan bergantung pada media penggorengannya bukan. Sama halnya dengan riset. Menggunakan alat apapun untuk menghasilkan produk tertentu bisa saja dipertimbangkan dan kemudian digunakan. Tidak usah mengatakan alat ini salah dan alat itu benar. Selama menghasilkan ya itulah produk. Namun yang perlu diperhatikan adalah efektivitasnya. Kemudian efisien ataukah tidak. Dikala kita akan menggoreng kerupuk 1 kg menggunakan wajan di atas kompor, itu sangat efektif. Namun bagaimana kalau anda diminta menggoreng kerupuk 1 ton? Wajan tetap menjadi alat yang tepat tetapi apakah akan efektif dan efisien dikala harus menghitung waktu? Mungkin saja lembaran seng yang besar kemudian diisi minyak goreng untuk menampung minyak dan kerupuk, itu jauh lebih efisien. Di sinilah fungsi alat dan tentu metodenya.

Dari telunjuk hingga machine learning

Pasti anda pernah mendengar istilah guyonan: touch screen ala rumah makan padang. Memilih makanan dengan cara mengarahkan telunjuk jari kita pada satu makanan tertentu tanpa harus menyebutkan namanya. Tunjuk saja sambil mengatakan: ini, terus ini, tambah itu di sana satu saja. Sebenarnya tidak harus di rumah makan padang. Di sinipun saya menggunakan metode yang sama, karena sulit melafalkan kata-kata dalam bahasa Belanda, meskipun sudah ada tulisan di menu makanan. Menggunakan jari telunjuk kemudian meminta penjual untuk mengambilnya. Biasanya dikala membeli es krim yang diwadahi baskom-baskom kotak besar. Itu adalah metode kita menunjuk atau menyeleksi es krim/ makanan yang ingin kita santap.

Jikalau kita sudah tau nama-namanya, kita cukup duduk di meja makan kemudian teriak saja: saya mau es krim rasa coklat dan rasa jambu. Maka pelayan es krim sudah paham dan kemudian akan menyiapkannya. Ada pengetahuan yang sama antara penjual dan juga pembeli. Mereka saling paham, kemudian proses selanjutnya bisa disiapkan dan dikerjakan. Proses yang terjadi adalah kita memikirkan es krim rasa tertentu kemudian mengucapkannya. Ucapan kita didengar oleh penjual, mereka memahami kemudian proses selanjutnya adalah menyiapkan es krim itu. Ada proses transfer informasi, dari manusia ke manusia.

Sedikit berbeda dikala proses transfer informasi itu bukan dari manusia – ke – manusia, melainkan dari manusia ke mesin. Kita menginginkan mesin mengetahui ada makanan bernama rendang, gudeg, dan pecel. Kita siapkan foto-foto makanan itu kemudian kita berikan kategori atau nama di setiap foto. Foto A adalah rendang, foto B adalah gudeg, dan foto C adalah pecel. Proses pengkategorian ini dilakukan oleh manusia, karena memang itu adalah ilmu pengetahuan kita, manusia. Kemudian mesin tinggal menerima perintah saja. Di kala dia sudah mengetahui nama setiap makanan (dari foto) maka dikala kita memberikan gambar makanan ke 4 dan ke 5, mesin akan mengetahuinya. Tentu foto 4 dan 5 adalah gambar diantara rendang, gudeg dan pecel itu. Selain itu, komputer tidak akan mengetahuinya. Di sini pelayan rumah makan padang digantikan oleh mesin dengan cara menyeleksi foto. Itulah salah satu prinsip kerja machine learning berdasarkan kategori foto. Apakah berhenti di sini saja? tentu saja tidak. Bisa juga berdasarkan suara bahkan gambar bergerak.

Kembali fungsi alat dan bahan. Kualitas produk sangat ditentukan oleh 2 ini, maka machine learning itu tidak lebih dari alat. Seperti penggorengan tadi untuk menggantikan alat yang lebih sederhana dan melakukan otomatisasi yang sebelumnya dilakukan oleh manusia.