Presentasi Menarik dari Dr. George Djorgovski: Big Data Science in the 21st Century: Lessons and Experiences from Astronomy

Ada presentasi menarik yang disampaikan oleh Dr. George Djorgovski dari Caltech tentang fenomena Big Data yang juga terjadi di Astronomi. Bagaimana tantangan yang dihadapi oleh astronom sekarang, terutama di negara maju yang memiliki fasilitas instrument yang lengkap. Dengan fasilitas instrument itu, data dengan cepat dan besar diproduksi secara massive sehingga kita menjadi kelimpungan menganalisis data yang datang begitu cepat dan besar tanpa sempat menganalisis data yang sudah ada.

Kalau dulu orang yang punya data bisa mengerjakan pekerjaan science, sekarang data begitu membludak dan sebagian besar tersedia secara gratis di internet. Karna banyaknya data tersebut, para ilmuan membagi data tersebut di internet agar orang juga bisa ikut membantu menganalisis. Banyak pekerjaan Tugas Akhir atau Skripsi mahasiswa Astronomi yang melakukan analisis terhadap data-data dari instrument luar yang memang sangat banyak sekali tersedia.

Yang menarik bagi saya adalah tentang fenomena membludaknya data ini dan perubahan paradigma pendekatan sains dalam menjawab pertanyaan-pertanyaan mendasar tentang ilmu dasar. Kalau dulu orang menjawab pertanyaan-pertanyaan sains dengan Experiment dan Theory, sekarang sudah muncul Pendekatan Komputasi atau simulasi, dan kemudian muncul lagi pendekatan Data atau Data Driven Paradigm (menurut presentasi ini). Pendekatan data ini secara garis  besar ingin menemukan pengetahuan baru dari sekumpulan data yang tersedia atau dalam bahasa lain yaitu Knowledge Discovery on Data (KDD).

Berikut video secara lengkap Presentasi Dr. George Djorgovski

Pengamatan Radio Matahari Partisipatif

Kondisi ruang radio dan peralatan pengamatan teleskop radio saat teramatinya semburan radio kelas X2 yang terjadi tanggal 15 Februari 2011.
Kondisi ruang radio dan peralatan pengamatan teleskop radio saat teramatinya semburan radio kelas X2 yang terjadi tanggal 15 Februari 2011. Image by Alfan Nasrulloh via blog.alfannas.com

Saya sangat terinspirasi dengan ide pengamatan radio dari matahari secara partisipatif. Ide tersebut dituangkan dalam sebuah project oleh NASA dalam Project RADIO JOVE. Dalam project itu, NASA membagikan desain teleskop radio sederhana yang bisa dengan mudah dipahami oleh pelajar, mahasiswa, maupun masyarakat umum. Project juga menyediakan kit yang bisa dibeli dan dipasang oleh masarakat umum, terutama sekolah-sekolah setingkat SMA maupun SMP. Masyarakat bisa memasukkan datanya ke database project yang dikelola oleh NASA Goddard Space Flight Center.

Kegiatan ini bisa menumbuhkan simbiosis mutualisme antara Ilmuan, Pelajar, Pendidik, Sekolah, dan Radio Amatir. Kegiatan ini juga bisa men-trigger untuk dilakukannya pemerataan pembangunan infrastruktur sampai ke daerah – daerah. Kebutuhan koneksi internet untuk berdiskusi dan bertukar data tidak dapat dielakkan. Pembangunan infrastruktur internet dan komunikasi daerah sangat dibutuhkan. Atas rasa keingintahuan masyarakat terhadap ilmu pengetahuan disekitarnya bisa digunakan energi untuk pembangunan infrastruktur ini.

Bagi Ilmuan
Project ini bisa menyediakan data bagi ilmuan tentang data matahari yang dikumpulkan oleh para peserta dari berbagai daerah di Indonesia yang membentang cukup panjang dari timur ke barat, sehingga kemungkinan mendapat banyak data dari rentang tersebut sangat besar. Waktu penyinaran yang diterima Indonesia oleh Matahari juga cukup panjang. Jadi halangan mendapatkan data karena cuaca buruk bisa diminimalisir karena lokasi pengamatan yang tersebar. Tentunya kurasi data yang diterima juga diperlukan disini untuk mendapatkan data yang layak untuk diikutkan dalam penelitian.

Bagi Pendidik atau Sekolah
Guru dan Sekolah bisa menggunakan project ini sebagai contoh kongkret kegunaan dari pelajaran fisika, matematika, atau sains pada umumnya, yang bisa diberikan kepada siswa. Sekolah juga bisa saling bertukar pengethauan dengan sekolah lain maupun dengan para ilmuan. Project ini bisa dikerjakan oleh multidisiplin dari kegiatan extrakurikuler elektronika, astronomi, karya ilmiah remaja (KIR) dan atau radio amatir sekolah. Data dari pengamatan bisa dikumpulkan secara nasional sebagai bahan bagi para ilmuan, astronom professional, untuk bahan penelitian matahari atau mungkin bisa jadi bahan untuk penelitian perubahan iklim. Tentu saja data yang dimasukkan kedalam database nasional perlu memenuhi standar yang sudah ditetapkan sebelumnya. Kita juga bisa berpartisipasi secara internasional.

Bagi Masyarakat Umum
Masyarakat umum khususnya yang memiliki hobi elektronika atau radio amatir bisa menyelesaikan tantangan-tantangan teknis dalam mendeteksi radio derau atau noise yang dipancarkan matahari yang dalam kesehariannya tidak berguna dalam komunikasi bisa memiliki makna fisis. Jadi selain sebagai volunteer yang sangat berperan besar dalam bidang komunikasi ketika bencana, komunitas radio amatir bisa juga berpartisipasi dalam hal sains.

Kegiatan ini adalah salah satu kegiatan sains potensial yang bisa dilakukan oleh semua orang dengan berbagai latar belakang dan hobby. Kegiatan ini juga berpotensi untuk men-trigger pengembangan ilmu pengetahuan dan teknologi secara kolektif. Tentu saja masih banyak ide lain yang bisa dikembangkan lagi dari sini.

 

Antara Astronomi Radio dan Big Data?

Pengamatan radio frekuensi rendah akan terus dilakukan di observatorium bosscha. Peralatan penerima radio terus diuji coba. Data pengamatan terus dikumpulkan. Data interferensi akan terus dicatat. Pesan-pesan dari matahari dan jupiter akan terus kita ‘dengarkan’.

Saya menyadari, data pengamatan model seperti ini akan terus bertambah dan berevolusi terus baik bentuk, maupun jumlahnya. Perlu dilakukan penanganan data yang baik dan sesuai agar data pengamatan yang telah dilakukan bisa diambil insight atau penemuan pengetahuan dari data yang telah terkumpul.

Karena data yan didapat dari sensor seperti ini atau dari peralatan yang ‘unik’, maka management datanya juga akan unik. Mungkin penanganan data menggunakan metode basis data relasional akan membutuhkan banyak ‘penyesuaian’. Sementara data akan terus berevolusi. Dari sini saya mulai ‘melihat’ big data. Suatu metode dan teknologi atau pendekatan baru dalam menangani data yang tidak terstrukture . Bisa juga untuk data yang terstrukture atau gabungan dari keduanya.

Terus tarang saya belum punya gambaran detail tentang apa dan bagaimana big data ini bisa berperan. Tapi saya melihat bahwa ‘big data’ adalah salah satu future approaches.

Continue reading “Antara Astronomi Radio dan Big Data?”

Big Data???

Ya, apa itu big data…???

Beberapa hari terakhir ini, dunia saya sedikit teralihkan dengan term big data ini. Apa sih big data ini?. sepertinya isu big data mulai diungkapkan ke permukaan semenjak orang sadar kalau kita kebanjiran data. apalagi sejak 2.0 mulai menjalar kemana-mana.

saya melihat film dokumenter di youtube, BBC Horizon 2013 The Age of Big Data, dimana data secara massive di-‘create’ baik oleh individu maupun lembaga. Salah satu lembaga yang akan berkontribusi adalah lembaga di bidang astronomi (dan tentu lembaga sains yang lain).

Dengan dibangunnya fasilitas-fasilitas survey langit seperti LSST (Large Synoptic Sky Survey) yang akan menghasilkan data kira-kira sampai 30 TB per malam, atau SKA ( Square Kilometer Array), sebuah system pengamatan teleskop radio rame-rame secara serentak, yang pasti juga menghasilkan data yang tidak main-main setiap malam.

SKA (Square Kilometer Array), system teleskop radio rame-rame yang digunakan untuk mengamati langit secara serentak bersama-sama. Image Credit: SPDO/Swinburne Astronomy Productions, Sumber: http://astrocompute.wordpress.com

Era media social seperti sekarang ini, setiap orang bisa menghasilkan data. Sejak bangun tidur sampai tidur lagi orang bisa menghasilkan data. Bangun tidur cek socmed, update socmed. Saat tidur-pun gadget terus mengupdate data.

Bagaimana pegelola mengelola data tersebut?. Bagaimana data tersebut disimpan dan bagaimana memanfaatkan data-data tersebut.

Sepertinya big data juga akan melanda sektor climate change. Sebagaimana kita tahu bahwa perubahan iklim tidak lepas dari data-data lingkungan. Data iklim dan data kondisi bumi dan sekitarnya. Bagaimana mengelola data ini sehingga menyebabkan kebermanfaatan data yang lebih luas. Bagaimana agar masyarakat luas bisa mendapat manfaat dari data iklim ini.

Ada juga apache hadoop, sebuah framework untuk mengelola data. ada juga HDFS, Hadoop Disrtibuted File System. Seperti apa semua system ini?

Jadi, apa itu big data? apakah kita terkena imbas oleh big data?… hmmm….

Pilihan Karir Masa Depan

Setelah melakukan pemikiran lagi tentang proyeksi masa depan, saya terbayang tentang langkah-langkah keputusan yang bisa saya ambil. Dalam hal ini saya akan berusaya melibatkan background pendidikan saya di bidang sains pada tingkat sarjana yaitu di bidang astronomi. Saya akan coba menggabungkannya dengan Teknologi Informasi. Ada celah yang ingin saya isi, yaitu penanganan data dalam sains atau sains data management atau dalam lingkup yang lebih luas yaitu teknologi informasi dalam sains.

Kalau Teknologi Informasi dalam industri atau bisnis sudah banyak sekali sampai ada vendor-vendor yang khusus menawarkan servis dan sertifikasi dalam pengelolaan informasi dalam industri yang tentu saja orientasinya adalah profit materi bagi perusahaan. Sertifikasi untuk menguasai service tersebut bisa mahal sekali dan memiliki bagian-bagian level tersendiri, isalnya tentang SAP, COBIT, ITIL, dll. Terus terang saya tidak ahli dalam istilah – istilah yang baru saya sebutkan tadi, hanya ada sedikit gambaran umum saja, jadi mohon maaf kalau salah, nanti akan saya cari lebih lanjut. Tapi dari contoh-contoh judul thesis dan karya ilmiah yang menggunakan tools tersebut, kebanyakan studi kasusnya untuk perusahaan, jadi hipotesis saya bahwa tools tersebut memang sejak awal didesain untuk keperluan industri. Walaupun bisa jadi tools tersebut bisa diaplikasikan untuk keperluan sains atau penelitian.

Lalu apa yang dimaksud keperluan sains. Ok, jadi gambaran saya adalah suatu system support untuk mengorganisir scientific information atau scientific data dalam sebuah institusi penelitian sehingga bisa memangatur aset sains yang berharga tersebut menjadi produk sains atau bahan-bahan informasi  dalam sebuah penelitian.

Sebenarnya sudah ada magister sains komputasi di ITB yang baru dibuka. Tetapi sepertinya fokus utama pendidikan tersebut lebih diarakan ke proses pengambilan kesimpulan sains berdasarkan metode ketiga dalam sains. Jadi ada satu metode baru selain teoritik dan eksperimen, yaitu metode komputasi. Salah satu metode yang digunakan adalah simualsi.  Seperti yang kita tau, metode saintifik kan kira-kira secara garis besarnya adalah dari identifikasi masalah-hipotesis-pengujian hipotesis-kesimpulan, walaupun bisa jadi kenyataannya bisa lebih kompleks. Nah, yang menjadi concern saya adalah bukan di metodenya tersebut, tapi dalam lingkup teknologi informasi yang lebih luas. Kalau ingat himpunan matematika, concern yang ingin saya pelajari adalah pada semesta himpunan yang lebih luas, yaitu pengorganisasian informasi secara keseluruhan menurut standar yang baku. Maksud saya baku adalah yang terstruktur, efisien, dan memberikan kontribusi dalam aktifitas sains.

Mimpi dan referensi saya sebenarnya muncul dari masuknya zaman pada era digital sekarang ini. Fenomena ini tentu saja ikut mempengaruhi pengelolaan aset sains berupa data-data saintifik yang semakin hari semakin bertambah banyak dan tidak terkontrol. Kalau saya pernah baca dalam sebuah paper astroinformatik, mereka menyebutnya data flooding. Mereka menyebutkan kalau data flooding ini terjadi di semua bidang sains. Saya ambil contoh dari bidang astronomi, data pengamatan dari sebuah teleskop survei yang aktif melakukan pengamatan, bisa menghasilkan data  beberapa Terabyte per hari. Bayangkan jika data ini tidak ditangani dan diatur secara sistematis, bisa jadi data ini ridak terkontrol dan kurang memberikan manfaat yang maksimal. Mereka juga menyebut sama untuk bidang-bidang sains yang lain. Saya pikir ada benarnya juga apalagi untuk keperluan yang lagi hangat seperti sekarang ini seperti climate change.

Saya pikir sekarang adalah titik kritis masalah ini di Indonesia. Saya sering mendengar keluhan tentang minimnya pengelolaan terhadap data-data nasional dalam berbagai workshop climate change. Saya juga mengalami hal ini ketika di Observatorium Bosscha, dimana dalam satu dekade lebih observatorium bosscha memasuki era ddigital dengan mulai merubah detektor-detektornya menjadi detektor digital, mssih belum mempunyai prosedur baku dalam menangani data digital. Berawal dari latar belakang ini saya akan memproyeksikan masa depan karir saya dibidang penanganan data saintifik tersebut.

Bandung, 09032013
1443 WordPress for Android in TPT