Tiba-tiba saya penasaran, bagaimana caranya mengindex semua informasi yang disimpan dalam sebuah storage. Digital storage…
Dalam sebuah lembaga, ada bagian-bagian yang saling terpisah antara satu dengan yang lain. Tiap-tiap bagian bisa menghasilkan dokumen sendiri-sendiri yang disimpan dalam storage terintegrasi. Dokumen itu berupa file-file yang berupa text, gambar, video, software, dll.
Yang membuat saya penasaran adalah bagaimana memanfaatkan dokumen-dokumen tersebut untuk keperluan lembaga/organisasi secara keseluruhan. Bagaimana mencari dan mengelompokkan dokumen tersebut dengan singkat, padat, dan cepat, lebih cepat dari rate bertambahnya jumlah dan jenis dokumen. Bagaimana data tersebut bisa dimanfaatkan untuk keperluan capacity building.
Mungkin idenya seperti google, tapi yang diindex adalah data private yang tersimpan dalam storage organisasi atau lembaga tertentu.
Apa ini bisa dilakukan dengan konsep “Big Data” ya? dengan metode MapReduce dan framework hadoop-nya? hmmm…. mari kita cari tahu…:)