Ceritanya kita sedang ingin mengkonversi dokumen dari Microsoft Word ke clean html agar bisa dibuka di browser secara efisien.
Kenapa harus dikonversi dan kenapa harus clean?
Sebenarnya Ms Word menyediakan feature untuk menyimpan langsung kedalam format html, tatapi hasil simpanan dokumen tersebut, walaupun bisa dibuka di browser, memiliki kode html yang terlalu boros dan banyak kode yang sebenarnya kurang diperlukan.
Dokumen yang disimpan langsung dari Ms. Word, memiliki kode format bawaan Ms Word. Kode ini kadang tidak kompatible dengan browser-browser yang biasa digunakan oleh pengguna internet. Sehingga, tampilan yang dihasilkan tidak menunjukkan tampilan yang seragam antara browser satu dengan yang lain.
Sedangkan dokumen yang disimpang dengan clean html akan memberikan tmpilan yang lebih seragam antara satu browser dengan browser yang lain. Ini disebabkan oleh kode atau script yang tertulis lebih murni html (tanpa embel-embel kode dari Microsoft yang hanya dimengerti oleh Microsoft sendiri) dan lebih sesuai dengan standar penuslisan html.
Untuk keperluan konversi ini, saya pakai tool online di http://word2cleanhtml.com/. Dokumen html yang dihasilkan lebih clean tanpa embel-embel kode Microsoft. Kekurangannya ada sedikit bagian yang perlu dikoreksi pada hasil konversinya, seperti bullet yang kurang seragam. Tetapi secara keseluruhan sangat memuaskan.