Sketsa News
Home Analisis, Berita Terkini Text Analysis: Saracen vs Seword, Powered by Onta

Text Analysis: Saracen vs Seword, Powered by Onta

Sketsanews.com – Ketika isu Saracen muncul, banyak yang menuntut supaya pemerintah adil. Supaya juga mengevaluasi situs Seword.com, karena menurut mereka situs ini juga banyak menulis dengan judul dan isi yang bikin panas hati.

Drone Emprit kemudian memasukkan Saracennews.com dalam radar monitoringnya. Kalau Seword.com sudah lama dimonitor, bersama dengan media online lainnya seperti detik.comkompas.com, dll. Engine si Emprit yang powered by Onta ini telah mengharvest artikel-artikel yang disajikan di kedua situs tersebut. Setiap jam, jika ada artikel baru, akan diharvest dan dianalisis.

Karena Si Emprit tidak ingin masuk ke ranah opini yang spekulatif, di sini kita akan bandingkan isi dari kedua situs dengan metode berbasis analisis teks.

Metode Analisis Teks

Untuk menganalisis, ada dua proses yang digunakan. Pertama, Automatic Term Recognition atau sering disingkat ATR. Silahkan cari di Google Scholar untuk paper2 terkait metode ini. Intinya, ATR ini akan mendeteksi topik atau term penting dari setiap artikel.

Proses kedua adalah Text Clustering. Sama dengan di atas, bisa dicari di Google scholar bagi yang minat. Tujuan dari proses ini adalah, mengelompokkan artikel berdasarkan kemiripan content. Dengan begini, kita bisa tahu cluster mana yang paling banyak artikelnya, yang berarti paling dominan, hingga cluster yang paling kecil.

Ketika kedua proses di atas digabungkan, maka kita bisa memberi nama setiap cluster dengan nama topik atau term yang sedang dibicarakan oleh cluster tersebut.

Experiment

Sekarang kita jalankan eksperimen. Drone Emprit selanjutnya mengambil 500 sd 1000 artikel terbaru dari setiap situs. Lalu, melakukan proses term extraction dan text clustering, untuk melihat apa sih narasi yang paling banyak dan paling sering dibahas oleh masing-masing situs.

Hasil

Bagaimana hasilnya? Agar mudah dibaca, hasil dari rangkaian proses di atas ditampilkan dalam peta yang sering disebut sebagai TreeMap. Cara membacanya, topik yang memiliki luas kotak paling besar berarti memiliki jumlah artikel terbesar. Artinya, topik itu yang paling populer. Lalu diikuti oleh kotak-kotak yang semakin ke kanan semakin kecil, yang menunjukkan topik-topik yang semakin kurang populer.

Saracennews.com menampilkan topik-topik berikut sebagai topik utamanya: Danpal Divif, Yonif Mekanis, Danyonif Raider, Yonif Para Raider, Measles Rubella, Asics Relay Run, dst. Bisa dilihat di gambar 1. Kalau dibuat statistik, dari semua kotak, kita bisa simpulkan 15 kotak tentang Kostrad, 5 kotak tentang artis, 3 tentang isu lingkungan, dan 3 tentang Polisi. Jadi situs ini sebenarnya membosankan, karena lebih banyak cerita tentang Kostrad dan aktifitas positifnya.

Seword.com menampilkan topik-topik berikut sebagai topik utamanya: Saracen, Sayang, Jokowi, Anniesa, First Travel, Fadli Zon, Venesia, dst. Bisa dilihat di gambar 2. Saya tidak membuat statistik khusus mengingat isunya sangat beragam, namun bisa dilihat situs ini banyak mengangkat topik tentang Jokowi, isu terbaru dan terkini (misal sekarang Saracen dan First Travel), Agama/GNPF, DPR dan anggotanya.

Pilihan kata yang sering digunakan di dalam judul oleh Saracennews relatif kurang menjual. Misalnya, perbaiki senjata, kejurda, acara puncak, bersihkan selokan, bhakti sosial, dll.

Sedangkan pilihan kata yang sering digunakan Seword lebih menarik dan menyentil. Misalnya: sosok kesatria, benci, pecah kongsi, teroris, teriakan Allahu Akbar, jontor, cari duwit, manipulator, ajegilee, enak, dll.

Kesimpulan

Kalau hanya melihat artikel-artikel dari situs Saracennews.com saja, tampaknya situs ini malah pro terhadap lembaga pemerintah, dalam hal ini Kostrad dan Polri. Situs ini banyak memberitakan kegiatan-kegiatan positif dari lembaga tersebut.

Namun, tentunya Polri punya data lain yang bisa dijadikan alasan untuk memasukkan Saracennews.com dalam aktifitas so called sindikat Saracen. Data ini Drone Emprit ndak punya.

FB. Ismail Fahmi

 

(in)

%d blogger menyukai ini: