Pada diagram lingkaran, menunjukkan ada missing value pada kolom timestamp_log dan pesan_log. Terdapat 17% data missing value dari keseluruhan data. Dari segi presentase data missing value, kolom dan baris tempat missing value, dan tipe data missing value, maka untuk missing value kami putuskan untuk drop semua data.
Visualisasi data setelah cleaning dapat dilihat pada pie chart disamping kanan.
Dapat dilihat pada visualisasi diagram atas, presentase data duplikat sangat kecil 0,6%. maka untuk data duplikat kita hapus. Pada diagram bawah menunjukkan bahwa kondisi data sudah bersih dari data duplikat
Ini menunjukkan bahwa kandidat mahasiswa baru lebih banyak menyelesaikan jenis tes Penalaran Matematika, Bidang Studi, dan Kemampuan Bahasa Inggris. Sedangkan lebih sedikit yang menyeselesaikan jenis tes Kemampuan Visual Spasial dan Literasi Bahasa Indonesia
Pada grafik tersebut dapat disimpulkan bahwa banyak kandidat mahasiswa baru memiliki preferensi pengerjaan tes saat weekday ( Senin - Kamis), sedangkan saat weekend (jumat-minggu) jumlah peserta mengerjakan tes cenderung rendah terutama pada hari Minggu.
Para peserta memiliki preferensi waktu pengerjaan tes pada malam hari dan pagi hari. Disamping itu hanya sedikit peserta mengerjakan pada dini hari.
Dapat dilihat pada grafik bahwa :
Terdapat korelasi negatif yang cukup kuat antara jumlah tes dimulai dan rasio tingkat penyelesaian (-0.505383). Hal ini dilihat dari trend lines yang menurun dari kiri atas ke kanan bawah, dan distribusi titik data yang mendekati trend lines.
Ini menunjukkan bahwa semakin banyak jumlah tes yang diikuti oleh calon mahasiswa, semakin rendah rasio tingkat penyelesaian (rasio antara tes yang diselesaikan dan jumlah tes dimulai), dan begitupun sebaliknya.
Terdapat korelasi positif yang kuat antara jumlah tes dimulai dan jumlah tes selesai
(0.826707). Hal ini dilihat dari trend lines yang menaik dari kiri bawah ke kanan atas, dan distribusi titik data yang mendekati trend lines.
Ini menunjukkan bahwa semakin banyak jumlah tes yang diikuti oleh peserta, semakin banyak pula jumlah tes yang diselesaikan peserta, dan begitupun sebaliknya.
Pada grafik tersebut menunukkan rata-rata durasi pengerjaan tes berdasarkan jenis tes yang peserta kerjakan. Dapat dilihat bahwa jenis tes Literasi Bahasa Indonesia memiliki rata-rata durasi paling lama disusul dengan jenis tes Bidang Studi, Penalaran Matematika dan Kemampuan Bahasa Inggris. Sedangkan pada jenis tes Kemampuan Viusal Spasial memiliki rata-rata durasi pengerjaan paling rendah.
Artinya jenis tes Literasi Bahasa Indonesia memiliki tingkat kesulitan paling tinggi dibandingkan jenis tes yang lain, dan Exam.inate diharapkan memberikan waktu pengerjaan yang lebih lama pada jenis tes tersebut.