Çevresel Veri Problemleri için Veri Madenciliği ile Veri Ön İşleme

Abstract
Atık yönetiminin yapıldığı çevresel tesislerin kontrolünde gerçekçi modellere ve doğru tahminlere ihtiyaç vardır. Doğru tahmin modelinin geliştirilmesinin en önemli adımı sağlıklı verin olmasıdır. Çevresel tesislerden temin edilen verilerin ön işlem aşamasında kalitesiz verilerinin temizlenmesi ve eksik verilerin tamamlanması gerekmektedir. Bu çalışmada bir çevresel tesisten Ocak 2016 - Eylül 2018 tarihleri arasında toplanan verilerden veri madenciliği programı ile modelleme öncesi temiz verilerin elde edilmesi hedeflenmiştir. Verilerin temizlenmesi aşamasında; pH, Eİ, AKM, KOİ, BOİ5, Yağ-Gres ve TÇK parametrelerine ait sırasıyla 25, 141, 26, 22, 241, 645 ve 688 adet eksik veri tespit edilmiştir. Eksik veriler ortalama değerler göz önüne alınarak tamamlanmıştır. Sonrasında 10 adet gürültülü veri belirlenmiş ve satır bazlı temizleme yapılmıştır. Sezonluk ortalama değerlerin belirlenmesi için BOİ5 parametresi kullanılmış ve sezonluk ortalama değerler program aracılığı ile hesaplanmıştır. Böylece bir çevresel tesisin ham verilerinin veri madenciliği programları yardımı ile temizlenmesi ve eksik verilerin tamamlanarak modelleme uygulanması için hazır hale getirilmesi sağlanmıştır.