Veri Madenciliği
Veri Madenciliği Nedir?
Veri madenciliği, büyük miktarlardaki verinin içinden, geleceğin tahmin edilmesinde yardımcı olacak anlamlı ve yararlı bağlantı ve kuralların bilgisayar programlarının aracılığıyla aranması ve analizidir. Diğer bir tanıma göre de çok büyük miktardaki verilerin içindeki ilişkileri inceleyerek aralarındaki bağlantıyı bulmaya yardımcı olan ve veri tabanı sistemleri içerisinde gizli kalmış bilgilerin çekilmesini sağlayan veri analizi tekniğidir (Savaş, Topaloğlu, Yılmaz, 2012).
Pek çok şirket müşterileri, ürünleri, işlemleri ve pazarları konusunda oldukça büyük bir veriye sahiptir. Özellikle bankacılık, telekomünikasyon, e-ticaret gibi pek çok verinin depolandığı bilgi yoğun alanlarda veri baskısı bir sorun haline gelmiştir. Bu verilerden değer elde etmek ve müşteri istihbaratına ulaşmak için veri madenciliğine ihtiyaç duyulmaktadır.
Veri madenciliği sürecinde izlenen adımlar aşağıdaki şekilde belirtilmiştir:
Şekil 1: Veri madenciliği süreci (Kumar, Reinartz, 2018)
Veri madenciliğinde kullanılan modeller, tahmin edici (Predictive) ve tanımlayıcı (Descriptive) olmak üzere iki ana baslık altında incelenmektedir. Tahmin edici modellerde, sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçlan bilinmeyen veri kümeleri için sonuç değerlerin tahmin edilmesi amaçlanmaktadır. Tanımlayıcı modellerde ise, karar vermeye rehberlik etmede kullanılabilecek mevcut verilerdeki örüntülerin tanımlanması sağlanmaktadır.
Veri madenciliği modelleri gördükleri işlevlere göre ise, temel olarak 3 grupta toplanmaktadır.
Bunlar:
- Sınıflama (Classification) ve Regresyon (Regression),
Sınıflama ve regresyon, önemli veri sınıflarını ortaya koyan veya gelecek veri eğilimlerin tahmin eden modelleri kurabilen iki veri analiz yöntemidir. Sınıflama kategorik değerleri tahmin ederken, regresyon süreklilik gösteren değerlerin tahmin edilmesinde kullanılır. Bir sınıflama modeli banka kredi uygulamalarının güvenli veya riskli olmalarını kategorize etmek amacıyla kurulurken, regresyon modeli geliri ve mesleği verilen potansiyel müşterilerin bilgisayar ürünleri alırken yapacakları harcamaları tahmin etmek için kurulabilir.
2- Kümeleme (Clustering),
Kümeleme, veriyi sınıflara veya kümelere ayırma işlemidir. Kümeleme veri madenciliği, istatistik, biyoloji ve makine öğrenimi gibi pek çok alanda kullanılır. Sınıflama modelinde, verilerin sınıfları bilinmekte ve yeni bir veri geldiğinde bu verinin hangi sınıftan olabileceği tahmin edilmektedir. Kümeleme modelinde ise, sınıfları bulunmayan veriler gruplar halinde kümelere ayrılırlar. Bazı uygulamalarda kümeleme modeli, sınıflama modelinin bir önişlemi gibi görev alabilmektedir. Şehir planlanmasında evlerin tiplerine, değerlerine ve coğrafi konumlarına göre gruplara ayılması gibi uygulamalar kümeleme uygulamalarıdır.
3- Birliktelik Kuralları (Association Rules)
Birliktelik kuralları, büyük veri kümeleri arasında birliktelik ilişkileri bulurlar. Toplanan ve depolanan verinin her geçen gün gittikçe büyümesi yüzünden, şirketler veri tabanlarındaki birliktelik kurallarını ortaya çıkarmak istemektedirler. Büyük miktardaki mesleki işlem kayıtlarından ilginç birliktelik ilişkilerini keşfetmek, şirketlerin karar alma işlemlerini daha verimli hale getirmektedir. Birliktelik kurallarının en çok kullanıldığı örnek market sepeti uygulamasıdır. Bu işlem, müşterilerin yaptıkları alışverişlerdeki ürünler arasındaki birliktelikleri bularak müşterilerin satın alma alışkanlıklarını analiz eder.
Sınıflama ve regresyon modelleri tahmin edici, kümeleme ve birliktelik kuralları modelleri tanımlayıcı modellerdir. (Özekes,2003)
Kaynak:
- Serkan Savaş, Nurettin Topaloğlu, Mithat Yılmaz, Veri Madenciliği ve Türkiye’deki Uygulama Örnekleri, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi Yıl:11 Sayı: 21 Bahar 2012 s. 1-23
- Kumar V., Reinartz W. (2018) Data Mining. In: Customer Relationship Management. Springer Texts in Business and Economics. Springer, Berlin, Heidelberg
- Serhat Özekes, Veri Madenciliği Modelleri ve Uygulama Alanları, İstanbul Ticaret Üniversitesi Dergisi, 2003-06
Sinem ÖZDEMİR DURMUŞLAR
Uzman
Yenilik ve Girişimcilik Politikaları Birimi
sinem.durmuslar@izka.org.tr