Veri Madenciliği Nedir? Süreçleri Nelerdir?

Veri Madenciliği konusunun önemi günümüzde giderek artmıştır. Teknolojinin hızla ilerlemesi ile birlikte şirketlerde büyük veriler üzerinde çalışmalar yapmaktadır. Bu büyük verilerden anlamlı, yararlı bilgi dönüşümü yapmak oldukça zordur. Bu doğrultuda, büyük ölçekli veri yönetimi için “veri ambarı” ve bu veriyi çözümleme sürecine “veri madenciliği” kavramları ortaya çıkmıştır.

Veri Madenciliği Nedir? Süreçleri Nelerdir?

Veri madenciliği nedir nasıl yapılır konusu genel bir ifadeyle veri tabanında bilgi keşfine denir. Veri ambarında kayıtlı olan büyük ölçekli veriler içerisinden “önceden bilinmeyen” ya da “değerli olan” bir bilgiyi elde etmeye “veri madenciliği” denir.

Veri Madenciliği Süreçleri

  • Konunun Belirlenmesi: Veri madenciliğinin verimli bir şekilde sonuç alınabilmesi için, konunun araştırılarak çok iyi şekilde tanımlanması gerekir.
  • Veri Elde Etme Süreci: İşletmenin veriyi elde etme aşamasında çeşitli sorgulama yöntemlerine başvurulmasıdır.
  • Veri Ön İşleme Süreci: Veriyi analize hazırlarken dikkat edilmesi gereken en önemli noktadır. İşlenmemiş verinin verimliliğini arttırması için “ön işleme” aşamasından geçmektedir. Buradaki amaç bozuk ve tutarsız verilerin yok edilmesi ve iyileştirilmesidir. Bu nedenle bu veri üzerinde sırasıyla temizleme, bütünleştirme, indirgeme ve dönüştürme işlemleri gerçekleştirilir.
  • Verinin Veri Ambarına Aktarılması: Ham verinin büyük veriler haline dönüşme sürecidir.
  • Veri Madenciliğinin Gerçekleşmesi: Verileri yığınları içerisindeki bilgi keşfi.
  • Elde Edilen Sonuçların Değerlendirilmesi ve Sunum Şeklinde Belirlenmesi: Veri madenciliğinin oluşmasının ardından sonuçların karar vericilere sunulması gerekir.
  • Kararların Uygulanması: Onaylanan kararın uygulamaya koyulması.
Veri Madenciliği Süreçleri

Veri Madenciliği Kümeleme Nedir?

Kümeleme yönteminin amacı heterojen olan ana kütleyi homojen kümelere ayırmaktır. Diğer bir deyişle karmaşık olan verilerin anlamlı bilgi çıkmasına denir. Veri tabanında verinin kümeye ayrılması esnasında, benzerlik ve uzaklık kavramlarından yararlanılır. Kümeleme yöntemi, görüntü işleme, örüntü tanıma, pazar bölümleme, istatistik astronomi gibi pek çok alanda kullanılır.

Veri Madenciliği Maaşı

İşe yeni başlayan henüz fazla tecrübe olmayan kişiler için 2500-5000 arası değişiklik gösterir. Tecrübe edinmiş kişiler için bu maaş 7.000 TL’dir.

Veri Madenciliği Yöntemleri

Bu konuda birçok yöntem ve algoritma geliştirilmiştir. Bu yöntemler iki sınıf altında incelemek mümkündür.

  • Tahmin Edici Modeller
  • Sınıflandırma: Yeni bir nesnenin özellikleri incelenerek, bu nesneyi özelliklerine uyan ve önceden tanımlanmış bir sınıfın içine atamak. Örneğin; bir bankaya kredi başvurusu için giden bir kişi.
  • Regrasyon: Verilerin değişkenler arası ilişkilerin kontrol edilmesi.
  • Tanımlayıcı Modeller
  • Kümeleme: Karmaşık verilerin özellikleri birleştirilerek anlamlı hale gelmesine denir. Örneğin; mağazalara gelen farklı müşterilerin keşfedilmesi.
  • Birliktelik Analizi: Büyük veriler arasındaki ilginç ilişkileri açıklar. Örneğin; marketteki müşterilerin veri tabanındaki kaydı.

Örnekler

Veri madenciliği örnekleri ilk olarak web sitesi yöneticileri örnek verilebilir, çünkü yöneticiler web sitelerini iyileştirmektedirler. Kullanıcıların sayfaya tıklama oranları, geçirilen süreleri, alışkanlıkları ve davranış analizleri veri madenciliğine verilecek en iyi örneklerden birisidir.

Önerilen İçerik: Kişisel Verilerin Korunması Neden Önemlidir?

Veri Madenciliği Uygulama Alanları

Uygulama alanları pazarlama, borsa, sigorta, sağlık, bilim, müşteri ilişkileri vs. gibi birçok alanda araç olarak kullanılmaktadır.

Veri Madenciliği Uygulama Alanları

Sektörlere göre uygulama alanları aşağıdaki gibidir.

  • Sağlık Alanında: Tanı koymak için karar destek sistemleri olarak
  • Pazarlama Alanında: Yeni müşteriler elde etme yöntemlerinin belirlenmesi, müşterilerin talep değişikliklerinin belirlenmesi, müşterileri satın alma davranışlarına göre sınıflandırılması, riskli müşterilerin belirlenmesi ve satış tahminlerinin yapılması gibi örnekler verilebilir.
  • Bankacılık Alanında: Kredi kartı dolandırıcılık tespiti, çapraz satış tekniklerinin belirlenmesi, hilelerin tespit edilmesi şeklinde olabilir.
  • Sigortacılık Alanında: Sigorta dolandırıcılıklarının tespiti, riskli müşterilerin tespiti ve poliçe talep edecek müşteri tahmini.
  • İnsan Kaynakları Alanında: Doğru kişilerin seçilmesi, iş gücü planlaması ve çalışanların mevcut yeteneklerinin tespit edilerek, geliştirme yöntemlerinin belirlenmesi.

Rapidminer

Rapidminer programının amacı veri madenciliğinin tüm adımlarını destekler. Ücretsiz olarak kullanılabilmektedir. Bu programın dışında veri madenciliği işlemlerini destekleyen diğer programlar ise, weka, tableau, knıme şeklinde örnek verilebilir.

Photo of author

Bilir Kişi

"Takdir ediliyorsanız değil taklit ediliyorsanız başarmışsınız demektir." - Einstein Profesyonel işbirlikleriniz için bilirkisi[at]webdeyazilim[.]com adresime mail gönderebilirsiniz.

Yorum yapın