En iyi teklif (sss-3)
Bugünlerde blogum, Rambo veya Polis Akademisi gibi dizi şekline döndü. Birbiri ardından 2’inci ve 3’üncü kısımları yayınlıyorum. Bazılarının devamı da gelecek…
🙂
Çeşitli röportajlarda sorulanlara arada bir değineceğimi sss-1‘de belirtmiştim. (Başlıkta gördüğünüz SSS = “sıkça sorulan sorular” anlamına geliyor.)
Melih Bahadır Varol şu soruyu sordu (kendisinin izni ile paylaşıyorum):
- Bankalar kredi kartı harcamalarına göre insanların ne harcadıklarını görebiliyorlar ve bir istatistiğe ulaşıyorlar. Varsayalım şöyle bir istatistik çıktı:
“A markasını sürekli olarak tüketenlerin %60’ı B markasını da sürekli tüketiyorlar.”
A ve B ürününün tamamlayıcı bir ürün olmadığını varsayalım. Makyaj ve Süt markası olsunlar.
B markası için, A markasını kullanan ama B markasını kullanmayan %40’lık kesim müşteri olma potansiyeli yüksek kişilerdir diyebilir miyiz?
Yanıtı oldukça uzun.
Verilen örnek üzerinden gidersek, CRM sadece bir yazılım diye anlaşıldığı zaman bu “B markası için, A markasını kullanan ama B markasını kullanmayan %40’lık kesim müşteri olma potansiyeli yüksek kişilerdir” diyebilenler çıkıyor. Ama CRISP-DM (Cross-Industry Standart Process for Data Mining) kurallarına bakmak gerek.
- Mesajımın en altına (ilgilenenler için) CRISP-DM konusunda Türkçe bir yazı ekledim. (Bunu bulduğum kaynağı maalesef hatırlamıyorum. Büyük ihtimalle bir devirler birlikte iş yaptığımız SPSS-Türkiye’nin sitesinden veya yöneticilerinden almışımdır.)
Gelelim sorunun doğrudan yanıtına… Bunca kuramı bir yana bırakır ve CRISP-DM’i hayatın gerçeğinde açıklamak istersek…
Verinin ne gösterdiğinden daha önemlisi, veriyi anlamaktır. Aynı bağımsız değişkene bağlı hareket eden 2 tane bağımlı değişken olabilir.
En bilinen örneği, “dondurma tüketiminin çok olduğu yıllarda boğulanların da çok olması” gerçeğidir. Buradan, dondurma yiyenler boğuluyor anlamı da çıkarılabilir. Oysa, havaların sıcak olduğu yıllarda, denize girenlerin sayısı artıyor. Boğulanların oranı aynı kalsa da, denize girenlerin sayısı arttığı için boğulanların sayısı da artıyor. Havalar sıcak olduğunda dondurma tüketimi de artıyor. Özetle, birbirinden bağımsız iki değişken, (boğulanlar ve dondurma yiyenler) ortak bir değişkene bağlı hareket ettiği için aralarında bağlantı (korelasyon) var gibi görünüyor.
Yukarıdaki örneğe gelirsek, makyaj ve süt markası kullanımı için, “anne olanlar” gibi bir bağımsız değişkene bağlı olabilirler. Bu durumda, ortak özelliklerin yüzdesel oranı ile yetinilmez. Bir adım daha ilerlemek gerekir. Verilere bakarak, bu %60 içindeki en çok rastlanan ortak özelliklere (kadın, çocuklu, çocukların yaşı 5’den küçük, vb… gibi değişkenlere) bakılır. Bu ortak özelliklerin hepsine sahip olan kişilerin de “müşteri olma potansiyeli yüksek kişiler” olacağını söylemek mümkün.
Muhtemelen kalan %40 değil, onun içindeki ortak özellikleri olan %5 – 8 için iyi bir öneri olabilir.
😛
Yazı burada bitti…
😀
Meraklısı için CRISP-DM
VERİ MADENCİLİĞİ – SÜREÇ MODELİ
Süreç modeli, veri madenciliği projesinin hayat döngüsüne genel bir bakış sağlar. Projenin birbirini takip eden aşamalarını, her aşamanın kendine ait görevlerini ve bu görevler arasındaki ilişkileri kapsar. Bu tanımlama aşamasında bütün ilişkileri belirlemek mümkün değildir. Bütün veri madenciliği görevlerinde amaçlara, geçmişte yapılanlara, kullanıcının yararına ve en önemlisi veriye dayanan ilişkiler vardır.
CRISP-DM Version 1.0 Süreç Rehberi ve Kullanım Klavuzunun elektronik kopyasını ücretsiz olarak temin edebilirsiniz. Burada Veri Madenciliği Sürecinin her aşaması için adım adım talimatlar, görev ve amaçlar yer almaktadır.
Veri Madenciliği projesinin hayat döngüsü 6 aşamadan oluşur. Aşamalar çok katı bir sıralama izlememektedir. Her zaman aşamalar arasında geriye ve ileriye hareketlilik gerekmektedir. Hareketlilik, her aşamanın sonucunda bundan sonra hangi aşamanın ya da aşamadaki hangi işin yapılması gerektiğine bağlıdır. Oklar, aşamalar arasındaki sıkça gerçekleşen en önemli bağımlılıkları göstermektedir.
Şekilde dıştaki üçgen veri madenciliğinin döngüsel doğasını sembolize etmektedir. Bir veri madenciliği süreci bir çözüm uygulandıktan sonra devam eder. Süreç sırasında öğrenilen dersler, işle ilgili yeni ve çoğunlukla daha odaklanmış soruların tetikleyicisi olur. Takip eden veri madenciliği süreçleri , bir öncekilerin tecrübelerinden faydalanır.
Aşağıda süreçlerin kısa bir özeti yer almaktadır:
İş’i Anlamak
Bu ilk aşama proje amaçlarını ve şartlarını işe yönelik bakış açısıyla anlamaya ve daha sonra bu bilgiyi veri madenciliği problem tanımına çevirmeye odaklanır. Amaçları gerçekleştirmek için bir başlangıç planı hazırlanır.
Veri’yi Anlamak
Veri’yi Anlama aşaması ilk veriyi toplama ile başlar ve veriye aşina olma, veri kalitesi ile ilgili problemlerin belirlenmesi, verideki ilk anlamları farketme ya da gizlenmiş bilgiye hipotez oluşturmak için ilginç altkümeleri belirleme aktiviteleri ile devam eder.
Veri Hazırlığı
Veri Hazırlığı aşaması ham veriden, en son veri setini ( modelleme araç(lar)ına gönderilecek veri) oluşturma aktivitelerinin hepsini kapsar. Veri hazırlama işleri genelde bir kaç kere ve düzensiz bir sırayla yapılır. İşler tablo, kayıt ve özellik seçimi ile modelleme araçları için verinin dönüştürülmesi ve temizlenmesini içerir.
Modelleme
Bu aşamada, farklı modelleme teknikleri seçilir ve uygulanır ve parametreleri optimum değerlere ayarlanır.Tipik olarak aynı veri madenciliği problem türü için bir kaç teknik vardır. Bazı teknikler verinin formu için belli şartlar gerektirir. Bu nedenle çoğunlukla veri hazırlığı aşamasına dönmek gerekmektedir.
Değerleme
Projenin bu aşamasında veri analizi bakış açısıyla bakıldığında, kaliteli görünen bir model (ya da modeller) inşa ettiniz. Son aşama olan uygulama aşamasına geçmeden, modeli baştan aşağı değerlendirmek ve iş amaçlarını tam olarak yerine getirdiğinden emin olmak için modeli oluşturuken uygulanan adımları gözden geçirmek önemlidir. Başlıca nokta önemli iş konularının yeterince dikkate alınıp alınmadığının kontrol edilmesidir. Bu aşamanın sonunda veri madenciliği sonuçlarının kullanımı ile ilgili bir sonuca varılmalıdır.
Uygulama
Modeli oluşturmak genelde projenin sona erdiği anlamına gelmez. Modelin amacı verinin bilgisini, değerini arttırmak olsa da, elde edilen bilgi müşterinin kullanabileceği şekilde düzenlenmeli ve sunulmalıdır. Şartlara bağlı olarak uygulama aşaması, rapor üretmek kadar basit ya da tekrarlanabilen veri madenciliği süreci oluşturmak kadar karmaşık olabilir. Çoğu zaman uygulama adımlarını yürüten kişi data analisti değil müşteridir. Uygulamayı analist yürütmeyecek bile olsa, müşterinin yaratılacak modellerden faydalanmak için hangi adımları atması gerektiğini anlaması önemlidir.
*
(Kaynak: Yukarıda da yazdığım gibi maalesef hatırlamıyorum. Büyük ihtimalle bir devirler birlikte iş yaptığımız SPSS-Türkiye’nin sitesinden veya yöneticilerinden almışımdır.)
😛
Etiketler: anlamlandırma, CRM, müşteri, müşteri kazanımı, teklif, veri anlamlandırma
Kategori: CRM
22 Mayıs 2009
9:34 pm
CRM ve/veya “Veri madenciliği” ile ilgilenenler, yukarıdaki e-posta adresine mesaj atarlarsa, SPSS tarafından hazırlanmış olan CRISP-DM prensipleri “word” dosyasını kendilerine gönderebilirim
17 Ağustos 2009
10:58 pm
SSS = Sıkça sorulan sorular.
12 Eylül 2009
11:45 am
[…] Kendisine, verileri inceleyerek müşterinin ailesi, içinde bulunduğu yaşam evresi hakkında yeterli fikir sahibi olunacağını anlattım. Hem işi hem de veriyi anlıyorsanız… […]
2 Ocak 2010
9:25 am
Veri’yi bilmek yetmez. Öncelikle işinizi bilecek ve anlayacaksınız. Aksi takdirde, bu link’deki gibi büyük hatalar yaparsınız.
5 Mayıs 2011
7:39 am
Devrim Demirel’den, veri kullanarak geleceği tahmin üzerine bir yazı.