"veri bilimi" etiketli yazılar:

19 Ekim 2019 Cumartesi

Başkasının Verilerine İmrenme

Zaman buldukça, veri ve bilgi yönetimi konusundaki etkinliklere katılmaya çalışıyorum. Hem kendi bilgi birikimimi arttırmaya çalışıyorum, hem de bu konuda uzmanlarla tanışma fırsatı buluyorum.

Veriler gündemimize giddiği zaman başlayan, giderek artan bir hastalık olduğunu düşünmeye başladım. Başkasının verilerine imrenme hastalığı.


Not: Bu vesileyle, son zamanlarda katıldığım konferanslarda duyduğum bazı yeni (çoğunlukla cep telefonu ve sosyal medya bağlantılı) hastalıkları burada sıralayayım.

  • FOMO – fear of missing out “eyvah, bir şeyler kaçırıyorum” hastalığı
  • Nomofobi – “no mobile” korkusu – cep telefonundan uzak kalamama hastalığı
  • Mitomani – kendi söylediği yalana inanma hastalığı

Verilerle ilgili tutku ve hastalıklar yeni değil. Veri sarhoşluğu kavramıyla, 18 sene önce tanışmıştım.Veriyle neler yapılabileceğini gören birinin, “şunu da bulayım, bunu da modelleyeyim” diye temel amacı unutup veriden çıkamamasına deniyor.

Tıpkı derinlik sarhoşluğu… derinlikteki güzelliğe kapılıp oksijenin bitme zamanını unutması gibi…

😉

Başkasının verilerine imrenme hastalığını anlatayım.

Yıllardan beri bankacılar “kredi kartı bilgisinde nereden alışveriş yaptığı var ama ne aldığı yok” diye süpermarketlerin verilerne imrenirler.

Elin adamı ABD’de, sadece alışveriş yapılan yerlere bakarak 2 yıl içinde boşanacağını ve nafaka nedeniyle kredi borcunu ödeme güçlüğü çekeceğini modellemiş… Sen önce “mevcut verilerle yapılacaklar bitti” diyebilecek duruma gel; sonra başkasının verilerine imren.

Sanırım kimse bunu dile getirmiyor. Çoğunlukla “Ah o veriler bizde olsa…” diye yakınanları duyuyorum.

Bir başkasını geçen hafta duydum.

Büyük perakendecilerimizden birisinin pazarlama yöneticileri, telekom operatörlerine gidip dertlerini anlatmışlar.

1600 mağazaları varmış. Her sene 200 mağaza açıp, yine 200 civarında mağaza kapatıyorlarmış. “Artık mağaza yer seçiminde daha veriye dayalı düşünmeye karar vermişler

Artık “veriye dayalı düşünme” kararı vermeleri güzel. Alkışlıyorum. Ne var ki…

Yıllardan beri bin küsür mağazanız varken verileri toplamadınız, mağaza kapatıp açarken  varsayımları, gerekçeleri ve sonra da yanlış çıkan varsayımları sıralamadınız; geçmişe dönüp “nerede hata yapmışız” diye incelemediniz… şimdi de gidip telekom operatöründen yardım mı alacaksınız.

😉

Bir diğerini daha önce yazmıştım.

Büyük bankalarımızdan biri 400 bin TL vermiş ve telekom operatöründen veri satın almış. Teklifte bulunmuşlar. Verdikleri kredi bu rakamın %10’unu biraz geçmiş.  Krediden %3-5 kazandıklarını düşünürseniz, paranın havaya gittiğini hemen anlarsınız.

Sen ülkenin en büyük bankalarından birisin. Elindeki verilerle “en verimli olabilecek müşteri modeli” oluşturamamışsın. Bu konuda birkaç kere deneyler yaparak modeline ince ayar vermemişsin. Sonra ciddi bir serveti telekom operatörüne aktarmışsın.

Telekom operatöründen yardım istemeden önce “veriye dayalı düşünen” aklın neredeydi diye sormadılar mı?


Not: Telekom operatörlerinin büyüsüne yakalanan kurumlara şu yazıyı okumalarını öneriyorum.

  • GSM operatörleri, kendileri için bile anlamlı teklifler üretemezlerken, sizin için en iyisinin telekom verileri olduğuna nasıl karar veriyorsunuz.

Birçok kere yazdım. “Acemi nalbant komşu eşeğinde ustalaşır” atasözü, CRM için söylenmiş gibidir.

Başkasının verilerine özenenlerin çoğunluğu, kendilerinin ilk elden sahip olduğu verileriyle ustalaşmamışlardır.

.

17 Eylül 2019 Salı

Anlamlandırma ve Kişiselleştirme

Bunu alan şunu da aldı” algoritmalarının kişiselleştirme için yetersiz olduğunu nicedir anlatıyorum.

Geçenlerde Twitter’da Mustafa Dalcı’nın bir mesajını gördüm.

Bu tweet’in altında yorumlar ve yazışmalar oldu.

Ben de oldukça uzun bir tweet akışı yazdım. Burada, daha derli toplu tekrarlayacağım.

MBA öğrencilerimden birinin, sadece alışveriş  verilerini inceleyerek muhteşem bir isabetle müşteriyi bildiğini şuradan okuyabilirsiniz. Benim de küçük bir örneğim var.

  • Kendimize şunu sormalıyız. “Neden MBA’deki bir öğrenci – işi veri analizi değilken – bu kadar isabetli tahminler yapabiliyor ve modellenebilecek özellikleri saptıyor ama bankalar, telekomcular, süpermarketler, sigortalar, vb. bunları bilemiyor?

Bazı arkadaşlar, tweet’e yanıt olarak, “bu kurumların teknolojik alt-yapıları uygun değil” diye yanıtlamışlar. Maalesef yanılıyorlar. Bankaların, telekomcuların, süpermarket zincirlerinin elinde kişiselleştirmeyi düzgün yapacak teknoloji var. Bazılarının, istatistiksel analiz yazılımlarına yüzbinlerce dolar,  sadece “bunu alan şunu da aldı” (genelde “next best offer” deniliyor) yazılımlarına ve kampanya yönetim araçlarına milyon ABD doları ödediklerini iyi biliyorum. Bunlar Big Data konferanslarında neler anlatıyorlar

  • Onlarda eksik olan şey teknoloji değil. Veriyi içgörüye dönüştürmek için, insana gerek olduğunu ve teknolojinin yetersiz kaldığını bilmemeleri.

Siz arkadaşlarınızla bir konuda sohbet ediyorsunuz. Hemen sonrasında ilgili reklamları görmeye başlıyorsunuz. Sohbet edince, reklamın görülmesi (Google, Amazon, Facebook … işleri) ile banka, süpermarket, telekom, sigorta işleri farklı.

  • 24 saat yanınızda olan cihazın casusluğu ile alışveriş veya işlem verilerini kıyaslamak doğru değil. “Ellerinde yok” dediğiniz teknoloji, bence bu değil… ve zaten bu olmamalı.

E-ticaret’te veri anlamlandırma, geleneksel ticaret ile karşılaştırılamayacak kadar kolay. Daha önce [1] , [2] , [3] yazmıştım. E-ticaret işindekiler çoğunlukla basit modelleri kullanıp anlamlandırmayı ihmal ettiklerinden komik durumlara düşüyorlar… ya da anlamsız teklifler sunuyorlar.

Fırsat sitelerinin moda olduğu (bir ara 200’ün üstünde fırsat sitesi olduğu) dönemde, veri konusunda uyardığım girişimciler “şu anda kişiselleştirme için uğraşmaya gerek yok, en az 2 yıl daha böyle idare ederiz” diyorlardı. Bildiğiniz gibi, sadece birkaç tanesi ayakta kaldı.

  • Girişimciler çoğunlukla “exit” odaklılar. Ufuklarını “girişim değer kazanana kadar” diye belirlemişler. Veriye dayalı düşünme” disiplini, çoğunda yok.

😉

Eğitimlerimde, veri anlamlandırma konulu ilginç iki tane karikatürü kullanıyorum.

Birincisi bu:

İkincisi ise:

İşte bu nedenle, “veri anlamlanırma ustalık gerektirir” diyorum. Anlamlandırma teknolojinin değil, iş birimlerinin görevidir. Büyük kurumların ve e-ticaret girişimcilerinin atladığı da bu noktadır.

🙁

Ben son olarak şu deyişi ekleyeyim.

2-types-of-people-a

Dünyada iki tip insan vardır.
1) Eksik veriden anlam üretebilenler

😉

05 Haziran 2019 Çarşamba

Kendini “Veri Bilimcisi” sıfatlamak

Linkedin’de bir anket gördüm. “Veri ile çalışanlar anketi” diye isimlendirilmişti. Anketin arkasında bir girişimin ve bir öğretim üyesinin isimleri vardı.

Sosyal mecralarda yayınlanan anketleri ciddiye almam. Ama bir öğretim üyesinin adını görünce ciddiye aldım. Anketi inceledim. İlerleyemedim.

Öğrenim durumunuz?” sorusunu LİSE diye yanıtlıyorsunuz ve sonraki soruda “En son mezun olduğunuz alan/bölüm?” diye şu liste geliyor.

Anketi biraz daha inceledim.

Bugünün iş dünyasında en alt kademe dışında herkesin “veri ile çalışması gerektiğine” inanan ve bu konuda onlarca yazı yayınlamış biri olarak hem anketin adının, hem de kapsamının yanlış belirlendiğini gördüm.

Bunun üzerine Linkedin’de bu anketin yayınlandığı post’un altına şöyle yazdım.

Anket, araştırma yöntemlerini bilmeyen kişiler tarafından tasarlanmış. Sorular arasında büyük tutarsızlıklar var.

  • Veri ile çalışanlar anketi değil, veri ambarı sorumluları anketi haline gelmiş.
  • Son mezun olduğu okul LİSE olan biri, devamını nasıl dolduracak düşünülmemiş.

İlk 2 hücreyi doldurmuştum, devamına ilerleyemedim.

Unvanını “veri bilimcisi” (vb) olarak saptamış arkadaş ile şöyle yazıştık.

vb – “Bilmiyorum ama fikrim var.”
ben – Yazık
vb – “Bilmediğimi de bilmiyorum ama illa bişeyler söylemeliyim ki bilmediğim anlaşılmasın.”

İlk mesajımın anlaşılmadığını görünce daha ayrıntılı yazmak zorunda kaldım.

Bugünün iş dünyasında, hemen her orta-üst ve üst düzey, veri ile çalışır. Anketi düzenleyenler, sadece IT kökenliler için düzenlemişler.
Bu nedenle anketin adı “Veri ile çalışanlar” olmamalıydı.
2014 başında yayınladığım şu yazı, fikir geliştirmede yardımcı olabilir https://www.uzaktancrmegitimi.com/6509/2018-yilina-dogru

Sonra yazışma şöyle devam etti:

vb – Teşekkürler. Haklısınız işin teknik tarafı ile ilgilenenler için düzenliyorum anketi.
ben – Peki, yukarıdaki “Bilmiyorum ama fikrim var.” ve “Bilmediğimi de bilmiyorum ama illa bişeyler söylemeliyim ki bilmediğim anlaşılmasın.” cümlelerini nasıl yorumlamalıyım. Daha geniş anlatabilir misin lütfen?
vb – İç ses olmalı en azından.
ben – Kimin iç sesi?

Bu soruya uzun süre yanıt alamadım. Anladığım kadarıyla laf sokuşturma çabasında bir genç arkadaş var karşımda. (Yazışmanın devamı en altta… ama arayı okumadan son kısma geçmeyin.)

🙁

Bülent Eczacıbaşı bir konuşmasında “Hepimizin yaptığı bir hata vardır. İnsan tanımak Hemen hepimiz “insanı çok iyi tanıdığımızı” zannederiz. En büyük yanlışlardan biri “ben insanı gözünden tanırım” zannetmektir” demişti.

Bu hatayı sıkça yaparım. Sonra yanıldığımı anlarım. Yine aynı şey olmuştu.

🙁

İşin duygusal tarafını bir yana bırakayım ve araştırma yöntemlerinden bahsedeyim.

Önce KAPSAM (çerçeve) belirlenir. Kapsam, amaç ile tümden paralel olmalıdır. Bu ankette kapsam “veri ile çalışanlar” değil, “veri işlerinin teknik taraflarında çalışanlar” olmalıydı. Böylece, bugünün dünyasında orta yönetim kademelerinden başlayarak veri ile çalışan herkes değil, sadece teknik elemanların katılması sağlanırdı. Veri kirliliği engellenirdi.

Sonra soruların seçenekleri tutarlı olur. “Öğrenim durumunuz?” sorusunu LİSE diye yanıtlayana o seçenekler gösterilmez.

Seçenek hazırlarken de yapılacak önemli işler var.

  1. Bir yazılım şirketi sahibi arkadaşım var. İşletme doktorası yaptı. Verileri daha iyi anlamlandırmak için “antropoloji” doktorası yapmaya başladı. Bu arkadaşım ikinci doktorasından mezun olursa,  “En son mezun olduğunuz alan/bölüm?” sorusuna verecek yanıtı olmayacak. Seçenekler arasında işletme dışında sosyal bilimler yok.
  2. Normal lise mezunu bir genç girişimci arkadaşım var. İlk yazılımını 16 yaşındayken satmıştı. Telekom şirketlerine yıllarca tedarikçi olarak çalıştı. Veri güvenliği konusunda sayılı uzmanlardan biri. Bu anketin ilk 3 sorusunda tıkanıp kalır.
  3. Bu gibi konuları dışarıda bırakmamak ve anketi kurgularken varsayımlar dışındaki olası gelişmeleri anlamak için, mutlaka “Diğer” seçeneği eklenir. Yüzde bir, binde bir olasılık da olsa, “Diğer” mutlaka eklenmelidir.  (Bu “Diğer” seçeneği, araştırma yöntemleri dersinde sınıfta kalma / geçme çizgisidir.)

Bana hakaret eden “veri bilimcisi” olduğunu söyleyen arkadaşa şunları söylemek isterim.

  • Kapsam araştırmanın temelidir. Bunu açıkça belirlemeyen;
  • Seçeneklere “diğer” koymayı unutan;
  • Mesajı anlamak için hiç çaba sarfetmeyen;
  • Geri bildirim geldiğinde kök nedeni sorgulamadan tepki gösteren

kişi veri bilimcisi olduğunu iddia etmemeli.

🙁

Meraklısına, iletişimin devamı aşağıda:

Ben maalesef, insan konusunda yanılmakla ünlüyümdür.

🙁

8 Haziran 2019 tarihli EKLEMELER

Türkiye’nin büyük veri ile çalışan hemen her kurumuna “Pazarlamada Veri ve Büyük Veri Kullanımı” eğitimi verdim.

Benim işim veri ile çalışmak ve ben anketi dolduramıyorum.

😉

Tüm yöneticilerin veri ile çalışması gerekiyor. Ancak, bu genellemenin yanısıra;

  • CRM – Müşteri İlişkileri Yönetimi
  • CXM – Müşteri Deneyimi Yönetimi
  • Geri bildirim yönetimi
  • Dijital pazarlama – Kişiselleştirme

gibi konularda işi bizzat “veri ile çalışmak” olan çok sayıda “teknik olmayan” kişi var. Araştırmayı “Veri ile çalışanlar anketi” diye isimlendirmek yerine “verinin teknik taraflarıyla sınırlı olduğunu” belirten bir cümle eklenseydi, bu tartışma olmayacaktı.

.