1 Nisan 2019 Pazartesi

Veri Bilimi ve Büyük Soru

Veri bilimci olmak için, iş süreçlerini bilmek, sahada olan biteni anlamak ve bilançoya ve/veya stratejiye katkıda bulunacak içgörüleri geliştirmek gerektiğinden bahsetmiştim.

Bu yazıdaki şema konusunda sosyal mecralarda değil, doğrudan mesajlarda (DM) sıkı tartışmalar oldu. İş sonuçları (bilanço veya strateji) ile, hatta veri anlamlandırma ile pek ilgilenmeyen birkaç genç teknolog “İş sonuçları filan ayrı konular. Eğer makine öğrenmesi, yapay zeka, veri görselleştirme yoksa, veri bilimi yoktur” noktasında ısrarcı oldular. Hatta, “bu yazıdaki veri bilimci tanımının bana özel olduğunu” savundular.

😉

Airbnb’nin ilk zamanlarında işe başlayan veri bilimcisi Riley Newman’ın çok beğendiğimi daha önce vurguladığım yazısında bu konuda güzel ipuçları var.

Diyor ki:

Bir veri, bir hareketin veya etkinliğin kaydıdır; çoğunlukla bir kişi tarafından verilen bir kararın yansımasıdır. Eğer bu karara yönlendiren etkinliklerin sırasını oluşturursan, bundan ders alabilirsin; bu müşterilerin neleri sevip nelerden hoşlanmadıklarını söylemlerinin dolaylı yoludur

Veri bilimi bir yorumlama işidir – müşterinin sesini karar vermeye daha uygun bir duruma tercüme ederiz.

Biz aslında karar verme işindeyiz ve şirket silolaşınca bu işi başarıyla yapamadığımızı öğrendik. İş ortağı ekipler bizimle nasıl etkileşimde bunulacaklarını anlamadılar ve veri bilimci ekibimiz de neyi çözecekleri veya ne yapmaları gerektiği konusunda büyük resmi göremediler.

Zamanla bir kaynak gibi görülmeye başlandık ve bunun sonucunda reaktif (gelecek fırsatlar hakkında proaktif değil, istatistik taleplerine yanıt veren) olduk.

  • Yazıdan Türkçe alıntılar okumak isterseniz burada ve burada; yazının 2015 tarihli İngilizce aslı ise şurada. İngilizce biliyorsanız, aslını mutlaka okumanızı öneririm.

Airbnb’nin “Mühendislik ve Veri Bilimi” blogundan devam edeyim. “Yeni Veri Bilimcilere Tavsiye” adlı yazısında Airbnb’nin bir başka veri bilimcisi Lindsay M. Pettingill şöyle diyor:

Artık yeni veri bilimcisin. Tebrikler. İlk veri işindeki genç veri bilimciysen ve “Nasıl etkin iş yaparım?” diye kendine soruyorsundur. Bu yazı iş yapmaya odaklıdır.  Öncelikle ürün ekiplerinde yerleşik veri bilimcilere yöneliktir, ancak ipuçlarının çoğu teknik roldeki herhangi bir yeni işe alım için genelleştirilebilir.

Bu yazıda etkili icraatı aşağıdaki 4 kategoriye ayırdım:

  1. Önceliklendirme,
  2. Görevlerin ne kadar süreceğini tahmin etme,
  3. Sorularınızın nasıl yanıtlanacağı ve
  4. Çalışmaların iletişimi ve paylaşımı.

😉

Görüldüğü gibi gerçek veri bilimciler, iş birimleri ile sürekli yakın çalışırlar ve iş sonuçları ile ölçülürler.

Referans yazıdan bir bölümü buraya aldım. Siz yine aslını okuyun.

Bu çerçevede, bence…

İyi bir veri analisti, 2 yıllık MIS mezunu bulur ve veri madenciliğini ona yaptırır; sonra doğru çıktılarla verinin doğru toplanması, amaçlar doğrultusunda hazırlanması, ilişki ve bağlantıları ortaya çıkaracak düzeyde modellenmesi işini kendi yapar.

İyi bir veri bilimci, tecrübeli birkaç analist + sahada çalışanlar + ürün ve pazarlama yöneticileri ile veriyi anlamlandırır ve kurumsal stratejiyi değerlendirecek hatta yönlendirecek içgörüleri üretir. (Nasıl ki, bir kuruma kredi verme kararı için bilanço analizi yapmaktan çok daha fazlası gerekiyorsa, veri bilimci için de veri analizinden çok daha fazlası gerekir).

İyi bir veri bilimci, makinenin neyi nasıl öğreneceğine karar verir. Süreç önce verinin iş birimine yarayacak duruma getirilmesi ile başlar. Makine öğrenmesi sonraki adım. (Önceki yazıdan alıntı)

😉

En yukarıdaki küçük şekildeki her bir basamak arasındaki en önemli fark nedir biliyor musunuz? Tek cümleyle özetleyeyim… Doğru Soruyu Sormak.

Not: Resimler de Airbnb blogundan alıntıdır.

 

Kategori: bilişim, CRM

“Veri Bilimi ve Büyük Soru” yazısına şu ana kadar 2 yorum yapılmış:

  1. @agah_kanu
    Hocam haklisiniz. Isin icinde business ve finans verileri olmadan yani olcumlemede verilere farkli sesler veremedikten sonra ortaya cikan veriler Amerikalinin deyimi ile ‘albino data’ oluyor.
    .
    @ugurabi
    Bu ‘albino data’ deyimini bilmiyordum. Çok beğendim. Bundan sonra kullanırım.
    .
    @agah_kanu
    Ben Turklerle oldugum toplantilarda ‘çapsız’ demeyi tercih etsem de
    .
    @onlytaifun
    Teknolog arkadaşlar araçlardan bahsetmiş; araçları kullanmak o işi çok iyi yapabileceğiniz anlamına gelmez sadece yardımcı olur.
    Excel ile veri bilimcisi olan kişiler var. Önemli olan yorumlamak. Büyük açık filminde adam mortgage krizini excel ile yorumluyor. Veri 🙂

  2. sibel akcekaya
    ‏bence hepsinden ortaya karisik olsun 🙂
    .
    Ugur Ozmen
    Tamamen desteklediğim bir tweet ile beğenimi belirteyim.

    sibel akcekaya
    Hayatlarinda DATA ile ilgili herhangi deneyimi olmayan, DATA kullanip ciddi bir para ve optimizasyon yapmamis profesyonellerin DATA,AI gibi konularda paylasim yapmalarini, konferanslara gidip uzman gibi konusmalarini, universitelerde ders vermelerini s…
    https://www.linkedin.com/feed/update/urn:li:activity:6443346130641121280/

    .
    sibel akcekaya
    ‏yabanci makaleleri okuyup tercume ediyorlar hahahah
    .
    Ugur Ozmen
    Bana “genel kabul görmüş veri bilimci tanımı” diye gönderilen şekil buydu.
    https://twitter.com/ugurabi/status/1112795701791150083
    “Business strategy, domain knowledge, problem solving, business analysis… bunlara katılıyorum da, neden şekilde aradaki bağlantı yer almıyor” diye sordum.
    Yanıtsız kaldım.
    .
    sibel akcekaya
    burada 100 kisilik farkli rol var hahah mesela AI ile veri bilimcisi farkli insanlar, AI computer scientist mesela, veri bilimci sadece SQL de bilebilir 🙂
    .
    Ugur Ozmen
    Ben de tam bunu anlatmaya çalışıyorum tekno arkadaşlara.
    “Bir yazılımcı, çeşitli araçları ortaya yazmış, anlamadıklarını da kenara çerçeve yapmış. Oysa kenara yazdıkları insanı veri bilimci yapar, ortadakiler değil” diyorum.
    Anlaşamıyoruz.
    .
    sibel akcekaya
    anlasamazsin zaten 🙂 konu ile ilgili olmayan birinin bunu yaptigi belli, cunku bu isler sadece ekip icinde calisilinca ogreniliyor, disardan zor.
    .
    ‏ugurcum soyle bir sorun var, Google analytics’den rapor ceken arkadaslar 1 sene sonra danismanlik, hocalik yapmya basliyor, hicbirsey ogrenmeden. Ben 13 sene sonra basladim danismanliga..Kullanici olmak ve danismanlik baska isler 🙂
    .
    Ugur Ozmen
    Kesinlikle haklısın.
    Müsteri deneyimi çalışmasında çıkan personalardan “bizde kimler var” diye veri ambarına bakıp, kimseyi bulamayınca “nasıl yapamadığını” anlatan [sözde] veri bilimcileri dinliyorum bir süredir.
    Blogda yazamam ama ders konusu olur 🙂
    .
    sibel akcekaya
    kisa yoldan kose donmek isteyen bir halk oldugumuz icin bilgi gelismiyor, genc arkadaslar 2-3 senede oldum diyip ya yonetici olup ogrenmeyi birakiyorlar ya da danismanliga basliyorlar. Amerika’da benim 15 senedir calisan arkadaslarim bile tamam demiyor. Surekli ogreniyorlar
    .
    Ugur Ozmen
    Eskiden 2 yılda “sosyal mecralar uzmanı” olunurdu. Şimdi 2-3 yılda ya “dijital dönüşüm danışmanı” ya da “veri bilimci” olunuyor. Dediğin gibi, bilmeden ve öğrenmeden.
    Bunların sermayeleri kendilerinin +müşterilerinin cehaleti.
    .
    sibel akcekaya
    herkes dijital donusumcu zaten hahaha surekli oduller aliniyor ama icraat yok 🙂 iste kismet artik
    .

Yorum Yazın