Dijital Pazarlamada SaaS ve Streaming Sektörlerinde Kohort Analizinin Eleştirisi
- Murat Özkan
- 26 Ara 2025
- 4 dakikada okunur

Kohort analizi (cohort analysis), SaaS (Software as a Service – Hizmet Olarak Yazılım) ve streaming platformları gibi abonelik tabanlı iş modellerinde kullanıcı kaybı (churn) ve kalma oranını (retention) ölçmek için en yaygın kullanılan yöntemlerden biridir. Kullanıcıları sisteme giriş tarihine göre gruplara ayırarak zaman içindeki davranışlarını izleyen bu yaklaşım, Mixpanel ve Amplitude gibi analitik araçlarda adeta “altın standart” olarak sunulmaktadır. Medyan abonelik süresi (median subscription duration), ağırlıklı kalma eğrisi (weighted retention curve) ve aylık kayıp hızı (hazard rate) gibi türev metrikler sayesinde ürün yöneticileri “kullanıcılar ne kadar kalıyor?” sorusuna hızlı cevaplar alır.
Ancak temel sorun şudur: Kohort analizi ne nedenleri açıklar ne de geleceği öngörür; yalnızca zaman içinde kimlerin hayatta kaldığını gösterir. Bu nedenle güçlü bir teşhis aracı olsa da, çoğu zaman yanıltıcı bir güven duygusu üretir.
Aşağıda, bu eleştirileri somut bir örnek veri seti üzerinden detaylandıracağım: Örnek bir SaaS ürününde 20 kohorttan oluşan retention tablosu, hazard matrisi, ağırlıklı kalma eğrisi ve kayıp hızı grafiği. Bu veride kohortlar aylık bazda gruplanmış, retention oranları EOM (End of Month – Ay Sonu) ile hesaplanmış ve medyan değer 5 ay civarında çıkmış. Bu örnekler, eleştirileri görselleştirerek somutlaştıracaktır.
Aşırı Basitleştirme
Tek Boyutlu Zaman Yanılsaması Klasik kohort analizi kullanıcıları yalnızca giriş tarihine göre gruplar. Oysa kullanıcı davranışı tek boyutlu değildir. Müşteri segmenti (örneğin SaaS’ta KOBİ vs. mali müşavir, satışçılar..vb.), fiyat planı, edinim kanalı (organik vs. ücretli), onboarding kalitesi, mevsimsellik ve ürün güncellemeleri gibi birçok faktör aynı anda etkilidir. Zaman merkezli kohortlar bu faktörleri yok sayarak yanıltıcı korelasyonlar üretir.

Örneğin, örnek retention tablosunda Ocak-23 kohortu (3 kullanıcı) M0’da %100, M3’te %66.7 ve M6’da %0.0 retention gösterirken, Ağustos-24 kohortu (1 kullanıcı) M0-M11 arası %100 kalıyor. Bu fark “kohortun kalitesi” ile açıklanamaz. Aynı dönemde yürütülen bir kampanya, rakip ürünlerin yaşadığı teknik sorunlar veya mevsimsel talep artışı asıl belirleyici olabilir. Streaming sektöründe bu durum daha da belirgindir: Netflix veya Spotify’da bir kohortun uzun süre kalması, çoğu zaman kullanıcı niteliğinden değil; popüler bir dizinin (örneğin Squid Game etkisi) veya çalma listesi trendinin sonucudur. Çok boyutlu kohortlar (zaman + segment + kanal) önerilse de, pratikte bu tablolar hızla karmaşıklaşır ve yorumlanamaz hale gelir. Sonuçta çoğu ekip hâlâ tek boyutlu zaman kohortlarına geri döner.

Özet Metriklerin Yanıltıcılığı:
Medyan ve Ağırlıklı Eğriler Medyan abonelik süresi, ortalamaya göre daha dayanıklı bir ölçüt gibi sunulsa da uzun kuyruklu churn davranışını gizler. Erken kayıplar (ilk 1–3 ay) medyanı hızla aşağı çekerken, uzun süre kalan sadık kullanıcılar istatistiksel olarak görünmez olur. Bu durum, ürünün “kısa ömürlü” olduğu algısını yaratabilir.
Ağırlıklı kalma eğrileri ise daha ciddi bir problem barındırır: sansürlenmiş veri (censored data). Yeni kohortlar henüz yeterince zaman geçmediği için kayıp yaşamamış gibi görünür ve bu durum kalma oranlarını yapay biçimde şişirir. Eski kohortlar daha olgun veri sunarken, yeniler her zaman “umut verici” görünür. Örnek ağırlıklı kalma eğrisinde (weighted retention curve) M0 %100’den başlıyor, M3’te %67’ye düşüyor ve M11’de %0’a iniyor. Bu eğri, yeni kohortların etkisiyle ilk aylarda yüksek görünse de, gerçek ürün performansını abartır. SaaS girişimlerinde sıkça görülen tablo şudur: İlk 6 ay %80+ kalma oranı, 18. ayda dramatik düşüş. Streaming platformlarında da benzer bir mekanizma vardır. Deneme süresi veya yoğun içerik tüketimi (trial effect) nedeniyle ilk aylarda kayıp düşüktür; ancak içerik bittiğinde geç kayıp (late churn) toplu halde gelir. Medyan bu kırılmayı zamanında yakalayamaz.

Sansürleme ve Hayatta Kalan Yanlılığı
Kohort analizi gözlem ufkuna aşırı bağımlıdır. Aynı kohort için 12 aylık ufukta medyan 6 ay görünürken, 24 aylık ufukta 9 aya çıkabilir. Hâlâ aktif olan kullanıcılar “henüz kayıp yaşamadı” şeklinde kodlanır; oysa bu sadece ertelenmiş belirsizliktir.
Aylık kayıp hızı (hazard rate) bile hayatta kalan yanlılığını içerir. Sistemde kalan kullanıcılar zaten daha sadık olanlardır; bu nedenle risk düşük görünür. Örnek hazard matrisinde Ocak-23 kohortu M5’te %100 kayıp hızı gösterirken (önceki aktiflerin tamamı ayrılmış), Ağustos-24 kohortu M1-M11 arası %0 kalıyor. Bu, sansürlemenin etkisiyle düşük hazard üretir ve ürünün gerçek riskini gizler. Streaming platformlarında bu yanlılık daha da kritiktir: Kullanıcılar genellikle içerik tüketimi tamamlandığında ayrılır; kısa ufuklu kohortlar bu gerçeği tamamen gizler. Gerçek hayatta kalma analizi (survival analysis – Kaplan–Meier veya Cox modelleri) sansürlemeyi istatistiksel olarak yönetir. Kohort tablosu ise bunu yapamaz; teşhis eder ama öngörmez.
Aksiyon Alınabilirlik Sorunu:
“Ne Oldu” Var, “Neden” Yok Kohort analizi “3. ayda churn arttı” der; ama bunun nedenini söylemez. Onboarding mi zayıf, fiyat mı pahalı, fatura dönemi mi tetikleyici, yoksa rakip kampanyası mı? Kohort sadece sonucu gösterir. Çıkış kümeleri (exit clusters – erken/orta/geç churn) eklenebilir, ancak bu hâlâ korelasyondur.
Örnek ağırlıklı kayıp hızı grafiğinde (weighted hazard curve) M4’te %20 pik yaparken, M8’de %15’e düşüyor. Bu pik “o ayda sorun var” der, ama nedenini açıklamaz. Üstelik çoğu kohort analizi davranış verisini dışlar. SaaS’ta özellik benimseme, streaming’de yoğun izleme (binge watching) veya playlist oluşturma gibi davranışlar churn’ü çok daha iyi açıklar. Buna rağmen klasik kohortlar yalnızca “hala abone mi?” sorusuna odaklanır.

Ölçek ve Pratik Sınırlamalar
Veri büyüdükçe kohort tabloları okunamaz hale gelir. Isı haritaları (heatmap) görselliği artırsa da içgörü üretmek hâlâ manuel ve yoruma açıktır. Örnek retention ısı haritasında erken aylar yeşil (yüksek retention) iken geç aylar kırmızıya döner, ancak küçük kohortlardaki (örneğin Ağustos-24’te 1 kullanıcı) %100 retention istatistiksel gürültüdür. Funnel analizi veya davranış kohortları gibi alternatifler varken, tek boyutlu zaman kohortlarına aşırı bağlılık kolaylık kaynaklı bir alışkanlıktır, metodolojik bir üstünlük değil.




Yorumlar