İki yönetici aynı toplantıya iki farklı 'aktif müşteri' sayısıyla gelir. Biri 142.000 der, diğeri 168.000. İkisi de haklıdır — çünkü biri son 30 günde işlem yapanı, diğeri hesabı açık olanı saymıştır. Bu, BI dünyasının en eski ve en pahalı sorunudur: metric tanımının her raporda yeniden, farklı yazılması. Semantik katman tam da bunun için vardır.
Semantik katman nedir?
Veri kaynağı ile raporlama aracı arasında duran, iş metriklerini tek ve merkezi bir yerde tanımlayan soyutlama katmanıdır. 'Aktif müşteri', 'net gelir', 'churn oranı' gibi tanımlar SQL'in içine gömülmek yerine burada bir kez yazılır; Power BI, Tableau, Excel ve AI asistanı hepsi aynı tanımı tüketir.
Neden her araç kendi tanımını yapmasın?
Çünkü tanım çoğaldıkça tutarsızlık kaçınılmazdır:
- Power BI'da 'gelir' KDV dahil, Tableau'da hariç hesaplanır.
- Bir analist churn'ü aylık, diğeri yıllık tanımlar.
- Yeni rapor her seferinde eski SQL'i kopyalar; bir tanım değişince 30 rapor elle güncellenmeli.
Semantik katman tanımı veriden ayırır: metric bir kez tanımlanır, tüm araçlar oradan okur.
Headless BI ve metrics layer
Son yıllarda 'headless BI' yaklaşımı yaygınlaştı: semantik katman görselleştirme aracından bağımsız bir servis olarak çalışır. dbt Semantic Layer (MetricFlow), Cube ve AtScale bu kategorinin öne çıkanları. Mimari üç parçalıdır:
- Tanım katmanı: metric, dimension, join, time-grain YAML ile tanımlanır.
- Sorgu motoru: gelen sorguyu (REST/GraphQL/SQL) optimize SQL'e çevirir.
- Tüketiciler: BI araçları, notebook'lar ve AI Copilot aynı API'den beslenir.
Tipik metric tanımı (dbt MetricFlow örnek)
```yaml metrics:
- name: active_customers
type: simple measure: distinct_customer_id filter: "last_txn_date >= dateadd(day, -30, current_date)" ```
Bu tanım merkezi olduğu için 'aktif müşteri' artık tartışılmaz; tek kaynak burasıdır.
Yönetişimle ilişkisi
Semantik katman aynı zamanda bir yönetişim aracıdır. Her metric'in bir sahibi, bir tanımı, bir onay tarihi olur. 'Certified' damgalı metric'ler kuruma açıktır; deneysel olanlar sandbox'ta kalır. Bu yapı veri yönetişimi çerçevesi ve Trust Score ile doğrudan birleşir.
AI çağında neden kritik?
Bir LLM tabanlı BI asistanı 'geçen çeyrek churn ne oldu' sorusuna cevap verirken churn'ün tanımını bir yerden almak zorundadır. Bu tanım semantik katmandan gelirse cevap güvenilir; LLM'in kendi yorumuna bırakılırsa halüsinasyon riski doğar. CentraQL gibi platformlar bu yüzden semantik katmanı Copilot pipeline'ının zorunlu bir aşaması yapar.
Nereden başlamalı?
- En çok tartışılan 10-15 metric ile başlayın (gelir, müşteri, churn, marj).
- Her metric için tek bir sahibi ve yazılı tanımı belirleyin.
- Önce bir BI aracını semantik katmana bağlayın, sonra genişletin.
- 'Certified' / 'experimental' ayrımını ilk günden koyun.
Sonuç
Semantik katman sihir değil; iş metriklerinin tek merkezi tanımıdır. Onsuz her rapor kendi gerçeğini üretir; onunla kurum tek bir 'aktif müşteri' sayısı konuşur. BI olgunluğu araç sayısıyla değil, kaç metric'in tek tanıma sahip olduğuyla ölçülür.
