Notebook-da 92% dəqiqlik göstərən bir model istehsalata çıxmayınca təşkilat üçün dəyər yaratmır. Data science komandalarının ən böyük ağrısı məhz buradadır: modeldən API-a, API-dan davamlı əməliyyata aparan yol. MLOps bu yolu xəritələyən disiplindir.
MLOps-un Beş Qatı
- Feature Store: Eyni feature-in eğitimdə və istehsalatda fərqli hesablanması (training-serving skew) modellərin ən geniş yayılmış ölüm səbəbidir. Feast, Databricks Feature Store kimi alətlər bu uyğunluğu təmin edir.
- Model Registry: Hansı model versiyası hansı dataset ilə, hansı hiperparametrlə, hansı performansla eğitilib? MLflow, W&B, Azure ML registry bu inventarı saxlayır.
- CI/CD for Models: Kod kimi, model də test edilə bilən və deployable olmalıdır. Unit test (data sxemi), integration test (pipeline), canary deployment (trafik bölünməsi).
- Monitoring: İstehsalatda model keyfiyyəti azala bilər (data drift, concept drift). Prediction distribution, feature distribution və business KPI anomaliyaları üçün monitoring vacibdir.
- Retraining Pipeline: Model birdəfəlik əsər deyil; feedback loop ilə davamlı yenilənən bir varlıqdır. Avtomatik retraining-in şərtləri əvvəlcədən müəyyənləşdirilməlidir (performans düşdükdə, periodik və ya yeni data ilə?).
Olgunluq Səviyyələri
MLOps olgunluğu Google-un 3 mərhələli modelinə görə qiymətləndirilir:
- Level 0: Manual model deploy. Data scientist notebook-u istehsalata köçürür. Kiçik komandalar üçün kifayətdir, lakin miqyaslanmır.
- Level 1: Avtomatik training pipeline, manual deploy.
- Level 2: CI/CD ilə avtomatik training + deploy + monitoring. Feedback loop ilə retraining tetiklənir.
Türkiyə müəssisələrinin böyük əksəriyyəti Level 0-1 arasındadır. Level 2-yə çatmaq 9-12 aylıq fokuslanmış investisiya tələb edir.
Alət Seçimləri
- Tracking: MLflow (açıq mənbə, geniş yayılmış), W&B (komanda UX-i güclü), Azure ML (Azure-native).
- Pipeline: Kubeflow (Kubernetes-native), Airflow (data + ML hibrid), Prefect (Python-native).
- Serving: Seldon, BentoML, KServe, Triton (GPU ağır).
- Monitoring: Arize, WhyLabs, Evidently (açıq mənbə).
Tövsiyə olunan Mərhələli Yanaşma
Bir bank müştərimizdə MLOps layihəsi belə ardıcıllıqla irəlilədi: əvvəlcə 2 pilot modelin MLflow üzərinə köçürülməsi, sonra Azure DevOps pipeline-ları ilə CI/CD, sonra Evidently ilə drift monitoring, sonda 15 modellik kataloqa çatıldı. 9 aylıq proses data science komandasının produktivliyini 3 qat artırdı və model əməliyyat xərcini 60% azaltdı.
