Управление данными

Trust Score качества данных: измеримая бизнес-метрика

Качество данных обсуждают на каждой встрече, и никто не называет одно и то же число. Trust Score даёт бизнесу одну метрику, а регулятору — доказательство.

BIART Ekibi3 мин чтения1 просмотров
Veri kalitesi Trust Score dashboard görseli

Когда внутри компании спрашивают "как у нас с данными?", команда дата-инженеринга, бизнес и CDO дают три не связанных между собой числа. Trust Score сжимает эти три взгляда в одну метрику.

Что такое Trust Score?

Trust Score выражает на шкале 0-100 и в заданном временном окне, насколько надёжен дата-актив (таблица, пайплайн, KPI). Это композитный показатель, собранный из взвешенной комбинации шести измеряемых измерений.

Компоненты

| Измерение | Измерение | Типичный вес | |---|---|---| | Точность | Доля записей, совпадающих с проверяемым источником | 25% | | Полнота | Заполненность обязательных полей | 15% | | Согласованность | Совпадение между источниками | 15% | | Своевременность | Доля доставок в SLA (p95) | 15% | | Уникальность | 1 − доля дубликатов | 10% | | Валидность | Отсутствие нарушений schema/regex/range | 20% |

Веса смещаются по типу актива: регуляторный слой — точность + своевременность; аналитика — согласованность.

Формула (пример)

TrustScore = 0.25 × Accuracy + 0.20 × Validity + 0.15 × Completeness + 0.15 × Consistency + 0.15 × Timeliness + 0.10 × Uniqueness

Каждый компонент нормализуется в 0-100. Пороги цвета: 90+ зелёный, 75-89 жёлтый, ниже 75 красный.

На уровне актива, не таблицы

Trust Score рапортуется на уровне актива, не таблицы. KPI может питаться от нескольких таблиц; Trust Score KPI — взвешенное среднее источников. С lineage всё считается автоматически.

Превышение порога = инцидент

При падении ниже порога автоматически открывается инцидент:

  • Красный (<75): мгновенный PagerDuty/Slack alert владельцу и steward-у, таймер эскалации.
  • Жёлтый (75-89): ежемесячный дашборд, владелец вытягивается на еженедельный review.
  • Зелёный (90+): в SLA, действий не требуется.

В связке с incident management "данные плохие" превращается в "Customer-таблица Trust 72 — красный, владелец Мехмет, SLA 24ч".

Что это значит для CFO и аудита

Trust Score переводит абстракт "качество данных" в показатель доверия для операционных и финансовых решений:

  • CFO в годовом отчёте пишет "production-данные зафиксированы на Trust 91".
  • BDDK-аудит получает 30-дневную историю Trust Score регуляторного хранилища.
  • Перед стартом нового AI-проекта задаётся порог Trust Score (например, ≥85) для исходных активов.

Операционная дисциплина

Чтобы программа жила в продакшене, нужны три контроля:

  1. Автоматизация: пересчёт метрик в каждом прогоне через dbt + Soda Core + custom tests.
  2. Владение: у каждого актива есть владелец и steward; нарушение порога звонит обоим.
  3. Ежемесячный исполнительный отчёт: дашборд CDO с пятью худшими таблицами, трендом и сводкой инцидентов.

Заключение

"Качество данных" — поле, где соглашаются о словах и расходятся о числах. Trust Score превращает слова в число, число — в инцидент, а инцидент — в подотчётный, временной артефакт. В зрелой программе обсуждения смещаются от "хорошо или плохо" к "Customer-таблица 92% точности, 88% полноты, Trust 87".

Поделиться
Self-service analitik ölçeklenebilirliği görseliБизнес-аналитика
3 мин чтения

Масштабируемая self-service аналитика: от пилота к корпорации

Большинство пилотов self-service блестят и буксуют на пути к корпоративному масштабу. Практический план: каталог, сертификация, обучение, телеметрия.