Когда внутри компании спрашивают "как у нас с данными?", команда дата-инженеринга, бизнес и CDO дают три не связанных между собой числа. Trust Score сжимает эти три взгляда в одну метрику.
Что такое Trust Score?
Trust Score выражает на шкале 0-100 и в заданном временном окне, насколько надёжен дата-актив (таблица, пайплайн, KPI). Это композитный показатель, собранный из взвешенной комбинации шести измеряемых измерений.
Компоненты
| Измерение | Измерение | Типичный вес | |---|---|---| | Точность | Доля записей, совпадающих с проверяемым источником | 25% | | Полнота | Заполненность обязательных полей | 15% | | Согласованность | Совпадение между источниками | 15% | | Своевременность | Доля доставок в SLA (p95) | 15% | | Уникальность | 1 − доля дубликатов | 10% | | Валидность | Отсутствие нарушений schema/regex/range | 20% |
Веса смещаются по типу актива: регуляторный слой — точность + своевременность; аналитика — согласованность.
Формула (пример)
TrustScore = 0.25 × Accuracy + 0.20 × Validity + 0.15 × Completeness + 0.15 × Consistency + 0.15 × Timeliness + 0.10 × Uniqueness
Каждый компонент нормализуется в 0-100. Пороги цвета: 90+ зелёный, 75-89 жёлтый, ниже 75 красный.
На уровне актива, не таблицы
Trust Score рапортуется на уровне актива, не таблицы. KPI может питаться от нескольких таблиц; Trust Score KPI — взвешенное среднее источников. С lineage всё считается автоматически.
Превышение порога = инцидент
При падении ниже порога автоматически открывается инцидент:
- Красный (<75): мгновенный PagerDuty/Slack alert владельцу и steward-у, таймер эскалации.
- Жёлтый (75-89): ежемесячный дашборд, владелец вытягивается на еженедельный review.
- Зелёный (90+): в SLA, действий не требуется.
В связке с incident management "данные плохие" превращается в "Customer-таблица Trust 72 — красный, владелец Мехмет, SLA 24ч".
Что это значит для CFO и аудита
Trust Score переводит абстракт "качество данных" в показатель доверия для операционных и финансовых решений:
- CFO в годовом отчёте пишет "production-данные зафиксированы на Trust 91".
- BDDK-аудит получает 30-дневную историю Trust Score регуляторного хранилища.
- Перед стартом нового AI-проекта задаётся порог Trust Score (например, ≥85) для исходных активов.
Операционная дисциплина
Чтобы программа жила в продакшене, нужны три контроля:
- Автоматизация: пересчёт метрик в каждом прогоне через dbt + Soda Core + custom tests.
- Владение: у каждого актива есть владелец и steward; нарушение порога звонит обоим.
- Ежемесячный исполнительный отчёт: дашборд CDO с пятью худшими таблицами, трендом и сводкой инцидентов.
Заключение
"Качество данных" — поле, где соглашаются о словах и расходятся о числах. Trust Score превращает слова в число, число — в инцидент, а инцидент — в подотчётный, временной артефакт. В зрелой программе обсуждения смещаются от "хорошо или плохо" к "Customer-таблица 92% точности, 88% полноты, Trust 87".
