veri kalitesi

Veri Kalitesi Yönetimi ve Data Governance: Kurumsal Rehber [2026]

Mehmet Kurtipek

January 25, 2026

8 min read

veri kalitesi

data governance

veri yönetimi

metadata

veri katalog

veri doğrulama

Veri Kalitesi: Kurumsal Başarının Gizli Temeli

Bir işletmenin karar verme kapasitesi, sahip olduğu verinin kalitesi kadar iyidir. Kötü veri, uygun şekilde işlenmiş kötü veri olur. Garbagein-in, garbage-out, dişarı kuralı veriye uygulanabilir.

Araştırmalara göre, ortalama bir Fortune 500 şirketinin, kötü veri kalitesinden kaynaklanan yıllık kaybı 10-15 milyon dolar civarındadır. Yanlış müşteri segmentasyonu, pazarlama bütçesinin boşa gitmesine neden olur. Yanlış ürün tahmini, işletme zinciri(supply chain) iniş yükseliş yaşar. Yanlış finansal veriler, denetim risklerine yol açar.

Bu rehber, veri kalitesinin ne olduğunu, nasıl ölçüleceğini ve nasıl iyileştirileceğini açıklıyor.

Veri Kalitesi Boyutları

Veri kalitesi, altı temel boyuttan oluşur. Her boyut, farklı riskleri yönetir.

1. Doğruluk (Accuracy)

Verinin, gerçek dünyayı doğru bir şekilde temsil etmesi.

Örnek Sorun: Müşteri adresinin hatalı olması. Sistem, Mr. John Smith yerine Mr. Joan Smith yazıyor. Gönderilen ürün, yanlış kişiye gidiyor.

Tespit Yöntemi: Kaynak sistemle karşılaştırma. Veritabanındaki müşteri telefon numarasını, gerçek müşteriye sorun. Eşleşiyor mu?

Düzeltme: Manuel denetim, kaynak sistemde düzeltme, doğrulama kuralları.

2. Tamlık (Completeness)

Gerekli tüm alanların doldurulmuş olması.

Örnek Sorun: Ürün kataloğu, tüm ürünlerin fiyatını içermiyor. 5.000 ürünün 200'ünün fiyatı boş. Raporlar, hatalı gelir tahmini gösteriliyor.

Tespit Yöntemi: Boş alanların yüzdesini hesaplamak. Hedef, %95 tamlıktır (kritik alanlar için).

Düzeltme: Eksik verileri doldurma veya bu satırları hariç tutma.

3. Tutarlılık (Consistency)

Aynı veri, her yerde aynı şekilde temsil edilmesi.

Örnek Sorun: Müşteri veritabanında ülke adı "Türkiye" yazılı, finans sisteminde "TURKIYE", pazarlama veritabanında "Turkey". Raporlamada, aynı müşteri grupları, farklı tablolarda farklı şekilde sayılıyor.

Tespit Yöntemi: Küçük-büyük harf, boşluk, format farkları taranır. Farklılıklar tespit edilir.

Düzeltme: Standardizasyon kuralları uygulanır. Tüm sistemlerde "Türkiye" kullanılır.

4. Zamanında Olma (Timeliness)

Verinin güncel ve zamanında olması.

Örnek Sorun: Satış raporları, 3 gün gecikmeli görülüyor. Müdür, hafta başı raporunu çarşamba günü görüyor. Pazarlamacılar, geçmiş trendlere uyum sağlamaya çalışıyor.

Tespit Yöntemi: Verinin yaşını ölçmek. Satış işlemi ile raporun kullanılabilir hale gelmesi arasındaki zaman.

Düzeltme: Pipeline'ların hızlandırılması, batch sıklığının arttırılması, Real-time'a geçiş.

5. Geçerlilik (Validity)

Verinin belirlenen kural ve türlere uyması.

Örnek Sorun: Yaş alanında "-50" yazılı. Telefon numarasında harf var. E-mail adresi, geçerli format değil.

Tespit Yöntemi: Veri türü kontrolleri, regex kuralları, domain kontrolleri.

Düzeltme: Doğrulama kuralları kaynakta (form validation) uygulanır.

6. Benzersizlik (Uniqueness)

Yinelemeler ve çoğaltmalardan arınmış olması.

Örnek Sorun: Müşteri veritabanında, aynı müşteri iki kez giriş yapılmış. CRM'de "John Smith" ve "John Smith (copy)" olarak iki kayıt. Pazarlama, aynı müşteriye iki kez kampanya gönderiyor.

Tespit Yöntemi: Birincil anahtarlar, SQL UNIQUE constraint'leri.

Düzeltme: Yinelemeler birleştirilir, anahtarlar iyileştirilir.

Veri Kalitesi Problemlerinin Maliyeti

Kaliteli olmayan verinin etkileri, doğrudan ve dolaylı olabilir:

Doğrudan Maliyetler:

El ile veri temizleme (satı başına 2-5 dolar)
İş işlemlerinin yeniden yapılması
Müşteri kaybı (yanlış harita gönderilen müşteri)

Dolaylı Maliyetler:

Yanlış kararlar (yanlış pazarlama stratejisi, yanlış envanterler)
Operasyonel hizmetler (müşteri hizmetleri aşırı yüklenmiş)
İtibar zararı (müşteri deneyimi bozuk)

Araştırmalara göre:

İyi veri kalitesi = 20-30% daha hızlı karar alma
Kötü veri kalitesi = 15-20% düşük müşteri memnuniyeti

Veri Kalitesi Araçları

Great Expectations

Great Expectations, veri kalitesi doğrulamak için özel bir Python kütüphanesidir.

Özellikler:

Veri beklentileri tanımlanır (örneğin, yaş alanı 0-120 arasında olmalı)
Veri yükleme sırasında, otomatik olarak bu beklentiler kontrol edilir
Test başarısız olsa bile pipeline devam edebilir (veya durur)
Sonuçlar, belgelenmesi kolay dashboards'da görülür

Kullanım:

Great Expectations ile veri doğrulama, beklenti (expectation) tanımlanarak başlar. Veriler yüklenmeden önce, belirli kurallar tanımlanmış olmalıdır. Örneğin, yaş alanı 0 ile 120 arasında olmalı, email alanı geçerli bir format taşımalı, maaş alanı negatif olmamış olmalı. Bu beklentiler tanımlandıktan sonra, her veri yüklemesi sırasında otomatik olarak kontrol edilir. Doğrulama sonuçları, yüzde başarı ve başarısız kontrollerin sayısı şeklinde raporlanır.

dbt Tests

dbt (data build tool), SQL dönüşümlerinin yanı sıra, testleri de yazmanıza izin verir.

Özellikler:

SQL veya Python testleri
Temel testler (unique, not_null, accepted_values)
Özel testler yazılabilir
CI/CD entegrasyonu

Kullanım:

dbt ile veri kalitesi testleri, model tanımında YAML format ile belirtilir. Customers tablosu için, customer_id sütunu benzersiz (unique) ve null olmayan (not_null) değerler içermelidir. Email sütunu da benzersiz olmalıdır. Bu testler, her dbt çalışması sırasında otomatik olarak kontrol edilir. Başarısız testler, pipeline'ı durduracak şekilde yapılandırılabilir.

Monte Carlo

Kullanılan veri mimarisine bağlı olmaksızın, tüm veri işleme hatalarını tespit eden SaaS aracıdır.

Özellikler:

Otomatik data profiling (verinin normal dağılımını öğrenme)
Anormallıkları tespit (şama değişmesi = data drift)
Veri lineage ile bağlantı
Alert ve remediation

Data Governance Çerçevesi

Veri kalitesi, sadece teknik araçlarla sağlanamaz. Kurumsal bir yapı gerekir. Data Governance, bu yapıdır.

Data governance, dört temel ögeden oluşur:

1. Veri Sahipliği (Data Ownership)

Her veri parçasının, bir sorumlusu olması.

Örnek:

Müşteri tablosu = CRM müdürü
Satış işlemleri = Satış operasyonları müdürü
Ürün kataloğu = Ürün yönetim

Faydaları:

Veri hakkında sorular olduğunda, hemen cevap alınır
Kalite problemleri, doğru birine iletilir
Değişiklikler, koordine edilir

2. Veri Katalogu (Data Catalog)

Kuruluşta hangi verilerin olduğunu, nerede olduğunu ve ne anlama geldiğini gösteren bir katalog.

Örnekler:

Collibra
Alation
Atlan
Apache Atlas (açık kaynak)

Kataloğun İçeriği:

Tablo adı ve açıklaması
Sütunlar ve veri türleri
Veri sahibi ve iletişim
Veri lineage (bu veri nereden geliyor)
Kalite metrikleri
Son güncelleme tarihi

Faydaları:

Veri keşfi (analisti, ne veriler olduğunu bilir)
Veri yönetimi (değişiklikler, katalog üzerinde takip edilir)
Self-service analytics (teknik olmayan kullanıcılar bile veriyi bulabilir)

3. Metadata Yönetimi

Veri hakkında verinin yönetilmesi. Tüm tablo ve sütun tanımları, veri tipleri, ilişkileri.

Örnekler:

Customers tablosu için metadata tanımlandığında, customer_id sütunu (Integer, Birincil Anahtar), name sütunu (String, Nullable), email sütunu (String, Unique), created_at sütunu (Timestamp) olmak üzere belirtilir.

İlişkiler de tanımlanır: orders tablosundaki customer_id, customers tablosundaki customer_id'ye referans verir.

Metadata, veri tabanında kendini de içerir. Veri değiştiğinde, metadata da güncellenmeli. Bu şekilde, tüm veri tanımları merkezi bir yerde saklanır ve güncel kalır.

4. Veri Lineage (Veri Kökeni)

Her verinin kaynağından, son hedefine kadar olan yolunu takip etme.

Örnek:

Veri yolculuğu, Salesforce CRM'den başlar. Oradan API aracılığıyla veriler çekilip Kafka'ya yazılır. Daha sonra dbt ile veriler dönüştürülerek Snowflake'e yüklenir. Snowflake'teki temizlenmiş veri, BI Dashboard'a (Looker) taşınır. Son olarak, CEO raporları bu dashboard'lardan oluşturulur.

Bir BI raporu hatalı gösteriyorsa, lineage'i takip ederek hata kaynağını buluruz. Hata CRM'de mi, çekim işleminde mi, dönüşümde mi, dashboard kurulumunda mı - her adımı kontrol edebiliriz.

Araçlar:

Great Expectations
dbt Docs
Collibra
Alation

Roller ve Sorumluluklar

Veri kalitesini sağlamak için, ekipte belirli roller olmalıdır:

Data Steward (Veri Görevlisi)

Sorumlu:

Veri sahipliğini koordinasyon
Veri kalitesi metrikleri izleme
Kalite sorunlarını raporlama

Yer aldığı kuruluş: Bölüm müdürüyle birlikte (IT değil, işletme)

Data Engineer (Veri Mühendisi)

Sorumlu:

Pipeline'ları tasarlamak, uygulamak
Veri kalitesi araçlarını entegre etmek
Metadata yönetimini otomatikleştirmek

Veri Analisti / BI Uzmanı

Sorumlu:

Raporlarda veri kalitesi sorunlarını tespit
Dashboard'lara güvenilir verinin girmesini sağlamak

Data Governance Komitesi

Aylık toplantı, tüm bölümlerin katılımıyla:

Veri kalitesi metrikleri gözden geçirilir
Yeni veri kaynakları onaylanır
Veri erişim politikaları güncellenir

Veri Kalitesi Yol Haritası

Baştan sona, veri kalitesini kurmanın bir planı:

1. Faz (0-3 ay): Keşif ve Tanımlama

Mevcut veri kaynaklarını tanımla
Kalite sorunlarını tespit et
Veri taşiği (data profiling) yap

2. Faz (3-6 ay): Araç Seçimi ve Kurulumu

Data catalog aracı seç (Alation veya Collibra)
dbt testleri uygulamaya başla
Great Expectations entegre et

3. Faz (6-9 ay): Governance Yapısı

Data steward rolünü oluştur
Veri sahipliği atamalarını yapıl
Data governance politikasını dokümante et

4. Faz (9-12 ay): Sürekli İyileştirme

Veri kalitesi metrikleri izleme
Sorunları proaktif olarak çözme
Yeni veri kaynakları için standartları uygulama

Veri Kalitesi Metrikleri ve KPI'lar

Veri kalitesini yönetmek için, ölçmesi gerekir. KPI'lar:

Tamlık Oranı: % ile cevap vermesi gereken alanlar
Tutarlılık Oranı: % ile standart biçimde veriler
Doğruluk Oranı: % ile kaynak sistemle eşleşen veriler
Benzersizlik Oranı: % ile yinelemesiz veriler
Geçerlilik Oranı: % ile kurallara uygun veriler

Hedef, bu metrikleri 95%+ tutmaktır. Altında kaldığında, alert verilmeli.

Data Governance ve Compliance

Veri kalitesi, compliance (uyum) düzenlemeleriyle de ilişkilidir:

GDPR: Müşteri verilerine doğru erişim ve düzeltme hakkı
HIPAA: Sağlık verilerinin gizliliği
SOX: Finansal raporların güvenilirliği

Bu düzenlemeler, veri kalitesini zorunlu kılar. Hatalı müşteri verilerine sahip olmak, GDPR ihlalidir.

Veri kalitesi, daha geniş veri mühendisliği stratejisinin ayrılmaz bir parçasıdır. Kapsamlı bilgi için, Veri Mühendisliğini Kapsamlı Rehberi inceleyebilirsiniz.

Smart Maple ile Veri Kalitesi Mimarisi

Smart Maple, veri kalitesini kurumsal bir seviyede sağlayan danışmanlık sunmaktadır.

Hizmetlerimiz:

Veri kalitesi taraması ve bencemarkmarking
Data catalog seçimi ve implementasyonu (Alation veya Collibra)
dbt testleri yazılması ve entegrasyonu
Great Expectations kurulumu
Veri lineage haritası oluşturma
Data governance politikası ve proseslerinin tasarımı
Veri steward ekibi kurulması ve eğitilmesi
Veri kalitesi KPI'ları tanımlama ve monitoring

Veri kalitesi mimarisi konusunda danışmanlık almak için, Smart Maple ile iletişime geçebilirsiniz.

March 1, 2026

Yazılım Yaşam Döngüsü Yönetimi (ALM): Uçtan Uca Rehber [2026]

ALM Nedir ve Neden Önemli? ALM (Application Lifecycle Management), yazılımın doğumundan, yaşamından ve ölümüne kadarki tüm süreci yönetmektir. Şöyle hayal edin: * Doğum: İşletmenin "Bu özellik gerekli" dediğinde, yazılım düşünülür. * Gebelik: Gereksinimler tanımlanır, tasarlanır, geliştirme yapılır. * Doğum: Yazılım, üretim ortamında canlı alınır. * Hayat: Bakım, güncellemeler, iyileştirmeler yapılır. * Yaşlanma: Hata oranı artıyor, bakım maliyeti yükseli. Modernizasyon düşünülür. *

February 28, 2026

Pazaryeri Entegrasyon Yazılımı: Trendyol, Hepsiburada ve Amazon Türkiye [2026]

Türkiye'de satış yapmak artık tek bir kanal üzerinden imkansız hale geldi. 2026 yılında, e-ticaret satışlarının yüzde 70-80'i üçüncü taraf pazaryerlerinde gerçekleşmektedir. Trendyol, Hepsiburada, Amazon Türkiye, N11, GittiGidiyor gibi platformlar, artık e-ticaret işletmelerinin hayatı değiştirebilecek bölümüdür. Ancak bu fırsat, bir sorunla birlikte gelir: her pazaryerini ayrı ayrı yönetmek, manuel olarak ürün yükleme, fiyat güncelleme, sipariş takibi imkansızdır. Büyüyen işletmeler için paza

February 27, 2026

Yapay Zeka Projesi Maliyet Analizi: Bütçe, Ekip ve ROI Hesaplama

Yapay zeka projelerine yatırım yapma kararı alan işletmeler için en kritik soru şudur: "Ne kadar maliyetli olacak?" Bu soruya net bir cevap vermek, proje kapsamından ekip bileşimine, bulut altyapısından veri yönetimine kadar birçok faktörün analiz edilmesini gerektirir. Bu rehber, yapay zeka projelerinin gerçekçi bütçelendirilmesi için bir yol haritasıdır. Yapay Zeka Projesi Maliyet Bileşenleri Bir yapay zeka projesinin toplam maliyeti, beş ana kategoriye ayrılır: insan kaynakları ve pers

Veri Kalitesi Yönetimi ve Data Governance: Kurumsal Rehber [2026]

Veri Kalitesi: Kurumsal Başarının Gizli Temeli

Veri Kalitesi Boyutları

1. Doğruluk (Accuracy)

2. Tamlık (Completeness)

3. Tutarlılık (Consistency)

4. Zamanında Olma (Timeliness)

5. Geçerlilik (Validity)

6. Benzersizlik (Uniqueness)

Veri Kalitesi Problemlerinin Maliyeti

Veri Kalitesi Araçları

Great Expectations

dbt Tests

Monte Carlo

Data Governance Çerçevesi

1. Veri Sahipliği (Data Ownership)

2. Veri Katalogu (Data Catalog)

3. Metadata Yönetimi

4. Veri Lineage (Veri Kökeni)

Roller ve Sorumluluklar

Veri Kalitesi Yol Haritası

1. Faz (0-3 ay): Keşif ve Tanımlama

2. Faz (3-6 ay): Araç Seçimi ve Kurulumu

3. Faz (6-9 ay): Governance Yapısı

4. Faz (9-12 ay): Sürekli İyileştirme

Veri Kalitesi Metrikleri ve KPI'lar

Data Governance ve Compliance

Smart Maple ile Veri Kalitesi Mimarisi

Related Articles

Yazılım Yaşam Döngüsü Yönetimi (ALM): Uçtan Uca Rehber [2026]

Pazaryeri Entegrasyon Yazılımı: Trendyol, Hepsiburada ve Amazon Türkiye [2026]

Yapay Zeka Projesi Maliyet Analizi: Bütçe, Ekip ve ROI Hesaplama