Smart Maple
veri ambarı

Veri Ambarı ve ETL Pipeline: Modern Data Stack Rehberi

Mehmet Kurtipek
February 3, 2026
6 min read
veri ambarı
ETL
data warehouse
dbt
Airflow
modern data stack

Veri Ambarı ve ETL: Modern İşletmelerin Veri Mimarisi

Cloud-native veri ambarları—Snowflake, BigQuery, Redshift gibi—eski Teradata ve Oracle sistemlerinin yerini aldı. Ancak teknoloji seçimi başarının yalnızca yarısıdır. Doğru ETL/ELT stratejisi ve veri kalitesi yönetimi, veri ambarı başarısının yüzde 70'ini belirler.

Smart Maple, 8 yıl içinde 50+ kuruluşun veri ambarı dönüşümünde rehberlik etti. Oplist healthcare uygulaması örneğinde, terabyte ölçeğindeki hasta verilerini başarıyla yönetiyoruz.

Üç Mimari Yaklaşım: Seçim Rehberi

Data Warehouse (Geleneksel)

Data warehouse, verinin önceden tanımlanmış şema ile yüklenen yapılandırılmış veri deposudur. Normalizasyon kurallarını takip eder, girişte temizlenir ve sorgu performansı mükemmeldir. Ancak yeni veri türlerine adapte olmak zaman alır.

Kurumsal raporlama ve finansal iş zekası için idealdir. Aylık maliyet TB başına 40-100 dolar; 3-5 kişilik DBA ve ETL uzman takım gerekir.

Data Lake (Modern)

Data lake, tüm veri türlerini (yapılandırılmış, yapısız, video, loglar) kabul eden esnek depolardır. Şema daha sonra tanımlanır. Makine öğrenmesi ve veri bilimi için idealdir.

Dezavantajı, veri kalitesi kontrolleri zayıfsa "veri bataklığına" dönüşebilir. Aylık maliyet TB başına 5-15 dolar, ancak veri bilimci ve mühendis ekibi (5-8 kişi) gerekir.

Lakehouse (Hibrit—Tercih Edilen)

Lakehouse, data lake'in esnekliğini data warehouse'un performansıyla birleştirir. Medallion Architecture (Bronz-Gümüş-Altın) katmanlarında veriler organize edilir: ham veriler bronz, temiz ve doğrulanmış veriler gümüş, analitik açısından hazır veriler altın katmanında bulunur.

Günümüzün en yaygın seçimidir. Aylık maliyet TB başına 15-30 dolar.

Kriter Data Warehouse Data Lake Lakehouse
Sorgu Hızı < 100ms 1-10s < 500ms
Maliyet (TB/ay) $40-100 $5-15 $15-30
İnsan Kaynağı 3-5 5-8 5-7
BI Entegrasyonu Doğrudan, hızlı SQL wrapper Doğrudan SQL

ETL vs ELT: Paradigma Değişimi

ETL (Extract, Transform, Load) 1990'lardan kalma yaklaşımıdır. Operasyonel sistemlerden veri çıkarılır, şirket içi sunucularda temizlenir ve dönüştürülür, sonra veri ambarına yüklenir. Talend ve Informatica gibi yazılımlar lisans maliyeti ağırdır.

ELT (Extract, Load, Transform) bulut çağının yaklaşımıdır. Veriler doğrudan bulut ambarına yüklenir, transformasyonlar SQL ve dbt ile paralel olarak yapılır. Ölçeklenebilir, maliyet-etkili ve hızlıdır.

Özellik ETL ELT
Başlangıç Yılı 1990ler 2010lar
Transform Yeri On-prem server Bulut (Snowflake, Spark, dbt)
Ölçeklenebilirlik Dikey (CPU ekle) Yatay (sınırsız)
Maliyeti Yazılım lisansı yüksek Pay-as-you-go

Gerçek Dünya Örneği: Oplist Dönüşümü

Oplist, 2015-2018'de eski Informatica tabanlı ETL kullanıyordu. Hastane kayıtlarından veriyi çekmek, telefon formatı düzenlemek, null değerleri yönetmek ve kayıtları temizlemek 5 saat alıyordu. Tepe saatlerde yaygın darboğazlar oluşuyordu.

Günümüzde Smart Maple yönetimi altında, aynı veri 20 dakikada işlenir. Snowflake'e doğrudan yüklenir, SQL ve dbt ile paralel transformasyonlar yapılır. Ölçeklenebilir, hızlı ve işletme değişikliklerine adapte olabilen bir sistem.

Warehouse Teknolojileri: Kimin İçin?

Kriter Snowflake BigQuery Redshift
Başlangıç Maliyeti $600/ay $0 (1TB free/ay) $800/ay
Kurulum Kolaylığı Düşük (SaaS) Düşük (Cloud-native) Yüksek (Yönetim gerekli)
Sorgu Hızı <100ms 1-5s 1-5s
Ideal Durumlar Enterprise, SaaS Analytics, büyük veri On-prem → Cloud

Snowflake, kurumsal SaaS uygulamaları için en uygun seçimdir. BigQuery, analitik ve büyük veri projeleri için ekonomiktir. Redshift, şirket içi Oracle'dan geçiş yapan kuruluşlar için uyundur.

Modern Data Stack: Teknoloji Yığını

Günümüzün veri teknoloji ekosistemi beş katmandan oluşur: veri toplama (API'ler, webhook'lar), orkestrasyonu (Airflow), depolama (Snowflake, BigQuery), transformasyon (dbt, SQL) ve son kullanıcı uygulamaları (iş zekası, makine öğrenmesi).

Orkestrasyonu yönetmek için Airflow öne çıkıyor. Fivetran ve Stitch gibi SaaS araçları, veritabanlarını otomatik senkronize eder. Transformasyon işleri dbt ile yapılır—SQL yazarak, sürüm kontrollü, tamamen otomatik.

Örnek maliyet (50 kişi şirket, aylık):

Bileşen Tool Maliyet
Orkestrasyonu Airflow (self-hosted) $100
ELT Fivetran $500
Veri Ambarı Snowflake $300
Transformasyon dbt Cloud $400
İş Zekası Metabase $0
Toplam $1,300

Yıllık maliyet: 15.600 TL. Uygulanma süresi: 4-6 hafta.

ETL Pipeline Pratik Uygulaması

Airflow, Apache tarafından desteklenen endüstri standardı bir orkestrasyon platformudur. Oplist gibi bir healthcare uygulamasında, her gün sabah 2:00'de otomatik olarak çalışan günlük bir pipeline tasarlanabilir.

Bu pipeline üç aşamadan oluşur:

Çıkartma (Extract): Oplist'in üretken PostgreSQL veritabanından son 24 saatlik randevu verisi çekilir. Incremental extraction yaklaşımı kullanılarak sadece yeni veya değişmiş kayıtlar işlenir.

Transformasyon (Transform): Veriler temizlenir (null değerler, yinelenen kayıtlar, veri tipi dönüşümleri), zenginleştirilir (randevu saati, haftanın günü) ve doğrulanır (hasta yaşı 0-150 aralığında mı? Klinik ID boş mu?).

Yükleme (Load): Temiz veriler analytics veritabanına yüklenir. Aynı randevu kimliği varsa güncellenir, yoksa eklenir (upsert pattern). Tamamlandıktan sonra, veri kalitesi kontrolleri otomatik olarak çalışır.

Başarılı bir yürütme tamamlandıktan sonra hata oluşursa, data team'e otomatik email uyarısı gönderilir.

Transformasyon: dbt ile SQL-First Yaklaşımı

dbt (data build tool), transformasyon işlerini SQL yazarak yönetmeyi sağlayan açık kaynak araçtır. Version control altında çalışır, test edilebilir ve tam otomatik olarak çalıştırılabilir.

Típik bir workflow Medallion Architecture (Bronz-Gümüş-Altın) modeli izler. Bronz katmanında ham veriler saklanır. Gümüş katmanında veriler temizlenir, doğrulanır ve standart hale getirilir. Altın katmanında ise analitik açısından hazır, agregasyon yapılmış veriler bulunur.

Oplist örneğinde, dbt otomatik olarak her doktor için istatistikleri hesaplar: toplam randevu sayısı, tamamlanan randevu sayısı, iptal oranı ve ortalama randevu süresi. İş zekası araçları bu hazır tabloları kullanarak anlık raporlar ve panolar oluştururlar.

Veri Kalitesi: Otomatik Kontrol

Yüksek kaliteli veri, iş kararlarının güvenilirliğini belirler. Veri kalitesi kontrolleri otomatik olarak çalıştırılabilir: sütun varlığı, boş değer yüzdeleri, tekrarlanan kayıtlar, tarih aralıkları, sayısal sınırlar.

Oplist'te, her günlük pipeline tamamlandıktan sonra appointment_id alanının yüzde 99'undan fazla dolu olup olmadığı, patient_age'nin 0-150 aralığında olup olmadığı, status alanının geçerli değerlerden birine sahip olup olmadığı otomatik olarak kontrol edilir. Başarısız bir kontrol, veriyi raporlama sistemine sunmaz ve alerta iletilir.

Veri Ambarı Mimarileri: Kimball vs Inmon

Kimball mimarisi (boyutsal modelleme), merkez fact table çevresinde dimension tablolar organize eder. Oplist benzeri 50-500 kullanıcıya sahip SaaS şirketleri için idealdir. Hızlı raporlama, basit implementasyon, iş zekası araçlarına doğrudan entegrasyon sağlar.

Inmon mimarisi (kurumsal), merkezi normalized veri ambarından departman-spesifik veri Mart'ları türetir. Fortune 500 şirketleri gibi karmaşık kuruluşlar için uygundur ama yavaş ve pahalıdır.

Smart Maple tavsiyesi: SaaS şirketleri Kimball seçsin. Büyük kuruluşlar hybrid yaklaşım (normalized veri ambarı + Kimball style veri Mart'ları) tercih etsin.

Sonuç: Doğru Teknoloji Yığını

Modern veri mimarisi, eski ETL paradigmasından bulut tabanlı ELT yaklaşımına evrildi. Oplist benzeri healthcare SaaS uygulamaları için Smart Maple bu teknoloji yığınını önerir:

  • Veri Ambarı: Snowflake (maliyet-etkili, ölçeklenebilir)
  • Orkestrasyonu: Airflow (açık kaynak, esnek)
  • Transformasyon: dbt (SQL-first, sürüm kontrollü)
  • İş Zekası: Metabase (açık kaynak) + Power BI (kurumsal)

Maliyet: Yılda 15.600 TL | Süre: 4-6 hafta | ROI: İlk 3 ayda pozitif

Veri ambarı mimarisi, sadece teknik bir proje değildir—stratejik bir iş kararıdır. Doğru mimari, işletmenizin verilerden maksimum değer çıkarmasını sağlar. Smart Maple, 8 yıldır 50+ kuruluşun bu dönüşümünü başarıyla yönetmiştir.

Smart Maple ile başlayın. Veri mimarı uzmanlarımız, işletmeniz için özelleştirilmiş bir çözüm tasarlayabilir.

Related Articles

March 1, 2026

Yazılım Yaşam Döngüsü Yönetimi (ALM): Uçtan Uca Rehber [2026]

ALM Nedir ve Neden Önemli? ALM (Application Lifecycle Management), yazılımın doğumundan, yaşamından ve ölümüne kadarki tüm süreci yönetmektir. Şöyle hayal edin: * Doğum: İşletmenin "Bu özellik gerekli" dediğinde, yazılım düşünülür. * Gebelik: Gereksinimler tanımlanır, tasarlanır, geliştirme yapılır. * Doğum: Yazılım, üretim ortamında canlı alınır. * Hayat: Bakım, güncellemeler, iyileştirmeler yapılır. * Yaşlanma: Hata oranı artıyor, bakım maliyeti yükseli. Modernizasyon düşünülür. *

Read More
February 28, 2026

Pazaryeri Entegrasyon Yazılımı: Trendyol, Hepsiburada ve Amazon Türkiye [2026]

Türkiye'de satış yapmak artık tek bir kanal üzerinden imkansız hale geldi. 2026 yılında, e-ticaret satışlarının yüzde 70-80'i üçüncü taraf pazaryerlerinde gerçekleşmektedir. Trendyol, Hepsiburada, Amazon Türkiye, N11, GittiGidiyor gibi platformlar, artık e-ticaret işletmelerinin hayatı değiştirebilecek bölümüdür. Ancak bu fırsat, bir sorunla birlikte gelir: her pazaryerini ayrı ayrı yönetmek, manuel olarak ürün yükleme, fiyat güncelleme, sipariş takibi imkansızdır. Büyüyen işletmeler için paza

Read More
February 27, 2026

Yapay Zeka Projesi Maliyet Analizi: Bütçe, Ekip ve ROI Hesaplama

Yapay zeka projelerine yatırım yapma kararı alan işletmeler için en kritik soru şudur: "Ne kadar maliyetli olacak?" Bu soruya net bir cevap vermek, proje kapsamından ekip bileşimine, bulut altyapısından veri yönetimine kadar birçok faktörün analiz edilmesini gerektirir. Bu rehber, yapay zeka projelerinin gerçekçi bütçelendirilmesi için bir yol haritasıdır. Yapay Zeka Projesi Maliyet Bileşenleri Bir yapay zeka projesinin toplam maliyeti, beş ana kategoriye ayrılır: insan kaynakları ve pers

Read More