Veri Analizi Proje Fikirleri: Portföyünüz için Başlangıç & İleri Seviye Çal...

Veri Analizi Proje Fikirleri: Portföyünüz için Başlangıç & İleri Seviye Çalışmalar

Bu blog yazısı, veri analizi alanında portföy geliştirmek isteyenler için kapsamlı bir proje rehberi sunuyor. Yazı, başlangıç seviyesinden ileri seviyeye kadar farklı zorluk derecelerinde proje fikirlerini ve izlenebilecek adımları aktarıyor.
Miuul24 Eyl 2025

 

Veri analizi süreçlerini öğrenmenin en etkili yollarından biri, gerçek hayat senaryoları ile projeler geliştirmektir. Teorik eğitimler temeli atsa da, projeler sayesinde öğrendiklerinizi uygulama fırsatı bulur ve portföyünüzü iş görüşmelerinde öne çıkaracak şekilde güçlendirebilirsiniz.


Neden proje yapmalısınız?

 

  • İşe alım süreçlerinde yalnızca teknik bilginiz değil, yaptığınız projeleri nasıl sunduğunuz da önemlidir.
  • Projeler; veri temizleme, analiz, görselleştirme ve raporlama becerilerinizin yanı sıra iletişim gücünüzü de ortaya çıkarır.
  • GitHub veya portföyünüze ekleyeceğiniz projeler, sizi benzer adaylardan ayrıştırır.
     

Başlamak için doğru projeyi seçmekte zorlanıyorsanız Data Analytics Bootcamp içeriğine göz atarak adım adım bir yol haritası izleyebilirsiniz.

 

Doğru Projeyi Nasıl Seçersiniz?

Bir projeye başlamadan önce şu kriterlere dikkat edin:

  1. Haftada 5 saat ayırabilen biri ile tam zamanlı çalışan birinin proje kapsamı farklı olmalıdır.
  2. Başlangıç seviyesinde iseniz Excel ve SQL ile başlayın, Python ve Power BI’a kademeli geçiş yapın.
  3. E-ticaret, finans, pazarlama, sağlık ya da insan kaynakları gibi hangi alana yakın hissediyorsanız o alanda veri seçin.

Ayrıca, veri erişiminin kolay olması ve net KPI’ların (örneğin, “müşteri kayıp oranını %10 azaltmak”) tanımlanması projeyi değerli kılar.

 

Başlangıç Seviye Projeler

 

Excel ile CRM Kohort Analizi (Başlangıç)

 

Amaç: Müşterilerin ilk alışveriş tarihine göre segmentlere ayrılması, hangi kohortun daha uzun süre aktif kaldığının ölçülmesi. Böylece müşteri sadakati ve retention trendleri anlaşılır.
 

Veri: Online Retail II dataset (Bir e-ticaret mağazasının satış verileri). 

 Online Retail II

Araçlar: Excel (Pivot Table, Power Query, Conditional Formatting).
 

Adımlar:

  • Veri temizleme: eksik değerler, iptal edilmiş siparişler.
  • Müşteri ID ve alışveriş tarihine göre kohort tanımlama.
  • Aylık kohort matrisi oluşturma.
  • Retention oranlarını grafikleştirme.

Beklenen Çıktı: Hangi dönemlerde müşteri kaybının hızlandığını gösteren retention tablosu ve görsel grafikler.

 

SQL ile Satış Verisi Keşfi

 

Amaç: Satışları ürün, kategori, müşteri ve bölge bazında analiz ederek en kârlı müşteri gruplarını ortaya çıkarmak.
 

Önerilen Kaggle Satış Veri Setleri:


Araçlar: SQL (JOIN, GROUP BY, WINDOW Functions, OUTLIER tespiti).
 

Adımlar:

  • JOIN ile müşteri–sipariş–ürün ilişkilerini birleştirme.
  • Zaman serisi analizi ile aylık satış trendlerini çıkarmak.

Ortalama sepet büyüklüğü ve outlier siparişlerin tespiti.
Beklenen Çıktı: Satış performansını özetleyen SQL sorguları ve raporlanabilir tablolar.

 

Python & Pandas Kütüphanesi ile E-Ticaret EDA

 

Amaç: E-ticaret verisi üzerinde keşifsel veri analizi (EDA) yaparak trendleri, anomalileri ve müşteri alışkanlıklarını belirlemek.

Önerilen Kaggle E-Ticaret Veri Setleri:

  1. E-Commerce Data (UK Online Retail)
    1 Aralık 2010 – 9 Aralık 2011 tarihleri arasında Birleşik Krallık merkezli, fiziksel mağazası olmayan bir perakende işlemlerini içeriyor. 
  2. E-Commerce Dataset for Data Analysis
    Yaklaşık 55.000 sentetik müşteri işlemi. Genel e-ticaret analizi ve test çalışmaları için idealdir.
  3. E-Commerce Sales Dataset
    Shiprocket ve diğer satış kanallarına dair derinlemesine satış verisi sunuyor. Karlılık ve kanal bazlı analizler için güçlü bir veri setidir.
  4. Online Retail II Data Set (UK)
    1 Aralık 2009 – 9 Aralık 2011 tarihleri arasında gerçekleşen İngiltere merkezli online perakende işlemlerini içeriyor.
  5. Brazilian E-Commerce Public Dataset by Olist
    Brezilya'da Olist üzerinden gerçekleştirilmiş ~100.000 siparişi kapsayan geniş bir dataset. Sipariş, ödeme, gönderim, müşteri ve satıcı bilgilerini içeriyor. Coğrafya, davranış ve segmentasyon analizleri için idealdir.
  6. Comprehensive Synthetic E-Commerce Dataset
    Aralık 2024’te yayımlanmış, sentetik ama kapsamlı bir veri seti. İşlem, müşteri, ürün ve reklam verilerini dinamik bir biçimde sunuyor. 

Araçlar: Python, pandas, matplotlib, seaborn.
 

Adımlar:

  • Veri temizleme: eksik değerler, aykırı değerlerin yönetimi.
  • Ürün kategorisi bazında satış dağılımı.
  • Müşteri davranışları: tekrar eden alışverişler, ortalama harcama.

Zaman serisi analizi: sezonluk trendler.
 

Beklenen Çıktı: Analizi destekleyen görselleştirilmiş grafikler ve raporlanabilir özet tablolar.

 

Power BI ile Ürün Karlılık Dashboard

 

Amaç: Ürün bazında kâr ve gelir performansını görselleştiren interaktif bir dashboard geliştirmek.

 

Önerilen Microsoft Kârlılık Verileri:

1. Retail Analysis / Store Sales Sample

  • Ürün ve müşteri bazında kârlılığı analiz etmeye yönelik CFO’lar için tasarlanmış bir örnektir. Power BI’ın yerleşik örneklerinde bu rapora da ulaşabilir, .pbix dosyasını indirme veya hizmet üzerinden açma şansın vardır.

Microsoft Learn - Store Sales Sample

Araçlar: Power BI, DAX, Time Intelligence Functions.
 

Adımlar:

  • Veri modelleme: ürün, satış, müşteri tablolarının ilişkilendirilmesi.
  • Kâr marjı, toplam gelir, aylık trend KPI’larının hesaplanması.

Dilimleyici (slicer) kullanarak kullanıcıya esnek filtreleme imkanı.

Beklenen Çıktı: Ürün bazında kârlılık ve performans trendlerini gösteren etkileşimli dashboard.

 

Web Scraping ile Fiyat Takibi

 

Amaç: Rakip e-ticaret sitelerindeki ürün fiyatlarını çekerek zaman içinde fiyat değişimlerini takip etmek.
 

Veri: Web scraping ile toplanan fiyat verileri.
 

Araçlar: Python, Beautiful Soup, requests, pandas, matplotlib.
 

Adımlar:

  • Hedef web sayfasının HTML yapısının analizi.
  • Fiyat ve ürün bilgilerini otomatik çekmek.
  • Veriyi saklamak (CSV/SQL).

Zaman içindeki fiyat değişimlerini görselleştirmek.

Beklenen Çıktı: Rakip ürünlerin fiyat değişim grafikleri ve raporlanabilir fiyat karşılaştırma tablosu.

 

A/B Testi Simülasyonu

 

Amaç: Web sayfasında farklı buton rengi veya kampanya tekliflerinin kullanıcı davranışına etkisini ölçmek.
 

Veri: Simüle edilmiş kullanıcı tıklama ve dönüşüm verileri.
 

Araçlar: Excel veya Python (scipy.stats, pandas).
 

Adımlar:

  • Kontrol ve deney grubu verilerinin hazırlanması.
  • Hipotez testinin tanımlanması (H0, H1).
  • T-test veya ki-kare testi uygulanması.

P-value ve güven aralığının yorumlanması.


Beklenen Çıktı: A/B testi sonucunda deney grubunun gerçekten daha yüksek dönüşüm sağladığını gösteren istatistiksel rapor.

 

Orta/İleri Seviye Projeler

 

Müşteri Segmentasyonu (RFM + K-means)

Amaç: Müşteri gruplarını “recency, frequency, monetary” kriterlerine göre ayırmak ve pazarlama stratejilerini kişiselleştirmek.

Önerilen Segmentasyon Kaggle Verileri:

  • Customer Segmentation using RFM modeling & K-Means

Customer Segmentation

  • Customer Segmentation by RFM model and K-Means

RFM model and K-Means 


Araçlar: Python (pandas, scikit-learn, matplotlib).
 

Beklenen Çıktı: Yüksek değerli müşteriler, potansiyel kayıp müşteriler gibi segmentler.


Churn Tahmini (Müşteri Kaybı)

 

Amaç: Abonelik bazlı şirketlerde hangi müşterilerin hizmeti bırakacağını önceden tahmin etmek.
 

Veri: Abonelik ve kullanım verileri (telekom, SaaS, bankacılık).
 

Araçlar: Python (scikit-learn, XGBoost, SHAP).
 

Beklenen Çıktı: ROC-AUC skoru yüksek bir model + modelin neden bu tahminleri yaptığını açıklayan SHAP grafikleri.


Kredi Risk Modeli (Finans Odaklı)

 

Amaç: Banka veya finans kurumlarında müşterilerin kredi geri ödememe riskini öngörmek.
 

Veri: German Credit Dataset veya LendingClub kredi verisi.
 

Araçlar: Python (pandas, scikit-learn, XGBoost, LightGBM).

Adımlar:

  • Veri temizleme ve feature engineering (gelir, kredi geçmişi, borç/gelir oranı).
  • Modelleme: lojistik regresyon, ağaç tabanlı yöntemler.
  • Değerlendirme metrikleri: ROC-AUC, Precision-Recall, F1.

Model yorumlama: SHAP ile hangi değişkenlerin riski artırdığı.
 

Beklenen Çıktı: Kredi risk sınıflandırması, yüksek riskli müşterilerin erken uyarı listesi.
 

Pazarlama KPI Panosu (Power BI)

 

Amaç: Reklam kampanyalarının performansını (ROI, CPA, CTR) ölçmek.
 

Veri: Google Ads veya Facebook Ads verileri.
 

Araçlar: Power BI, DAX.
 

Beklenen Çıktı: Kampanyaların etkinliğini görselleştiren etkileşimli rapor.
 

Fraud İzleme & Anomali Tespiti

 

Amaç: Kredi kartı işlemlerinde sahtekarlık veya şüpheli aktiviteleri tespit etmek.
 

Veri: Kaggle Credit Card Fraud Dataset.
 

Araçlar: Python (imbalanced-learn, scikit-learn).
 

Beklenen Çıktı: Anormal işlemleri işaretleyen uyarı sistemi.


Recommender System (Öneri Motoru)

 

Amaç: Kullanıcılara geçmiş etkileşimlerine göre ürün önerileri yapmak.
 

Veri: Film, müzik veya e-ticaret alışveriş verileri.
 

Araçlar: Python (surprise, lightFM).
 

Beklenen Çıktı: Kullanıcı bazlı veya içerik bazlı öneri listeleri.
 

İK Analitiği: Yetenek Edinimi & Devir Analizi

 

Amaç: Çalışan kaybı (attrition) ve işe alım performansını analiz etmek.
 

Veri: HR Analytics dataset.
 

Araçlar: Python veya Power BI.
 

Beklenen Çıktı: Çalışan memnuniyetini artırmaya yönelik veriye dayalı öneriler.


Final/Bitirme Projeleri

8–12 hafta sürecek kapsamlı bir araştırma odaklı proje:

  • Çoklu veri kaynağı kullanımı.
  • Hipotez tanımlama ve test etme.
  • Model geliştirme (varsa).
  • Dashboard + raporlama.
  • Sunum için profesyonel çıktıların hazırlanması.

Bu projeler, mezuniyet sonrası veya iş başvurularında güçlü bir referans olacaktır.


Portföy & Sunum İpuçları

 

  • GitHub’da her proje için README dosyası hazırlayın.
  • Görseller, grafikler ve raporlama çıktıları ekleyin.
  • Kişisel verilerin gizliliğine dikkat edin.
  • LinkedIn’de proje paylaşımlarınızı düzenli hale getirin.
     

Sık Sorulan Sorular

 

Hangi projeyle başlamalıyım?

Eğer yeni başlıyorsanız, veri analizi yolculuğunuzun ilk adımında Excel veya SQL projeleri ile başlamanız en doğru seçim olur. Çünkü:

  • Excel, hızlı veri temizleme ve görselleştirme için idealdir.
  • SQL ise veriye erişim, sorgulama ve iş mantığını kavrama açısından temel beceri kazandırır.
    İlk projelerinizde “küçük veri setleri” ile çalışın. Zamanla Python, Power BI veya Tableau gibi araçlara geçebilirsiniz.

 

Power BI mı Python mu öğrenmeliyim?

Aslında her ikisinin de işlevi farklıdır:

  • Power BI: Dashboard, KPI takibi ve iş birimlerine hızlı raporlama için güçlüdür. Görsel odaklıdır ve iş dünyasında sık tercih edilir.
  • Python: Veri bilimi, modelleme, makine öğrenmesi ve daha ileri analizler için vazgeçilmezdir. Daha esnektir ama öğrenme eğrisi biraz daha yüksektir.
    Eğer “veri analisti” olarak kariyer hedefliyorsanız önce Power BI, “veri bilimci” olmak istiyorsanız önce Python öğrenmek mantıklı olacaktır.

 

Portföyümde kaç proje olmalı?

Teknik bilginiz kadar portföyünüzün çeşitliliği de önemlidir. İdeal bir portföy:

  • 3 başlangıç seviye proje (Excel, SQL, basit Python EDA)
  • 2 orta seviye proje (Müşteri segmentasyonu, dashboard, A/B testi)

1 ileri seviye proje (Tahminleme modeli, fraud detection, öneri motoru gibi)
➡Böyle bir portföy, iş görüşmelerinde hem temel becerilerinizi hem de ileriye dönük potansiyelinizi gösterecektir.

 

Veriyi Nereden Bulabilirim?

 

Açık veri kaynakları sayesinde gerçekçi projeler geliştirmek mümkündür. İşte en popüler kaynaklardan bazıları:

  • Kaggle → Çeşitli sektörlerden çok sayıda veri seti.
  • UCI Machine Learning Repository → Akademik araştırmalarda kullanılan klasik veri setleri.
  • Google Dataset Search → Her alandan açık veri aramak için güçlü bir arama motoru.
  • Resmi kurum verileri:

    • TÜİK
    • Dünya Bankası DataBank
    • OECD Data

Ayrıca, küçük çaplı projeler için kendi verinizi toplamak (anket, web scraping) de portföyünüze özgünlük katar.
 

10 Ücretsiz ve Popüler Veri Seti (EDA için)

Bir EDA (Exploratory Data Analysis) projesi, internetteki zengin açık veri kaynaklarını kullanmak için harika bir fırsattır. İşte keşfe başlayabileceğiniz 10 eğlenceli ve ücretsiz küresel veri seti:

  1. National Centers for Environmental Information → Dünyanın en büyük hava durumu ve iklim verisi sağlayıcısı.
  2. World Happiness Report 2021 → Dünyanın en mutlu ülkeleri neden bu kadar mutlu?
  3. NASA Open Data → Uzay ve yer bilimleriyle ilgili on binlerce açık veri seti.
  4. UK Census 2024 → İngiltere halkı ve ekonomisi hakkında en güncel nüfus sayımı verileri.
  5. FBI Crime Data Explorer → ABD’de 18.000’den fazla kolluk kuvvetinin topladığı suç verileri.
  6. WHO COVID-19 Dashboard → Ülke ve bölge bazında COVID-19 istatistikleri.
  7. Netflix Reviews Dataset (Kaggle) → Google Play Store’daki Netflix kullanıcı yorumları (günlük güncelleniyor).
  8. Google Books Ngram → 1960–2015 yılları arasında yayımlanmış kitaplardan alınan ifade trendleri.
  9. MPS Business Crime Dashboard Data → Metropolitan Polis Teşkilatı tarafından aylık olarak güncellenen suç verileri.
  10. Yelp Open Dataset → Yelp kullanıcı yorumları, check-in bilgileri ve işletme özellikleri.

 

Projelerimi nasıl sunmalıyım?

 

Teknik analiz kadar sunum becerisi de kritik. İyi bir proje sunumu için:

  • GitHub’da her proje için README.md dosyası hazırlayın. (Projenin amacı, kullanılan araçlar, adımlar, görseller, çıktı).
  • Dashboard veya görselleştirmelerden ekran görüntüleri ekleyin.
  • LinkedIn’de düzenli olarak proje paylaşımları yapın.
  • Sunum yaparken yalnızca “nasıl yaptığınızı” değil, aynı zamanda “neden yaptığınızı” ve “elde edilen iş değerini” vurgulayın.

Kariyerinize güçlü bir başlangıç yapmak için Data Analytics Bootcamp içeriğine göz atabilirsiniz.

Miuul

Skills of tomorrow

Miuul topluluğunun bir parçası ol!

Abone ol butonuna tıklayarak Miuul'dan pazarlama ve haber içerikleri almayı onaylıyorum.