Sohbete Başla

KVKK metnini okudum, onaylıyorum.

Veri Bilimi Mühendisliği

Büyük Veri ve Veri Mühendisliği Yetenekleri ile Veri Bilimci Ol.

Kayıt Ol

Kendinize uygun planlama ile programa katılın

12 ay

Tahmini Süre

Modül

Sektörel Proje

140+

Quiz

Sertifika

Mezuniyette

₺270K

Yıllık Kazanç

Mezunlarımızın Çalıştığı Şirketler

Modüller

Veri Bilimi Mühendisliği

Veri Bilimi ve Veri Mühendisliği; veri odaklı pozisyonlar arasında en fazla ihtiyaç duyulan alanlardan. Bu program Veri Mühendisliği yetenekleri ile donatılmış Veri Bilimci yetiştirmek üzere oluşturulmuştur. Veri Mühendisliği ve Veri Bilimi görevleri iç içe olan şirketler ve bu şirketlerde pozisyon arayışında olan kişiler için tasarlanmıştır.

Modül 1 11 Saat

Veri Bilimi için Python Programlama

Bu eğitim Python programlama dilini etkin bir PyCharm IDE kullanımı ile fonksiyonel yetenekler kapsamında öğrenilmesini sağlar. Veri okuma, veri ön işleme, özellik geliştirme ve makine öğrenmesi (machine learning) modelleri üretimi gibi tüm temel veri bilimi işlemlerini yapabilmeniz için gerekli altyapıyı proje geliştirme düzeyinde edineceksiniz.

Müfredat

Çalışma Ortamı Ayarları

PyCharm, Virtual Environment ve Dependency Management konuları ile büyük ölçekli projeler için kendi çalışma ortamınızı oluşturmayı ve yönetmeyi öğreneceksiniz. Çalışma ortamı ayarları gerçekleştirildikten sonra Python’da ilk adımlarımızı atmış olacağız.

Veri Yapıları

Python programlamanın temellerini oluşturan veri yapılarını kapsamlı bir şekilde öğrenme imkanı bulacaksınız.

Fonksiyonlar, Koşullar, Döngüler, Comprehensions

Sıfırdan kapsamlı bir şekilde ileri seviye fonksiyonları yazmayı öğrenecek ve zor senaryolar için kendi fonksiyonlarınızı yazabileceksiniz. Ayrıca comprehensions konusu ile veri bilimi ve makine öğrenmesi süreçlerini ölçeklenebilir pipeline’lar ile sürdürebilmek için çok değerli bilgiler edineceksiniz.

Python ile Veri Analizi

Veri bilimi, makine öğrenmesi ve yapay zeka uygulamaları için kaçınılmaz olan temel kütüphaneleri öğreneceksiniz. Bu bilgileri yaygın kaynaklardan farklı olarak gelişmiş fonksiyonlar yazmak için kullanacaksınız ve fonksiyonel veri analizi modülünüzü dokümantasyonu ile birlikte yazabileceksiniz.

Modül 2 7 Saat

Özellik Mühendisliği

Veri bilimi süreçlerinin çok büyük bir kısmını, veri temizliği ve değişken mühendisliği oluşturmaktadır. Bu eğitim; ham veriyi temizleyerek, ilgili veriden yeni özellik çıkarmak ve modele girmeye uygun olmayan değişkenleri dönüştürmek için öğrencilerin belirli yaklaşımlar edinmesini amaçlamaktadır. Edinilen yaklaşımlar sayesinde veri setini bir makine öğrenmesi (machine learning) modeline girmeye uygun hale getirme konusunda gerekli altyapıyı edineceksiniz.

Müfredat

Outliers

Veri setindeki aykırı gözlemler ile mücadele etme yöntemleri hakkında bilgi edineceksiniz.

Missing Values

Veri setindeki eksik gözlemler ile mücadele etme yöntemleri hakkında bilgi edineceksiniz.

Encoding Scaling

Veriyi makine öğrenmesine girmeden önce sayısal ifadelerle temsil etmemizi sağlayan LabelEncoder ve One-Hot Encoding yaklaşımları ve uzaklık temelli makine öğrenmesi algoritmalarında model performansını önemli ölçüde etkileyen değişken standartlaştırma ve değişken dönüşüm işlemleri hakkında bilgi edineceksiniz.

Feature Extraction

Regular expression yardımıyla, ham veriyi temizleyerek anlamlı hale getirmek için kullanılan yöntemler hakkında bilgi edineceksiniz.

Modül 3 13 Saat

Makine Öğrenmesi

Veri bilimi Python programlama dilini kullanarak ve CRISP-DM süreçlerini dikkate alarak denetimli ve denetimsiz makine öğrenmesi (machine learning) yöntemlerini öğrenmemizi sağlar. Bu eğitimde geleneksel algoritmalar ve son zamanlarda öne çıkan birçok algoritmayı (XGBoost, LightGBM, CatBoost) kıyaslayarak ve model seçme özellikleri ile işleyerek önemli bir yetkinlik edineceksiniz.

Müfredat

Temel Kavramlar

Makine öğrenmesine giriş yapacağınız bu bölümde makine öğrenmesi için gerekli olan temel kavramları öğreneceksiniz.

Doğrusal Regresyon

Bağımlı ve bağımsız değişken/değişkenler arasındaki ilişkiyi doğrusal olarak modelleyen doğrusal regresyon algoritmasının teorisini öğrenecek ve uygulamasını gerçekleştireceksiniz.

Lojistik Regresyon

Sınıflandırma problemi için bağımlı ve bağımsız değişkenler arasındaki ilişkiyi doğrusal olarak modelleyen lojistik regresyon algoritmasının teorisini öğrenecek ve uygulamasını gerçekleştireceksiniz.

CART ( Classification & Regression Tree )

Makine öğrenmesi dünyasında çok geniş bir alana sahip olan karar ağaçlarının temelini oluşturan CART’ın teorisini öğrenecek ve uygulamasını gerçekleştireceksiniz.

Gelişmiş Ağaç Yöntemleri

Gelişmiş ağaç yöntemlerinin ele alınacağı bu bölümde Random Forests ve Gradient Descent temelli ağaç yöntemleri ele alınacaktır.

Denetimsiz Öğrenme

Modele verilebilecek herhangi bir bağımlı değişken olmadığı durumlarda, verideki gözlemleri uzaklık tabanlı gruplayarak sınıflandırmamızı sağlayan modeller hakkında bilgi edineceksiniz.

Makine Öğrenmesi Pipeline

Uçtan uca bir makine öğrenmesi pipeline oluşturma sürecini öğrenme imkanı bulacaksınız.

Modül 4 6 Saat

Büyük Veri Temelleri

Büyük veri, geleneksel yaklaşımla işlenip yönetilemeyecek kadar büyük ve karmaşık veriye işaret eder. Veri günümüzde şirket ve kurumların çalışma şekillerini kökten değiştirmeye başlamıştır. Bu durum önümüzdeki yıllarda daha da hayati bir noktaya gelecek. Veriyi stratejik bir değer olarak gören şirketler görmeyenlere göre öne geçecektir.

Neredeyse iki yılda bir üretilen verinin ikiye katlandığı bir dünyada artık veriyi tek bir makineye sıkışarak işlemek, saklamak, analiz etmek zorlaşmaktadır. Üstelik artık her şeyin tek bir makinede olduğu sistemler tek nokta kırılganlığı taşıdığından veri işleyen sistemler ister istemez ölçeklenmektedir.

Bu modülde büyük verinin başlangıcından beri var olan ve halen dünya büyük verisinin çoğunu saklayan ve işleyen açık kaynak kodlu projeler uygulama seviyesinde öğrenilecektir. Aynı zamanda büyük veri ve dağıtık veri işlemenin temel mantığı özümsenecektir.

Müfredat

Apache Hadoop Temel Bileşenler: HDFS, YARN ve MapReduce

Apache Hadoop açık kaynak kodlu büyük veri dünyasının en önde gelen popüler platformudur. Bu bölümde Hadoop Dağıtık Dosya Sistemi (HDFS), Kaynak Yönetimi (YARN) ve dağıtık veri işleme çerçevesi MapReduce öğrenilecektir. Veri Hadoop'a nasıl taşınır? Hadoop'dan veri nasıl alınır? MapReduce ile HDFS üzerindeki veri nasıl işlenir? YARN Resource Manager ara yüzlerinden işler nasıl takip edilir gibi konular öğrenilecektir.

Apache Hive: Büyük Veri Ambarı Çözümü

HDFS üzerinde saklanan veri üzerinde SQL benzeri bir dil ile sorgulama yapılmasına imkân sağlayan ve büyük veri dünyasında veri ambarı (data warehouse) / veri gölü (data lake) yapılarında sıklıkla kullanılan bir projedir. Hive veri tabanı ve tablo yaratma, veri setlerini Hive tablosu haline getirme, SQL editörünü Hive'a bağlama, SQL sorgu dosyalarını Hive üzerinde çalıştırma, Hadoop dosya formatları, Partitioning ve Bucketing gibi konular öğrenilecektir.

Apache Sqoop ile Hadoop ve İlişkisel Veri Tabanları Arasında Veri Transferi

Hadoop ile ilişkisel veri tabanları arasında veri transferi sağlayan bir projedir. Sqoop ile PostgreSQL veri tabanında sorgu çalıştırma, Hadoop, Hive ve PostgreSQL arasında karşılıklı olarak veri aktarımları uygulamalı olarak öğrenilecektir.

Apache Kafka: Gerçek Zamanlı Veri İşleme Platformu

Akan veri işleyen sistemler ve uygulamaların kalbinde yer alan oldukça popüler bir dağıtık akan veri platformudur. Kafka'nın temel özellikleri, kavramları, topic oluşturma, Python ile Kafka'ya mesaj gönderme ve okuma, console consumer/producer ve consumer grupları kullanımı uygulamalı olarak öğrenilecektir.

Modül 5 6 Saat

Apache Spark ile Büyük Veri İşleme

Spark, dağıtık veri işlemenin zorlu tarafını geliştiriciden yalıtarak ona bütünleşik ve kullanımı kolay API’ler sunan analitik bir veri işleme platformudur. Spark'ın bütünleşik programlama modeli, veri açısından zengin analitik uygulamalar geliştirenler için onu en iyi seçim haline getirir. Spark ile parti veya akan veri işlemek mümkündür.

Büyük verileri bildiğiniz SQL’i kullanarak sorgulamak çok kolaydır. Apache Spark, açık kaynaklı bir proje olarak, hızla ve ölçeklenerek yeniliği ateşliyor. Bu eğitimde popüler veri bilimi programlama dili Python ile Spark nasıl kullanılır öğrenilecek ve veri manipülasyonundan, kodların optimize edilmesine kadar geniş ölçekte veri işlemenin püf noktaları öğrenilecektir.

Son olarak işlenen verilerin düzenli ve sistematik olarak nasıl saklanacağı ve buradan bu veriyi tüketecek iç dış müşterilere en güncel, tutarlı ve doğru şekilde nasıl sunulabileceği görülecektir.

Müfredat

PySpark Dataframe Operasyonları

Büyük ölçekli verilerin dağıtık olarak veri manipülasyonu yapılmasını sağlar. Spark'ın temelleri, veri okuma, filtreleme, yeni özellikler ekleme, dönüştürme, diske yazma, kullanıcı tanımlı fonksiyon yazma, SparkSQL fonksiyonlarını kullanma, aggregation, Spark'ı YARN modunda çalıştırma gibi konular uygulama seviyesinde öğrenilecektir.

Veri Kaynakları

Spark ile ilişkisel veri tabanları, HDFS, Hive gibi farklı veri kaynaklarına okuma yazma yapılır. Farklı veri formatları ve sıkıştırma algoritmaları ile veriler okunur yazılır.

Spark Uygulamasını Çalıştırma ve Optimizasyon

Performans optimizasyonuna çok açık olan Spark için performans ve kaynakları etkin kullanma incelikleri öğrenilir. Dinamik kaynak kullanımı, partitioning ve bucketing, adaptive query, shuffle partitions gibi konular ele alınmaktadır.

Bir Lakehouse olarak Delta Lake

Büyük veri dünyasındaki ACID problemine çözüm getiren ve büyük veriyi daha da özgürleştirerek ilişkisel veri tabanı konforunu dağıtık devasa veri üzerinde sağlayan proje olan Delta Lake öğrenilecektir. Delta Lake ile büyük veri üzerinde upsert, update, insert, delete gibi temel CRUD operasyonları ele alınacaktır.

Modül 6 3 Saat

Spark Makine Öğrenmesi

Müfredat

Spark ile Yapay Öğrenmeye Giriş

Spark yapay öğrenme kütüphanelerinin tanıtımı ve Spark ML Pipelines temel kavramları ele alınarak makine öğrenmesi uygulamalarına giriş ve ön hazırlık yapılır.

Veri Ön İşleme ve Regresyon

En yaygın gözetimli öğrenme yöntemlerinden olan Regresyon ile model geliştirilecek ve veri hazırlık süreci detaylı olarak ele alınacaktır. Regresyon model değerlendirme kütüphanesi kullanılarak başarı metrikleri elde edilecektir.

Sınıflandırma

Spark ML sınıflandırma algoritmalarından birisiyle ve örnek bir veri seti üzerinde ML Pipelines kullanarak sınıflandırma modeli geliştirilecektir. Sınıflandırma model değerlendirme kütüphanesi kullanılarak başarı metrikleri elde edilecektir.

Kümeleme

Spark ML kütüphanesinde bulunan KMeans algoritması örnek bir veri seti üzerinde kullanarak kümeleme modeli geliştirilecektir. Kümeleme model değerlendirme kütüphanesi kullanılarak ideal küme sayısı bulunacaktır.

Modül 7 7 Saat

Production Level Data Science

Bu eğitim 'Veri Bilimcileri' ve adaylarını teknik yönden güçlendirmek, onları konteyner ortamlarıyla tanıştırmak, farklı model dağıtım seçenekleri hakkında bilgiyle donatarak yeterli pratikliği kazandırmayı hedeflemektedir. Linux komut satırı temelleriyle başlayan teknik yeterliliği arttırma serüveni bash scripting, sürüm kontrol sistemi kullanımı, PostgreSQL temel ve konteyner ile devam etmektedir. Temel yetkinliği kazandıktan sonra geliştirilen modellerin dağıtımı ve otomasyonu konusunda uygulama seviyesinde yetkinlik kazanılacaktır.

Müfredat

Linux Komut Satırına Giriş

Linux terminalinde günlük hayatta sık kullanılan komutlar, kavramlar, metin editörleri, dosya sahiplik ve erişim yetkileri ve daha birçok konu uygulamalı olarak öğrenilir.

Temel Bash Scripting

Rutin ve tekrarlanan işlerin programlama dilini andıran bash scripting ile ilgili koşullar, döngüler, fonksiyon oluşturma, dosya içeriği okuma, argüman kullanma gibi konular öğrenilecektir.

Crontab ile Periyodik İşler Yapmak

Crontab nedir, nasıl kullanılır örnek bir bash script üzerinden öğrenilir.

Sürüm Kontrol Sistemi: Git

Örnek proje üzerinden sürüm kontrol sisteminin mantığı, kullanımı, github entegrasyonu, branch oluşturma, değiştirme, merge, hesap token’ı oluşturma ve kullanma konuları uygulamalı olarak öğrenilir

PostgreSQL Temel

PostgreSQL veri tabını servisini çalıştırma, durdurma, Psql shell bağlantısı, veri tabanı yaratma, tablo yaratma, bir csv dosyasındaki kayıtların tabloya girilmesi, sql editörü DBeaver’ı PostgreSQL veri tabanına bağlama konuları uygulamalı olarak öğrenilir.

Docker ile Konteyner Dünyasına Giriş

Docker giriş, temel kavramları, komut satırı, konteyner oluşturma, çalıştırma, durdurma, loglarını inceleme, volume oluşturma, Docker network, Docker imaj oluşturma, Docker Hub içinde imaj arama, imaj etiketleme, Dockerfile dosyası oluşturma, özgün imajlar yaratma, imajların Docker Hub’a gönderilmesi, Docker Compose ile multi-container uygulamalar çalıştırma konuları uygulamalı seviyede öğrenilir.

MLOps ve Bir MLOps Aracı olarak Mlflow

MLOps ve MLflow temel kavramları, veri bilimi projesi hayat döngüsündeki yeri, model geliştirme esnasında MLflow entegrasyonu, model seçimi, model registiry, MLflow ile model deployment konuları uygulamalı olarak öğrenilir.

Model Dağıtımında CI/CD ve Jenkins Kullanımı

CD/CD kavramı, otomasyonun önemi, Jenkins’in yazılım dağıtımındaki rolü, git commit ile CI/CD pipeline tetikleyerek uygulamanın canlı ortamda çalıştırılması uygulamalı olarak öğrenilir.

Kubernetes Temel ve Model Dağıtımı

Kubernetes temel kavramları, minikube kullanma, temel kubectl komutları, pod oluşturma, deployment oluşturma, service ve ingress kavramları uygulamalı olarak öğrenilir. Multi-node Rancher Kubernetes üzerinden demo yapılır.

Tüm Modülleri Görüntüle

Endüstri Projesi

Eğitim içeriklerini gerçek iş dünyası projeleriyle güçlendirerek eşsiz kılmak için lider firmalar ile veri sponsorluğu kuruyoruz. Erişeceğiniz projelerin bir kısmına göz atın.

Makine Öğrenmesi (MACHINE LEARNING)

Yetenek Avcılığı Sınıflandırma Problemi

Futbolcuların özelliklerine bakarak çok iyi veya çok kötü anlamında anomali özellikleri olan oyuncuları tespit ediyor ve oyuncuların özelliklerine göre iyi oynama ihtimali olan farklı mevkileri belirliyoruz.

BÜYÜK VERİ TEMELLERİ

Apache Hive ile Veri Analizi

Bu projede FLO veri setini inceleyerek bir Hive tablosu oluşturacaksınız. Veri setini bu tabloya yükleyecek ve ardından sizden istenen iş gereksinimlerini karşılayan sorguları hazırlayacaksınız.

Makine Öğrenmesi (MACHINE LEARNING)

Yetenek Avcılığı Sınıflandırma Problemi

BÜYÜK VERİ TEMELLERİ

Apache Hive ile Veri Analizi

Bugün Başla

Veri Bilimi Mühendisliği

%10 indirim

En İyi Teklif

12 Aylık Erişim

Kendi programına uygun şekilde ilerle

Her yıl yalnızca 30$'a otamatik erişim yenileme

Yenileme diledigin zaman iptal edilebilir

Kupon Kodu: P10

$ ~~420~~ $ 378.00

Tüm materyallere 12 aylık erişim
Endüstri projeleri ve sanal mentor desteği
Sertifika

Kayıt Ol

Miuul, gerekli gördüğü durumlarda eğitim içeriklerinde, modüllerde ve yenileme ücretlerinde değişiklik yapma hakkını saklı tutar. 30$’lık yıllık yenileme ücreti şu an için özel bir fırsattır; ileride bu koşullarda revizyon yapılabilir.

Şirketler çalışanlarının yetkinliğini arttırmak için Miuul’u tercih ediyor.

Teklif almak için Bize yazın

REFERANSLAR

“Miuul ile birlikte Vodafone için hazırladığımız Upskilling programı çerçevesinde çalışanlarımızla çok keyifli bir eğitim sürecine başladık.”

Bahar Karaoğlu

Data & Analytics Director, Vodafone

REFERANSLAR

“Miuul’un mentor sistemi ve sektör partnerleriyle oluşturduğu eğitim içeriklerini geleceğin mesleklerine doğru atılan değerli adım olarak görüyorum.”

Şebnem Özdemir, PhD

Researcher, MIT

REFERANSLAR

“Miuul mezunları, bize dışarıdan iş görüşmesine gelen yeni mezunlara göre çok daha fazla proje tecrübesine ve sunum yapabilme yeteneğine sahip oluyorlar.”

Hakan Tarhan

Managing Partner, Datamind

REFERANSLAR

“Çalışma arkadaşlarımızın veri bilimi konusundaki yetkinliklerinin gelişimi için bu yıl Miuul ile çalıştık. İçeriği, ihtiyaçlarımız ve katılımcı profilimiz doğrultusunda modifiye ettik, değerlendirme sürecini özelleştirdik ve içimize sinen hibrit bir program oluşturduk. Katılımcılarımızın eğitim süresince ve sonrasındaki geri bildirimleri de doğru yolda olduğumuzu işaret etti.”

Ayben Düztepe

IK Yetkili Uzman, Softtech

Sık Sorulan Sorular

Veri Bilimi Mühendisliği
Şimdi başlamaya hazır mısın?

Öğrenmeye bugün başla - şimdi senin zamanın.

Kayıt Ol