Miuul Orijinal

Data Scientist Path

Beceri odaklı, endüstri tarafından tanınan ve global standartlara uyumlu Data Scientist Path çeşitli kariyer ve iş hedefleriniz için tasarlandı.

Kayıt Ol Sana özel - esnek ödeme planlarına göz at

6 ay

Tahmini Süre

14

Eğitim

6

Sektörel Proje

+800

Bitirme Sorusu

Sertifika

Mezuniyette

₺108K

Yıllık Kazanç

Endüstriden Güç Alan Programlar Sunuyoruz

Eğitim programlarımız lider şirketlerle kurduğumuz ortaklıklar ile güçlendirilmiş ve inovatif ekipler tarafından kullanılmaktadır.

MODÜLLER

Data Scientist Path

Sektör problemleri odak alınarak modüllere ayrılmış ve portfolyonuzu güçlendirecek endüstri projeleri içeren 14 modülden oluşmaktadır.

Modül 1 8 saat

Veri Bilimi için Python Programlama

Bu eğitim, Veri bilimi adaylarının Python programlama dilini etkin bir PyCharm IDE kullanımı ile fonksiyonel yetenekler kapsamında öğrenmesini sağlar. Öğrenciler aldıkları Python eğitimi ile veri okuma, veri ön işleme, özellik geliştirme ve makine öğrenimi modelleri üretimi gibi tüm temel veri bilimi işlemlerini yapabilmeleri için gerekli altyapıyı proje geliştirme düzeyinde edinirler.

Endüstri projesi veri sponsoru :

Sıfırdan kapsamlı bir şekilde ileri seviye fonksiyonları yazmayı öğrenecek ve zor senaryolar için kendi fonksiyonlarınızı yazabileceksiniz. Ayrıca comprehensions konusu ile veri bilimi ve makine öğrenmesi süreçlerini ölçeklenebilir pipeline’lar ile sürdürebilmek için çok değerli bilgiler edineceksiniz.

Python programlamanın temellerini oluşturan veri yapılarını kapsamlı bir şekilde öğrenme imkanı bulacaksınız.

PyCharm, Virtual Environment ve Dependency Management konuları ile büyük ölçekli projeler için kendi çalışma ortamınızı oluşturmayı ve yönetmeyi öğreneceksiniz. Çalışma ortamı ayarları gerçekleştirildikten sonra Python’da ilk adımlarımızı atmış olacağız.

Veri bilimi, makine öğrenmesi ve yapay zeka uygulamaları için kaçınılmaz olan temel kütüphaneleri öğreneceksiniz. Bu bilgileri yaygın kaynaklardan farklı olarak gelişmiş fonksiyonlar yazmak için kullanacaksınız ve fonksiyonel veri analizi modülünüzü dokümantasyonu ile birlikte yazabiliyor olacaksınız. Bu modül iş ya da eğitim hayatınız boyunca birçok ihtiyacınıza çözüm olacak.

Modül 2 12 saat

SQL ile Veritabanı ve Veri Sorgulama

Veri bilimi yolculuğunun temelinde en bilinmesi gereken konulardan biri olan veritabanı sistemleri ve ilişkisel veritabanlarını sorgulama dili olan SQL dilini öğreneceğiz. Bu modülde veri ile konuşmanın alfabesi diyebileceğimiz SQL dili ile gerçek veri ve gerçek hayat senaryoları üzerinde uygulamalar yapacağız.

Endüstri projesi veri sponsoru :

Dijital veri depolama alanı olan veri tabanı kavramına ve veri tabanı işlemi için kullanılan sorgulama (SQL - Structered Query Language) diline giriş yapıyoruz.

İlişkisel veri tabanlarında tablo oluşturma, silme, değiştirmek gibi temel komutları kullanmayı öğreneceksiniz.

Microsoft SQL Server veritabanı için kullanılan sorgulama diline verilen isim olan Transact-SQL’ e giriş yapacaksınız. SQL sorgulama dilinin gelişmiş bir versiyonudur. DML ve DDL komutlarını detaylı olarak inceliyoruz.

İleri seviye koşul, sub-query oluşturma işlemleri istenilen veriyi çok daha kısa sürede elde edebileceksiniz. Müşteri segmentasyonu modülünde oluşturduğumuz RFM segmentasyonu alanlarını sıfırdan veri tabanında oluşturacaksınız.

Modül 3 8 saat

CRM Analitiği

CRM Analitiği çalışmaları sektörde kendine en fazla yer bulan iş uygulamalarındandır. CRM Analitiği eğitiminde Python ile müşteri verilerini analiz etmek, müşterileri daha yakından tanımak, müşterileri segmentlere ayırmak, segmentlere özel iş kararları alabilmek ve müşterileri elde tutmak için müşteri terk modelleri geliştirme konuları ele alınıyor. Veri bilimcinin programlama ve veri analizi kabiliyetlerini gerçek iş problemleri ile pekiştiren bir eğitimdir.

Endüstri projesi veri sponsoru :

Zamana dayalı çeşitli matematiksel göstergeleri inceleyerek ürün performans durumları hakkında yorum yapabilme ve temel dijital pazarlama metriklerini analiz etme fırsatlarına sahip olacaksınız.

Sektörde en fazla kullanılan uygulamalarla müşterileri satın alma davranışlarına göre kural tabanlı olarak segmentlere ayırabileceksiniz.

Müşteri yaşam boyu değerini satın alma ve karlılık pattern'larını göz önünde bulundurarak matematiksel ve istatiksel modellemeler ile oluşturacaksınız. Bu yöntemler sayesinde yeni müşterinize davranışınızı daha kolay tespit edebileceksiniz.

Ürün veya hizmeti bırakmaya karar veren müşteri davranış kalıplarını inceleyerek önlem almanıza yardım edecek modelleme projeleri geliştireceksiniz.

Modül 4 5 saat

Ölçümleme Problemleri

Analistlerin nicel (quantitative) ölçümleri nasıl oluşturup değerlendirebilecekleri konusunda sıklıkla karşılarına çıkan birçok karmaşık kavramı düşünün. Bu eğitimde, bu kavramları ölçmek için çeşitli yaklaşımları keşfedecek; farklı ölçüm seviyelerine ve değişkenleri dönüştürmenin yollarına genel bir bakış edineceksiniz. Bu eğitimin sonunda, çalışmaya değer kavramlar için ölçütler geliştirebilecek ve eleştirel olarak değerlendirebileceksiniz. Sonuçta, iyi bir analiz, iyi ölçümler üzerine kuruludur.

Endüstri projesi veri sponsoru :

İş kararlarının alınmasında etkin bir rol oynayan AB Testing ile; bir ürün ya da özellikte yapılan değişikliğin kullanıcıların tercihlerine ne şekilde etki ettiğini istatistiksel methodlar yardımıyla öğrenme imkanı bulacaksınız.

Doğru ürüne doğru fiyat verirken, edinilmesi gereken temel yaklaşımları öğrenme imkanı bulacaksınız. Ürüne verilebilecek en uygun fiyat için güvenli bir fiyat aralığının nasıl elde edildiği hakkında bilgi edineceksiniz.

Ürünlerin aldığı yorum ve ratingler, satın alma kararlarımızı etkileyen en önemli faktördür. Kullanıcılar tarafından yapılan yorum ve verilen rating'lerin sıralanma yöntemleri hakkında bilgi edineceksiniz.

Ürünlerin puanlanmasında kullanılan yaklaşımlar hakkında bilgi edineceksiniz. İstatistiksel yöntemler yardımıyla yapılabilecek en yansız puanlama yaklaşımı hakkında bilgi edineceksiniz.

Modül 5 6 saat

Tavsiye Sistemleri

Tavsiye sistemleri Netflix, Facebook, Amazon, Spotify, Pinterest Linkedin ve Instagram gibi teknoloji devlerinin başarılarında anahtar rolü oynuyor. Bu nedenle, veri bilimi dünyasında kritik bir yer tutan tavsiye sistemlerini kapsamlı şekilde ele alan bu modül de önemli bir yetkinlik kazandırmaktadır. Veri bilimi öğrencilerini tavsiye sistemlerinin teknik arka planını anlamasını sağlarken ve onları Python ile tavsiye sistemi geliştirme seviyesine taşımaktadır.

Endüstri projesi veri sponsoru :

Müşterilerin alışverişlerinde yer alan ürünler arasındaki birliktelik kurallarının nasıl oluşturulduğu hakkında bilgi edineceksiniz. Böylece; müşteri satın alma alışkanlıklarını tespit ederek, ürün önerilerinin nasıl yapıldığı hakkında fikir edinmiş olacaksınız.

Beğenilen bir ürünün içeriğinin benzerliğinden yola çıkarak, yeni bir ürünün nasıl tavsiye edilebileceği hakkında bilgi edineceksiniz. Bunu yaparken TF-IDF (Term Frequency-Inverse Document Frequency) matrisinin kullanımı hakkında bilgi edineceksiniz.

Kullanıcıların geçmiş beğenileri ya da puanlamalarını temel alarak, kullanıcı ve öğeler arasındaki benzerlikleri (user-based, item-based) tespit eden yöntem ile; daha önce önerilmemiş ürünlerin kullanıcıya nasıl önerildiğini öğrenme imkanı bulacaksınız.

Kullanıcının puanlamadığı ürünlere, aynı kullanıcının verebileceği puanı tahmin etmek üzerine kurulu bu yöntemde, Matrix Factorization yönteminin çalışma prensibi hakkında bilgi edineceksiniz.

Modül 6 8 saat

Zaman Serileri

Zaman içerisinde sıralanmış bir dizi gözlem noktasından oluşan zaman serilerinde amaç; geçmişten gelen gözlemlerin mevsimsellik, trend ve durağanlık özelliklerini kullanarak gelecek için bir tahminde bulunmaktır. Finans, hava durumu tahminleri, satış tahminleri gibi alanlarda sıkça kullanılmaktadır. Bu eğitimde işletmelerin ya da şahısların stratejik kararlar alırken önemli ölçüde kullandığı bu yöntem ile ilgili gerekli altyapının uygulamalar üzerinden aktarılması hedeflenmektedir.

Endüstri projesi veri sponsoru :

Veri setindeki gözlemlerin davranışlarını inceleyerek; exponential smoothing yöntemleri ile verinin yapısı hakkında bilgi edinecek ve veriyi trend, mevsimsellik ve durağanlık penceresinden yorumlamanın temellerini atmış olacaksınız.

AR, MA, ARMA, ARIMA ve SARIMA methodlarını kullanarak istatistiksel ve ekonometri açıdan anlamlı tahminler yapabileceksiniz.

Makine öğrenmesi modellerini kullanarak modelin veriden öğrenmiş olduğu pattern'e göre forecasting yapmayı öğrenme imkanı bulacaksınız.

Yüz tanıma sistemleri, tavsiye sistemleri, kanser araştırmaları, otonom sürüş gibi pek çok alanda kullanılan derin öğrenme algoritmasının zaman serisi üzerindeki kullanımına başlıyoruz.

Modül 7 9 saat

Özellik Mühendisliği

Veri Bilimi süreçlerinin çok büyük bir kısmını, veri temizliği ve değişken mühendisliği oluşturmaktadır. Bu eğitim; ham veriyi temizleyerek, ilgili veriden yeni özellik çıkarmak ve modele girmeye uygun olmayan değişkenleri dönüştürmek için öğrencilerin belirli yaklaşımlar edinmesini amaçlamaktadır. Edinilen yaklaşımlar sayesinde veri setini bir makine öğrenmesi modeline girmeye uygun hale getirme konusunda gerekli altyapıyı edineceksiniz.

Endüstri projesi veri sponsoru :

Veri setindeki aykırı ve eksik gözlemler ile mücadele etme yöntemleri (baskılama, silme, ortalama ile doldurma vs.) hakkında bilgi edineceksiniz.

Veri makine öğrenmesine girmeden önce sayısal ifadelerle temsil edilmeye ihtiyaç duyar. İlgili değişkenlerin sayısal ifadelerle temsil edilmesini sağlayan LabelEncoder ve One-Hot Encoding yaklaşımlarını işliyoruz.

Uzaklık temelli makine öğrenmesi algoritmalarında; veriyi modele sokmadan önce ilgili değişkenin dağılımı, maksimum ve minimum noktalarının birbirlerine olan uzaklığı model performansını önemli ölçüde etkilemektedir. İlgili durumda uygulanan değişken standartlaştırma ve değişken dönüşüm işlemleri hakkında bilgi edineceksiniz.

Regular expression yardımıyla, ham veriyi temizleyerek anlamlı hale getirmek için kullanılan yöntemler hakkında bilgi edineceksiniz.

Modül 8 8 saat

Makine Öğrenimi

Veri bilimi, Python programlama dilini kullanarak ve CRISP-DM süreçlerini dikkate alarak denetimli ve denetimsiz makine öğrenimi yöntemlerini öğrenmemizi sağlar. Bu modülde, geleneksel algoritmalar ve son zamanlarda öne çıkan birçok algoritmayı (RF, LR, XGBoost) kıyaslayarak ve model seçme özellikleri ile işleyerek önemli bir yetkinlik edineceksiniz.

Endüstri projesi veri sponsoru :

Bağımlı değişkenin, kesikli ya da sürekli olduğu duruma göre kullanım alanı bulan ve yaygın kullanılan modellerde dikkat edilmesi gereken metrikler, süreçler hakkında bilgi edinecek; ilgili algoritmaların verilere en uygun şekilde geliştirilmesi için yapılması gerekenleri uygulayarak öğrenme imkanı bulacaksınız.

Modele verilebilecek herhangi bir bağımlı değişken olmadığı durumlarda, verideki gözlemleri uzaklık tabanlı gruplayarak sınıflandırmamızı sağlayan modeller hakkında bilgi edineceksiniz.

Veriden fayda çıkarmak ve model başarısını arttırmak için en önemli unsurlardan birisi Feature Engineering ve Feature Selection aşamalarıdır. Mevcut değişkenlerden model performansını en uygun şekilde etkileyebilecek yeni değişkenleri türetmek ve değişken seçimi hakkında proje geliştirme düzeyinde bilgi edineceksiniz.

Gerçek hayatta karşılaşılan problemlerden, makine öğrenmesi modelleri kullanarak oluşturacağınız tahmin sonuçlarını kullanıcı dostu ve etkileşimli bir arayüzle nasıl sunabileceğinizi öğreneceksiniz.

Modül 9 7 saat

Derin Öğrenme

Derin öğrenme çok katmanlı yapay sinir ağlarının kullanıldığı bir makine öğrenmesi çeşididir. Bu modülde temel derin öğrenme algoritmalarını Python programlama özellikleri ve feature engineering prensipleri kullanarak yetkinliklerinizi güçlendireceksiniz.

Artificial Neural Network (Yapay Sinir Ağları) insan beyni örnek alınarak öğrenmeye çalışan bir algoritmadır. Nöronlar sayesinde bilgiler tutulmakta ve ağırlıklar sayesinde birbirleriyle bağlanmaktadır. ANN algoritmasını kavrama, verilere en uygun şekilde geliştirilmesi için yapılması gerekenleri öğrenme imkanı bulacaksınız.

Conventional Neural Network (Evrişimsel Sinir Ağları) görüntü işleme teknolojilerinde kullanılır. Convolutional Layer, Pooling Layer, Fully-Connected Layer gibi temel katmandan oluşmaktadır. Bu bölümde CNN algoritmasını ve temel katmanlarını kavrama, verilere en uygun şekilde geliştirilmesi için yapılması gerekenleri öğreneceksiniz.

Recurrent Neural Network (Yinelenen Sinir Ağları) bir önceki çıktının bir sonraki çıktıyı tahmin etmesi için kullanılan ağlardır. LSTM RNN’e forgetting, selection ve ignoring katmanları eklenerek oluşturulur. Bu bölümde RNN, LSTM algoritmalarını ve temel katmanlarını kavrama, verilere en uygun şekilde geliştirilmesi için yapılması gerekenleri öğrenme imkanı bulacaksınız.

Generative Adversarial Networks (Çekişmeli Üretici Ağ) resimler üzerinden öğrenerek neredeyse bire bir olacak şekilde yeni resimler oluşturabilir. İki ana yapıdan oluşur: Generator (Üretici) ve Discriminator (Ayırt Edici). Bu bölümde GANs algoritmasını ve temel katmanlarını kavrama, verilere en uygun şekilde geliştirilmesi için yapılması gerekenleri öğrenme imkanı bulacaksınız.

Modül 10 10 saat

Doğal Dil İşleme

NLP modülü doğal dillerin yapısının çözümlenerek anlaşılması için gerekli olan text analitik süreçlerini ele alır. Chatbotlar, duygu analizleri veya çeviri gibi birçok uygulamanın temelini oluşturan algoritmaları Python dili kullanılarak geliştirebileceksiniz.

Endüstri projesi veri sponsoru :

Bir metnin normalization, tokenization, stemming, lemmatization gibi temel text processing işlemlerinden nasıl geçirildiğini ve anlamlı sonuçlara ulaşmak için nasıl görselleştirildiğini öğrenme imkanı bulacaksınız.

Bir metini, müşteri yorumlarını ya da bir konu hakkındaki sözlü veya yazılı bilgileri veri olarak alarak, doğal dil işleme yetkinlikleri ve Python programlama dilini kullanarak Sentiment (Duygu) analizini yapmayı öğreneceksiniz.

Metinlerin algoritmalarda kullanılmak üzere sayısallaştırma işlemleri için kelime vektörü oluşturma yöntemlerini, TF-IDF normalizasyonlarını ele alarak NLP yetkinliklerini artırma imkanı bulacaksınız.

Amazon web sitesindeki ürünlerin müşteri yorumları ve bu yorumlar hakkındaki değerlendirmeleri dikkate alarak makine öğrenmesi ve derin öğrenme algoritmaları kullanarak modellenmesini yapacaksınız.

Modül 11 5 saat

Open Source Big Data Basics

Büyük veri, geleneksel yaklaşımla işlenip yönetilemeyecek kadar büyük ve karmaşık veriye işaret eder. Veri günümüzde şirket ve kurumların çalışma şekillerini kökten değiştirmeye başlamıştır. Bu durum önümüzdeki yıllarda daha da hayati bir noktaya gelecek. Veriyi stratejik bir değer olarak gören şirketler görmeyenlere göre öne geçecektir.

Neredeyse iki yılda bir üretilen verinin ikiye katlandığı bir dünyada artık veriyi tek bir makineye sıkışarak işlemek, saklamak, analiz etmek zorlaşmaktadır. Üstelik artık her şeyin tek bir makinede olduğu sistemler tek nokta kırılganlığı taşıdığından veri işleyen sistemler ister istemez ölçeklenmektedir.

Bu modülde büyük verinin başlangıcından beri var olan ve halen dünya büyük verisinin çoğunu saklayan ve işleyen açık kaynak kodlu projeler uygulama seviyesinde öğrenilecektir. Aynı zamanda büyük veri ve dağıtık veri işlemenin temel mantığı özümsenecektir.

Endüstri projesi veri sponsoru :

Apache Hadoop açık kaynak kodlu büyük veri dünyasının en önde gelen popüler platformudur. Bu bölümde Hadoop Dağıtık Dosya Sistemi (HDFS), Kaynak Yönetimi (YARN) ve dağıtık veri işleme çerçevesi MapReduce öğrenilecektir. Veri Hadoop'a nasıl taşınır? Hadoop'dan veri nasıl alınır? MapReduce ile HDFS üzerindeki veri nasıl işlenir? YARN ResourceManager arayüzlerinden işler nasıl takip edilir gibi konular öğrenilecektir.

HDFS üzerinde saklanan veri üzerinde SQL benzeri bil sorgulama diliyle sorgulama yapılmasına imkân sağlayan ve büyük veri dünyasında veri ambarı (data warehouse) / veri gölü (data lake) yapılarında sıklıkla kullanılan bir projedir. Hive veri tabanı ve tablo yaratma, veri setlerini Hive tablosu haline getirme, SQL editörünü Hive'a bağlama, SQL sorgu dosyalarını Hive üzerinde çalıştırma, Hadoop dosya formatları, Partitioning ve Bucketing gibi konular öğrenilecektir.

Hadoop ile ilişkisel veri tabanları arasında veri transferi sağlayan bir projedir. Sqoop ile PostgreSQL veri tabanında sorgu çalıştırma, Hadoop, Hive ve PostgreSQL arasında karşılıklı olarak veri aktarımları uygulamalı olarak öğrenilecektir.

Akan veri işleyen sistemler ve uygulamaların kalbinde yer alan oldukça popüler bir dağıtık akan veri platformudur. Kafka'nın temel özellikleri, kavramları, topic oluşturma, Python ile Kafka'ya mesaj gönderme ve okuma, console consumer/producer ve consumer grupları kullanımı uygulamalı olarak öğrenilecektir. Cloudera Multinode cluster üzerinde Kafka demosu yapılacaktır.

Modül 12 5 saat

Apache Spark ile Büyük Veri İşleme

Spark, dağıtık veri işlemenin zorlu tarafını geliştiriciden yalıtarak ona bütünleşik ve kullanımı kolay API’ler sunan analitik bir veri işleme platformudur. Spark'ın bütünleşik programlama modeli, veri açısından zengin analitik uygulamalar geliştirenler için onu en iyi seçim haline getirir. Spark ile parti veya akan veri işlemek mümkündür.

Büyük verileri bildiğiniz SQL’i kullanarak sorgulamak çok kolaydır. Apache Spark, açık kaynaklı bir proje olarak, hızla ve ölçeklenerek yeniliği ateşliyor. Bu bölümde popüler veri bilimi programlama dili Python ile Spark nasıl kullanılır öğrenilecek ve veri manipülasyonundan, kodların optimize edilmesine kadar geniş ölçekte veri işlemenin püf noktaları öğrenilecektir.

Son olarak işlenen verilerin düzenli ve sistematik olarak nasıl saklanacağı ve buradan bu veriyi tüketecek iç dış müşterilere en güncel, tutarlı ve doğru şekilde nasıl sunulabileceği görülecektir.

Endüstri projesi veri sponsoru :

Büyük ölçekli verilerin dağıtık olarak veri manipülasyonu yapılmasını sağlar. Spark'ın temelleri, veri okuma, filtreleme, yeni özellikler ekleme, dönüştürme, diske yazma, kullanıcı tanımlı fonksiyon yazma, SparkSQL fonksiyonlarını kullanma, aggregation, Spark'ı YARN modunda çalıştırma gibi konular uygulama seviyesinde öğrenilecektir.

Spark ile ilişkisel veri tabanları, HDFS, Hive gibi farklı veri kaynaklarına okuma yazma yapılır. Farklı veri formatları ve sıkıştırma algoritmaları ile veriler okunur yazılır.

Performans optimizasyonuna çok açık olan Spark için performans ve kaynakları etkin kullanma incelikleri öğrenilir. Dinamik kaynak kullanımı, partitioning ve bucketing, adaptive query, shuffle partitions gibi konular ele alınmaktadır.

Notebook ortamında kod yazarak br iş problemini çözen geliştimeler yapmak kadar bu kodların canlı ortamda çalışacak hale getirilmesi de önemlidir. Notebook ortamından kodların PyCharm IDE'sine çıkarılması, spark-submit opsiyonları, farklı cluster yöneticilerinin seçimi, uygulamaya ait argümanların komut satırından gönderilmesi gibi konular öğrenilir.

Büyük veri dünyasındaki ACID problemine çözüm getiren ve büyük veriyi daha da özgürleştirerek ilişkisel veri tabanı konforunu dağıtık devasa veri üzerinde sağlayan proje olan DeltaLake öğrenilecektir. Delta lake ile büyük veri üzerinde upsert, update, insert, delete gibi temel CRUD operasyonları ele alınacaktır.

Modül 13 5 saat

Spark Structured Streaming and Machine Learning

Apache Spark Streaming, hem toplu iş hem de akış iş yüklerini yerel olarak destekleyen, ölçeklenebilir, hataya dayanıklı bir akan veri işleme sistemidir. Spark Streaming, veri mühendislerinin ve veri bilimcilerinin Kafka, Flume ve Amazon Kinesis dahil -ve bunlarla sınırlı olmamak üzere- çeşitli kaynaklardan gerçek zamanlı verileri işlemesine olanak tanıyan temel Spark API'nin bir uzantısıdır.

Bu eğitimde gerçek senaryolara dayalı olarak Spark Streaming ile nasıl veri manipülasyonu yapılır, farklı kaynaklardan nasıl veri okunur ve işlenen veriler farklı kaynaklara tekrar nasıl yazılır öğrenilecektir.

Endüstri projesi veri sponsoru :

Dosya ve soket kaynaklarından statefull ve stateless olarak gerçek zamanlı veri işleme uygulamaları gerçekleştirilir.

Gerçek zamanlı veri işlendikten sonra birden farklı yere sonuçları yazmak oldukça yaygın bir ihtiyaçtır. Örneğin elde ettiğiniz sonçlardan filtreleme yapıp bazılarını ilişkisel veri tabanına tamamını Hive veri tabanına veye Delta tabloya yazmak isteyebilirsiniz.

Kafka en popüler gerçek zamanlı veri işleme platformudur. Spark Structured Streaming kafka ile harika bir ikili oluşturur ve yaygın olarak birlikte kullanılırlar. Spark ile Kafka kaynağından mesajlar nasıl okunur, bu mesajlar nasıl yapısal hale getirilir, işlendikten sonra tekrar Kafka'ya nasıl yazılır uygulamalı olarak öğrenilecektir.

Gerçek zamanlı veri işlemede odak noktası şimdiki zaman olduğu için haftalar veya aylar öncesine ait olaylardan daha çok saat, dakika ve saniyeler içinde meydana gelen olaylar işlenir. Bunun için sabit veya kayan pencerelerde veri işlemesi yapılır. Örneğin son 5 dakikada kaç tane olay olmuş, nemlendirici sensörlerinden gelen sinyallerin yarım saatlik ortalaması nedir gibi bilgiler akan veri içinden elde edilmeye çalışılır.

Büyük veri dünyasındaki ACID problemine çözüm getiren ve büyük veriyi daha da özgürleştirerek ilişkisel veri tabanı konforunu dağıtık devasa veri üzerinde sağlayan proje olan DeltaLake hem parti hem de gerçek zamanlı veri iş yükleri için uygundur. İşlenen verinin delta tablosu olarak yazılması uygulamaları gerçekleştirilecektir.

Spark makine öürenmesi kütüphanelerinin tanıtımı ve Spark ML Pipelines temel kavramları ele alınarak makine öğrenmesi uygulamalarına giriş ve ön hazırlık yapılır.

En yaygın gözetimli öğrenme yöntemlerinden olan Regresyon ile model geliştirilecek ve veri hazırlık süreci detaylı olarak ele alınacaktır. Regresyon model değerlendirme kütüphanesi kullanılarak başarı metrikleri elde edilecektir.

Spark ML Calassification algoritmalarından birisiyle ve örnek bir veri seti üzerinde ML Pipelines kullanarak sınıflandırma modeli geliştirilecektir. Sınıflandırma model değerlendirme kütüphanesi kullanılarak başarı metrikleri elde edilecektir.

Spark ML kütüphanesinde bulunan KMeans algoritması örnek bir veri seti üzerinde kullanarak kümeleme modeli geliştirilecektir. Kümeleme model değerlendirme kütüphanesi kullanılarak ideal küme sayısı bulunacaktır.

Modül 14 4 saat

Model Deployment

Model Deployment, geliştirilen bir makine öğrenimi modelini canlı sistemde çalıştırma sürecidir. Makine öğrenimi modelleri, izole edilmiş geliştirme ortamlarında geliştirilir ve test edilir. Bir model canlı ortam için hazır olduğunda, MLOps, modeli canlı ortamda çalıştırmak için veri bilimcileri, DevOps ve makine öğrenimi mühendisleri arasında uygulanan bir süreçtir.

Bu eğitimde model geliştirmeden modeli canlı ortamda çalıştırmaya uzanan süreç mercek altına alınacak ve popüler DevOps yaklaşımlarından CI/CD uygulamaları ile MLOps’un popüler platformu olan Mlflow üzerinden uygulamalar yapılacaktır. Ayrıca konteynılaşma trendine uygun olarak modeller Docker imajı haline getirilerek hem Docker konteynır olarak hem de Kubernetes üzerinde Deployment nesnesi olarak canlı ortamda nasıl devreye alınacağı görülecektir.

Endüstri projesi veri sponsoru :

Temel felsefesi ve süreci ele alınmaktadır. "MLOps işini kim yapar?", "DevOps ve Data Engineering ile ilişkisi nedir?", "MLOps olgunluk dereceleri nelerdir?" gibi sorulara cevap buluyoruz.

DevOps’un yaygın yaklaşımı CI/CD model deployment için kullanımı öğrenilecektir. Jenkins, Git, Gitea ve Docker kullanarak bir hamlede modelimizi canlı ortamda çalıştırıyoruz.

En popüler MLOps araçlarından olan MLflow'un makine öğrenmesi hayat döngüsündeki yerini ve bu döngüye olan katkılarını öğreneceğiz. MLflow tracking server aracılığıyla geliştireceğimiz Spark makine öğrenmesi modeline ait hiper-parametre ve başarı metriklerini MLflow'a göndereceğiz ve beğendiğimiz bir modeli MLflow ile sunarak örnek tahminler yapacağız.

Konteynırlaşma trendi baş döndürücü hızlar ilerlerken uygulama yapıları da hızla mikro-servis mimarisine dönüşmektedir. Böyle trende paralel olarak makine öğrenmesi modellerinin de imaj haline getirilmesi ve konteynır ortamlarında kullanılması gerekmektedir. Docker ve Kubernetes temellerini öğrendikten sonra modellerin imaj haline getirilerek Docker konteyner ve Kubernetes deployment objesi olarak sunulmasını uygulamalı olarak öğreneceğiz.

Endüstri Projeleri

Eğitim içeriklerini gerçek iş dünyası projeleriyle güçlendirerek eşsiz kılmak için lider firmalar ile veri sponsorluğu kuruyoruz. Erişeceğiniz projelerin bir kısmına 👀 atın.

Programlama Dilleri ve Araçlar

Data Scientist Path’te öğrenerek, projelerde ve iş hayatında kullanmaya başlayacağınız programlama dilleri ve araçlar

Sizi sıfır noktasından işe hazır hale getiriyoruz

Kendi takviminizde dilediğiniz zaman erişerek öğrenmeye başlayabileceğiniz; sektör problemlerini odağına alarak parçalara ayrılmış modüllerden öğrenerek Veri Bilimci olacaksınız.
Eğitim içeriklerini gerçek iş dünyası projeleriyle güçlendirerek eşsiz kılmak için lider firmalar ile veri sponsorluğu kuruyoruz. Modüllerin sonunda bulunan bitirme projeleri ile sektörel uygulamalar üzerinde deneyim kazanın.
Farklı ülkelerde bulunan mentor ağımız bitirme projelerinize geri dönüş yapıp; öğrenim deneyiminiz boyunca size destek oluyoruz.
Program içeriğine özel hazırlanmış Miuul CheatSheet'ler ile ihtiyacın olan bilgiler elinin altında olsun. Ayrıca yüzlerce quiz ve ekstra destekleyici dokümanlar ile pratiğini güçlendirebileceksiniz.
Herhangi bir -ücretli- Miuul programından tüm mezun olanlar bir sertifika alırlar. Mezuniyet sürecini tamamladığınızda sertifikanız sistem tarafından oluşturularak size teslim edilecektir.
BUGÜN BAŞLA

Data Scientist Ol

Bu eğitimi tamamlamak için ortalama süre 6 aydır.

AYLIK ERİŞİM

Abone olarak kullandığın kadar öde

$ 125 .00 /ay

  • Tüm materyallere aylık erişim
  • Kendi hızında öğrenme esnekliği
  • Dilediğin zaman aboneliğini sonlandır
EN POPÜLER

6 AYLIK ERİŞİM

Tek seferde öde ve 15% tasarruf et

$ 560 .00 /tek seferlik

  • Tüm materyallere 6 aylık erişim
  • Aylık erişime göre 15% tasarruf et
  • Dilediğin zaman aboneliği sonlandır

Çeşitli ölçeklerdeki kurumlar ekipleri için Miuul'u kullanıyor.

Çalışanlarınıza özel teklif almak için bize yazın

Sık Sorulan Sorular

Veri bilimi alanının önümüzdeki birkaç yıl içinde hızla büyümeye devam etmesi bekleniyor ve endüstriler arasında veri Bilimciler için büyük bir arz talep boşluğu var. Veri Bilimcisi sürekli olarak en iyi kariyer olarak derecelendiriliyor.

Miuul olarak, veri bilimi kariyerinizi ilerletebilmeniz için birinci sınıf bir öğrenme deneyimi sunmak için endüstri liderleriyle işbirliği yaptık. Ellerinizi sektörün ihtiyaç duyduğu projelerde kirletmiş bir Veri Bilimcisi adayı olarak bu program aracılığıyla eşsiz bir deneyim elde edeceksiniz. 

Programın sonunda, portfolyonuza etkileyici bir gerçek dünya projeleri ekleme şansına erişeceksiniz. Ayrıca, başarılı bir veri bilimi kariyeri oluşturmaya ve sevdiğiniz bir işe girmeye hazır olduğunuzdan emin olmanıza yardımcı olacak kariyer desteği alacaksınız.

Programın başarılı bir şekilde tamamlanması için, sağlanan tüm kaynakları her hafta -haftada belirlediğiniz minumum iki gün- izlemek ve size videolarda gösterdiğim tüm projeleri yapmak önemlidir.

Kendi hızınızda çalışın ve diğerine geçmeden önce bir modülü gerçekten anlamak ve uygulamak için zaman ayırın. En önemli şey pratik yapmak, pratik yapmak ve pratik yapmaktır. Teknolojileri pratikte uygularken daha hızlı öğrenmenize ve işte size güven vermenize yardımcı olacaktır.

Her modülde, yalnızca modüldeki teknolojiyi değil, aynı zamanda önceki modüllerde öğrenmiş olduğunuz diğer araçlarla kombinasyonu da uygulayabileceğiniz bir uygulamalı laboratuvar bulunmaktadır. Ayrıca, diğer katılımcılarla bilgi alışverişinde bulunmak, mentorunuza soru sormak ve başkalarına yardım etmek için her fırsatınızı kullanın, çünkü en iyi yollardan biri de başkalarına öğretmek ve yardımcı olmaktır.

Hayır. Bu program, deneyim ve özel geçmişe bakılmaksızın tüm başvuru sahiplerini kabul etmektedir.

Veri Bilimcisi olmak için gereken becerileri edinmek üzere Miuul Data Scientist Path'i başarı ile tamamlamak, sizi birçok endüstride ve birçok rolde son derece değerli kılacaktır. 

Veri bilimi eğitimi almış profesyoneller için ideal olan işler Veri Analisti, Veri Bilimci, Makine Öğrenimi Mühendisi, İstatistiksel Programlama Uzmanı olmak üzere; bunlara ek olarak bazı kişiler Veri ve Analitik Yöneticileri olurken, diğerleri Veritabanı Yöneticileri olarak uzmanlaşabiliyorlar.  
 

Data Scientist Path, programlama ve veri analizi deneyimi olan öğrenciler için tasarlanmıştır. Programa başlamadan önce öğrencilerin çeşitli konularda deneyimli olmaları alınacak verim açısından değer taşımaktadır. Bu programı başarıyla tamamlamak için aşağıdaki ön koşulları karşılamanız gerekmektedir:

  • Ortak veri analizi kitaplıkları (NumPy, Pandas, Matplotlib) dahil Python programlama.
  • SQL programlama
  • İstatistikler (Tanımlayıcı ve Çıkarımsal)
  • Kalkülüs
  • Lineer Cebir
  • Veri görselleştirme deneyimi

 

Bu programa erişim, yukarıdaki ödeme bölümünde belirtilen opsiyonlar içindeki süreler boyunca devam eder. Bu süreler içinde mezun olmazsanız, aylık ödemelerle öğrenmeye devam edebileceksiniz.

Genel olarak, net olmayan bir şey varsa veya program ile ilgili sorunlarınız varsa, tüm sorularınızı yanıtlamak için hemen size destek olmaya çalışacağız. Geri bildiriminizi veya eleştirinizi hemen duymaktan da mutluyuz, böylece sizin için düzeltebiliriz.

Ancak yine de satın alma işleminizden memnun değilseniz, ilk 30 gün içinde geri ödeme talebinde bulunabilirsiniz. Geri ödeme istemek için bize [email protected] adresinden bir e-posta göndermeniz yeterlidir. Lütfen geri ödeme isteme nedeninizi ve platformumuzdaki hesabınız için kullandığınız e-posta adresini ekleyin.

Eğitim programlarımızı her zaman geliştiriyoruz ve özellikle öğrenci geri bildirimlerine dayalı olarak daha fazla değer katıyoruz, bu nedenle neyi daha iyi yapabileceğimizi sizlerle iletişim kurarak bilmek istiyoruz.

Data Scientist olmaya hazır mısın?

Öğrenmeye bugün başla - şimdi senin zamanın.

Kayıt Ol
© 2021 Miuul