Merhaba Veri Bilimci Adayı!
Sizler için, daha önce Veri Bilimi Okulu'nda Vahit Hoca'nın kaleme aldığı “Veri Bilimci Olmak İçin Yol Haritası” yazısından ilham alarak, kendi deneyimlerimi ve bakış açımı da katarak yeni bir yol haritası hazırladım.
Türkiye’de ücretsiz düzenlenen etkinlikler var, hatta ücretli olanlara da git ki kıymeti olsun. Bunları zaman kaybetmeden takip etmeye ve etkinliklere katılmaya başla.
Öncelikle SQL 'i öğren daha sonra da uçtan uca bir proje yapabilecek seviyede Python Programlamayı öğren. Şu an dünyada en yaygın kullanılan dil bu.
Şu an sektörde büyük bir bilgi kirliliği var. Veri setini alıp makine öğrenmesi algoritmasına sokup %90 başarılar elde edip bırakıyorlar. Bu da pek sürdürülebilir bir başarı değil.
Modelleme bu işin %30'u..
Sizi sektörden ayıracak en önemli nokta istatistiksel bakış açısıdır. Öğrenmeniz gereken detaylar; eksik gözlem tamamlama, aykırı gözlem ayıklama, tutarsızlık incelemeleri, tanımlayıcı istatistikler, veri görselleştirme, olasılık dağılımları, hipotez testleri, kullanmak istediğiniz algoritma veri setinize uygun mu?, özellik çıkarımı, bir çok değişken arasından yeni değişkenler türetme, önemsiz değişkenleri özel yöntemlerle eleme, boyut indirgeme, makine öğrenmesi algoritmaları, sınıflandırma ve tahminleme farkı, algoritma optimizasyon süreçleri, cross-validation, bootstrap, learning rate, gradient descent, doğrusallık, nedensellik ve dahası.... Bu alanda ilerlemek istiyorsan detaylarda kaybolmaya hazır olmalısın.
Gözünüz korktu mu biraz? :) Merak etmeyin…
Korkmayın çünkü tüm bu süreçler uçtan uca ve detaylı bir şekilde Miuul Data Scientist Bootcamp eğitiminde mevcut. Devam edelim..
Bir önceki aşamada bahsettiğim istatistiksel öğrenme aşamaları bittikten sonra Makine Öğrenmesi algoritmalarının öğrenme mantığını öğrenmeye çalış. Bu noktada kullanabileceğin binlerce kaynak var fakat unutma ki ezbere konuşanlardan değil bu işin teknik kısmını varsayımsal kontrolleri ile ilerleten kişilerden öğrenmelisin.
Makine öğrenmesi kapsamında; regresyon modelleri, sınıflandırma yöntemleri, birliktelik kuralları, model seçme aşamaları, validasyon, test hatası yöntemleri, model performans değerlendirme, parametre tuning ve öğrenme bozukluklarına hakim olunması (underfitting, overfitting, good fitting) gerekmektedir. Tahmin yakınlığı mı? Nedensellik mi? Bu farkları çok net bir şekilde anlayabilmelisin.
Basit her zaman iyidir! "Tüm Modeller Kötüdür, Bazıları Kullanışlı" sözünün farkında olalım. (George E.P. Box)
Kaggle ve GitHub gibi platformları aktif kullanmalısın. Buralardaki veri setleri ile sektör deneyimleri kazanman zor olabilir fakat yine de başlangıç için seni hazırlar. Küçük veri setleri ile başlayıp zamanla büyük projelere adım atabilirsin fakat unutma ki Veri Bilimci olmak için büyük veri setleri ile çalışman ve deneyim edinmen gerekecek. Bu kapsamda Miuul'un veri sponsorları oldukça yarar sağlıyor. Öğrencilerimiz veri bilimci olma yolculuğunda iş hayatında onları bekleyen kirlilikte veri setleri ile çalışıyorlar. Her hafta farklı bir veri seti ile çalışıyorlar.
İş başvurularında öne çıkma rehberini edin. (Hediyemizdir buraya tıklayarak edinebilirsiniz.)
Miuul Data Sientist Bootcamp eğitimine dahil olduğunuzda ihtiyacınız olan cv hazırlama, ön yazı yazma ve mülakatlarda sorulan sorulara verilmesi gereken cevaplar konularına birlikte çalışıyor olacağız.
Örnek Sorular:
Hemen kayıt olabilirsin… Aramıza katılmaya var mısın?
Kaynak:
https://www.veribilimiokulu.com/veri-bilimci-olmak-icin-yol-haritasi/