
Sabah uyandın, alarmı kapatmak için telefonu eline aldın. Ne giyeceğine karar vermek için hava durumuna baktın, sonra hazırlanırken arkada çalması için Spotify’dan haftalık keşif çalma listeni açtın ve Instagram’da bir kaç gönderi kaydırdın, beğendin.
Yani henüz kahveni bile içmeden onlarca kez veri bilimiyle etkileşime girdin. Nasıl oluyorda veri bilimi farkında olmadan bu kadar günlük rutinlerimizin içine sızıyor?
Günlük hayatımızdan 7 örnekle bunu detaylı inceleyelim:
Netflix’de bazen bir diziyi ya da filmi çok beğenmediğimizde sonunu getiremiyoruz, yarıda kapatıyoruz. Ya da Youtube’da bir şarkı açıyoruz, sonra arkasından gelen şarkı tam bizlik bir şarkı çıkıyor “tam benlik!” diyoruz hemen listelerimize ekliyoruz.
İzlediğin dizi, durdurduğun video, beğenmediğin içerik… Hepsi bir veri noktası. Arka planda tüm bu bilgiler toplanıp, sana özel algoritmalar oluşturuluyor.
Veri bilimi dünyasında bu sistem Recommendation Systems yani Tavsiye Sistemleri olarak bilinir. Netflix’in “Senin için önerilenler”, Youtube’un otomatik çaldığı sıraki şarkıları, işte bu sistemin en görünür hali.
“Evden çıkarsam 24 dakikada buluşma yerindeyim.” ya da “Bu yol çok yoğun, diğer güzergahdan gideyim.” cümlelerini artık sık sık söylüyoruz.
Peki o haritada beliren kırmızı, turuncu ve yeşil çizgiler nasıl oluşuyor?
Aslında hepsi, senin dışındaki binlerce kişinin telefonundan gelen anlık GPS verileriyle hazırlanıyor. Google Maps bu verileri gerçek zamanlı (real-time) olarak analiz ediyor ve trafikteki yoğunluğu tahmin ediyor.
Tüm bu süreç, veri biliminin birkaç önemli alanının bir arada çalışmasıyla mümkün oluyor: Büyük Veri (Big Data) milyonlarca cihazdan gelen verinin saklanması ve işlenmesi, Gerçek Zamanlı Analiz (Real-Time Analytics) verilerin anında işlenip haritada güncellenmesi, Coğrafi Veri Bilimi (Geospatial Data Science) bu bilgilerin harita üzerinde anlamlı bir şekilde görselleştirilmesi.
Kısacası, haritada gördüğün her renk değişimi aslında arka planda çalışan karmaşık veri süreçlerinin bir yansıması.
Trendyol ya da benzer alışveriş platformlarında bir ürüne tıkladığında hemen altında “Benzer ürünler” ya da “Bunları da beğenebilirsin” kısmı belirir. Hangi ürüne baktığın, hangisini sepete ekleyip sonra vazgeçtiğin, hatta hangi saatlerde alışveriş yaptığın bile sistemin hafızasındadır.
Tüm bu davranışlar bir araya geldiğinde algoritma seni tanımaya başlar. “Bu ürünü alanlar bunları da aldı.” önerileri, seninle benzer alışkanlıklara sahip kullanıcıların verilerinden doğar.
Bu süreçte veri biliminde özellikle alışveriş sepeti analizi (basket analysis) adı verilen bir teknik öne çıkar. Sepet analizi, kullanıcıların birlikte satın aldığı ürünler arasındaki ilişkileri bulur. Örneğin, “şampuan alanların yüzde 60’ı saç kremi de alıyor” gibi. Bu bilgilerle sistem, bir ürün seçtiğinde senin ilgini çekebilecek tamamlayıcı ürünleri tahmin eder. Ayrıca yine veri biliminde işbirlikçi filtreleme (collaborative filtering) algoritmaları da devreye girer; senin gibi davranan kullanıcıların tercihlerini öğrenerek kişisel öneriler sunar.
Yani o “Tam benlikmiş” dediğin ürün, aslında geçmiş seçimlerinden öğrenen ve milyonlarca kullanıcı davranışını analiz eden akıllı bir sistemin tahmini.
“Hey Siri, bugünkü hava nasıl?” dediğinde, o cümleyi anlayıp sana anında yanıt veren şey aslında büyüleyici veri bilimi süreci.
Bu sistemler, konuşmanı önce ses tanıma (speech recognition) algoritmalarıyla yazıya dönüştürür. Ardından devreye doğal dil işleme (Natural Language Processing — NLP) girer. NLP, bilgisayarların insan dilini anlamasını, yorumlamasını ve mantıklı cevaplar üretmesini sağlar.
Kısacası Siri ya da Google Assistant senin söylediğin cümleyi sadece kelime kelime değil, anlam bütünlüğüyle çözümler. “Hava nasıl?” sorusunu algıladıktan sonra makine öğrenmesi (machine learning) modelleriyle analiz eder ve en uygun cevabı bulmak için doğal dil anlama (Natural Language Understanding — NLU) katmanını kullanır.
Cevabı sesli olarak iletirken de doğal dil üretimi (Natural Language Generation — NLG) devrededir.
Yani basit görünen o 2–3 cümlelik kısa konuşmanın arkasında, ses sinyalinden anlamsal analize kadar uzanan bir veri bilimi zinciri vardır.
Instagram Keşfet artık küçük bir karakter analizi gibi görülüyor, değil mi?
Hiç tanımadığımız birinin Keşfet’ine baktığımızda, o kişinin ilgi alanları, güldüğü şeyler, hatta o dönemde kişinin hayatında nelerin ön planda olduğunu bile az çok tahmin edebiliyoruz.
(Belki de bu yüzden, ilerleyen yıllarda özel alan sayılabilecek bir alan haline bile gelebilir bence)
Peki bu nasıl oluyor? İzlediğin videolar, beğendiğin içerikler, bir gönderide durduğun süre, arkadaşına yolladığın reels, hatta hızlıca kaydırdığın paylaşımlar bile sistemin seni tanımasına katkı sağlıyor.
Arka planda çalışan makine öğrenmesi (machine learning) modelleri, bu verileri analiz ederek senin ilgi alanlarını ve etkileşim alışkanlıklarını anlamlandırıyor.
Bu sürecin kalbinde ise tavsiye sistemleri (recommendation systems) ve davranış analizi (behavioral analytics) yer alıyor.
Algoritmalar, milyonlarca kullanıcının etkileşimlerinden öğrendikleri örüntüleri genelleştiriyor. Böylece senin beğenme ihtimalin yüksek olan gönderileri öne çıkarıyor.
Yani Keşfet ekranında gördüğün şey aslında tamamen sana özel, dinamik bir “veri aynası”. Her kaydırışta, sistem seni biraz daha tanıyor, bazen sen farkında bile olmadan.
“Bu işlemi sen mi yaptın?” oldukça tedirgin edici ve gergin bir bildirim cümlesi. (Umarım hepimizin bu soruya cevabı her zaman “evet” şeklinde olur)
Bankalar milyonlarca işlemi anlık olarak izler ve anomali tespiti (anomaly detection) algoritmalarıyla olağandışı hareketleri fark eder. Bu sistemler geçmiş işlem alışkanlıklarını öğrenen makine öğrenmesi (machine learning) modelleri sayesinde, senin normal harcama davranışına uymayan işlemleri “riskli” olarak işaretler.
Yani veri bilimi, sadece analiz değil, güvenlik için de en görünmez ama en etkili kalkanlardan biridir.
Aslında akıllı saatlerin hayatımıza girmesiyle birlikte bu konu oldukça popüler hale geldi diyebiliriz. Artık çevremizdekilerle “Bugün uyku puanın kaçtı?” ya da “Ben 10 bin adımı geçtim.” gibi muhabbetler yapar olduk.
Süreç aslında oldukça basit ama bir o kadar da etkileyici.
Kullandığımız uygulamalar, kolumuzdaki saat veya telefondaki dahili sensörler aracılığıyla verileri topluyor. Bu veriler, zaman serisi analizi (time series analysis) yöntemiyle değerlendiriliyor ve ardından makine öğrenmesi (machine learning) modelleriyle senin sağlık eğilimlerini anlamaya başlıyor.
Örneğin, kalp atış hızında olağan dışı bir değişim fark ettiğinde seni uyarabiliyor veya uyku kaliteni geçmiş verilerinle karşılaştırarak öneriler sunabiliyor.
Yani o basit görünen “adım sayar”, aslında kişisel bir veri bilimi laboratuvarı gibi çalışıyor.
Belki de gelecekte, bileğimizde taşıdığımız bu küçük sağlık koçları sayesinde sağlık kuruluşlarına daha az gitmemiz gerekecek kim bilir?
Gördüğün gibi, veri bilimi artık hayatımızın neredeyse her alanında.
İzlediğimiz diziden dinlediğimiz müziğe, gittiğimiz yoldan yaptığımız alışverişe kadar her şeyin arkasında veriyle şekillenen akıllı sistemler var.
Tüm bu teknolojilerin ortak noktası, veriyi anlamak, işlemek ve doğru kararlar üretmek.
MIUUL’un AI Data Scientist Bootcamp programı tam da bu noktada seni adım adım yetiştiriyor. Emin ol, bugün bu sistemleri geliştiren herkes bu yola hiçbir şey bilmeden başladı.
Kısacası, yalnızca veri bilimiyle etkileşen biri olmaktan çıkıp, bu sistemleri tasarlayan, geliştiren ve yöneten kişi oluyorsun.
Bugün veriyi anlamayı öğrenenler, yarının en güçlü karar vericileri olacak.