Burada daha iyi bir veri bilimcisi olmak için iyi seviyede öğrenmeniz gereken matematik konularını ve kavramlarını ele alacağız…

Matematik, tüm çağdaş bilim disiplinlerinin temelini oluşturur. Makine öğrenimi de dahil olmak üzere modern veri biliminin neredeyse tüm tekniklerinin, derin bir matematiksel dayanağı muhakkak vardır.
Üst düzey bir veri bilimcisi olarak çalışabilmek için veri konusundaki tüm bilgilerin yanında, bir miktar programlama yeteneğine, bir miktar iş zekasına ve çok iyi seviyede analitik ve meraklı bir zihne sahip olmanız gerektiğini söylememe hiçte gerek yok sanırım. Bunun yanında; otomobil konusunda hiçbir bir bilgisi olmayan birinin, tekerleğin arkasındaki teknolojiyi bilmesinden ziyade, kaputun altındaki motoru bilmesi her zaman daha iyidir değil mi? Bu nedenle, havalı algoritmaları çalıştıran arka plandaki makinelerin matematiksel olarak sağlam bir şekilde anlaşılması, veri bilimini öğrenmek konusunda sizinle aynı seviyede olanlar arasında bir avantaj sağlayacaktır muhakkak.
Bu noktada temel matematik bilgisi, diğer mesleklerden veri bilimine gelen ve henüz emekleme aşamasında olanlar için özellikle önemlidir: zira donanım mühendisliği, perakende, kimyasal proses endüstrisi, tıp ve sağlık, iş yönetimi, vb. gibi alanlar elektronik tablolar, sayısal ve olasılık hesaplamaları konusunda deneyim gerektirse de, veri biliminde gerekli olan matematiksel beceriler önemli ölçüde farklılıklar gösterebilir.
Bir web geliştiricisini veya bir iş analistini düşünün. Günlük olarak birçok veri ve bilgi ile uğraşıyor olabilirler, ancak bu verilerin titiz bir şekilde modellenmesi de gerekmeyebilir. Genellikle, verinin derin bir şekilde bilimsel olarak araştırılması yerine, acil ihtiyaç için kullanılması ve bu şekilde devam edilmesi üzerinde durulur. Veri bilimi ise her zaman bilimle ilgili olmalıdır (verilerle değil). Bu konuyu takiben, bazı araçlar ve teknikler vazgeçilmez hale gelir.
Bu konuların bir çoğu sağlam bir bilimsel sürecin ayırt edici özellikleridir:
Temel dinamikleri inceleyerek bir süreci (fiziksel veya bilgilendirici bir şekilde) modellemek
Hipotez oluşturmak
Veri kaynağının kalitesini titizlikle tahmin etmek
Veriler ve tahminler etrafındaki belirsizlikleri belirlemek
Bir modelin sınırlamasını anlamak
Matematiksel kanıtları ve arkasındaki soyut mantığı anlamak
Veri bilimi, doğası gereği, belirli bir alanla sınırlı değildir. Kanser teşhisinden, sosyal davranış analizine kadar çok çeşitli fenomenlerle ilgili olabilir. Ayrıca veri bilimi, n-boyutlu matematiksel nesnelerin baş döndürücü bir dizisini, istatistiksel dağılımları, optimizasyon objektif fonksiyonlarını vb. matematiksel hesaplamaları gerektirebilir.
Veri biliminde zirveye oynamak isteyenlere tavsiye edebileceğim Matematik konuları:
Temel Matematik: Fonksiyonlar, Değişkenler, Denklemler ve Grafikler

Temel Matematik, bir çizgi denkleminden, binom teoremine ve aradaki her şeyde dahil; tüm şu temel konuları kapsar:
Logaritma, üstlü sayılar, polinom fonksiyonları, rasyonel sayılar
Temel geometri ve teoremler, trigonometrik özdeşlikler
Reel ve karmaşık sayılar, ve temel özellikleri
Seriler, toplamlar, ve eşitsizlikler
Grafikler ve çizimler, Kartezyen ve kutupsal koordinatlar, konik kesitleri
Veri Bilimi Açısından Bu Temel Matematik Konularını Nerelerde Kullanabilirsiniz?
Bir aramayı sıraladıktan sonra bir milyonluk veritabanında nasıl daha hızlı çalışılacağını anlamak istiyorsanız, “ikili arama” kavramıyla karşılaşırsınız. Veri biliminin dinamiklerini anlamak için logaritmaları ve tekrarlama (Nüks) denklemlerini anlamanız gerekir. Veya bir zaman serisini analiz etmek isterseniz, “periyodik fonksiyonlar” ve “üstel bozunma” gibi kavramlarla karşılaşabilirsiniz.
Peki Bu Temel Matematik Konularını Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?
Coursera: Veri bilimi için Matematik Becerileri
edX: Cebire Giriş
Khan Academy: Cebir 1
İstatistik

Temel istatistik ve olasılık kavramları üzerinde sağlam bir kavrayışa sahip olmanın önemi göz ardı edilemez. Veri bilimi alanındaki birçok uygulayıcı, klasik (sinirsel ağ olmayan) makine öğreniminin istatistiksel öğrenmeden başka bir şey olmadığını düşünmektedir.
Bu konu çok kapsamlıdır ve şu temel kavramlar kritik öneme sahiptir:
Veri özetleri ve tanımlayıcı istatistikler, merkezi eğilim, varyans, kovaryans, korelasyon
Temel olasılık: Temel fikir, beklenti, olasılık hesabı, Bayes teoremi, koşullu olasılık
Olasılık dağılım fonksiyonları: düzgün, normal, binom, iki-kare, Öğrencinin t-dağılımı, merkezi limit teoremi
Örnekleme, ölçme, hata, rasgele sayı üretimi
Hipotez testi, A / B testi, güven aralıkları, p-değerleri
ANOVA, t-testi
Doğrusal regresyon, düzenlenme
Veri Bilimi Açısından Bu Temel Kavramları Nerelerde Kullanabilirsiniz?
Mülakatlarda, bu kavramlarda ustalaştığınızı gösterebilirseniz, karşı tarafı en hızlı şekilde etkileyebilirsiniz. Ve bu kavramları neredeyse her gün bir veri bilimcisi olarak kullanacaksınız.
Peki Bu Temel Kavramları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?
Doğrusal Cebir

Doğrusal Cebir, Makine Öğrenimi (ML) algoritmalarının bir veri akışı üzerinde nasıl çalıştığını anlamak açısından önemli bir matematik dalıdır. Facebook’taki arkadaş önerilerinden Spotify’daki şarkı önerilerine, hatta derin transfer öğrenimini kullanarak selfie fotoğrafınızı Salvador Dali tarzı bir portreye aktarmaya kadar kullanılan bir çok yazılımdaki her şey matrisleri ve matris cebirini içerir.
İşte öğrenmeniz gereken doğrusal cebirdeki temel konular:
Matris ve vektörlerin temel özellikleri: skaler çarpım, doğrusal dönüşüm, devrik, konjugat, sıralama, determinant
İçler ve dışlar çarpımı, matris çarpım kuralı ve çeşitli algoritmalar, ters matris
Özel matrisler: kare matris, birim matrisi, üçgen matris, seyrek ve yoğun matris, birim vektörler, simetrik matris, Hermitian, asimetrik-Hermitian ve üniter matrisler
Matrisi çarpanlara ayırma kavramı / LU ayrışması, Gauss / Gauss-Jordan elemasyonu, Ax = b lineer denklem çözme sistemi
Vektör uzayı, temel, açıklık, diklik, ortanormallik, doğrusal en küçük kare
Özdeğerler, özvektörler, köşegenleştirme, tekil değer ayrışımı
Veri Bilimi Açısından Bu Temel Konuları Nerelerde Kullanabilirsiniz?
Boyut küçültme tekniği ile temel bileşen analizini kullandıysanız, veri kümenizin daha az parametre ile kompakt bir boyut temsili elde etmek için muhtemelen tekil değer ayrışmasını kullanmış olursunuz. Tüm sinir ağı algoritmaları, ağ yapılarını ve öğrenme işlemlerini temsil etmek ve işlemek için doğrusal cebir teknikleri kullanılır.
Peki Bu Temel Konuları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?
Kalkülüs

İster üniversitede iken sevin isterse nefret edin, Kalkülüs veri bilimi ve makine öğreniminin birçok yerinde karşınıza muhakak çıkacak. Doğrusal regresyonda sıradan bir en küçük kareler probleminin basit görünümlü analitik çözümünün arkasından size gülümser veya sinir ağınızın yeni bir örüntü öğrenmek için yaptığı her geri yayılmada gömülüdür. Repertuarınıza eklemek açısından son derece değerli bir beceridir.
İşte bu alanda öğrenilecek konular:
Tek değişkenli fonksiyonlar, limit, süreklilik, türevlenebilirlik
Ortalama değer teoremleri, belirsiz formlar, L’Hospital kuralı
Maxima ve minima
Çarpım ve dizi kuralı
Taylor serileri, sonsuz seriler toplama/integrasyon kavramları
İntegral hesabın temel ve ortalama değer teoremleri, belirli ve belirsiz integrallerin değerlendirilmesi
Beta ve Gama fonksiyonları
Çok değişkenli fonksiyonlar, limit, süreklilik, kısmi türevler
Adi ve kısmi diferansiyel denklemlerin temelleri
Veri Bilimi Açısından Bu Konuları Nerelerde Kullanabilirsiniz?
Lojistik regresyon algoritmasının tam olarak nasıl uygulandığını hiç merak ettiniz mi? Minimum kayıp fonksiyonunu bulmak için “gradyanlı iniş” adı verilen bir yöntemi bu noktada kullanmanız çok olasıdır. Bunun nasıl çalıştığını anlamak için, matematikten gelen kavramları kullanmanız gerekir: gradyan, türevler, limitler ve dizi kuralı gibi…
Peki Bu Konuları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?
Khan Academy: Analiz I
Coursera: Makine Öğrenimi İçin Matematik: Çok Değişkenli Analiz
Soyut Matematik

Bu matematik alanı, veri biliminde çok sık karşımıza çıkmaz, ancak tüm modern veri bilimi, hesaplama sistemlerinin yardımıyla gerçekleştirilir ve soyut matematik de bu tür sistemlerin kalbinde yer alır.
Soyut matematik, analiz projelerindeki algoritmaların ve veri yapılarının günlük kullanımı açısından kritik olan şu kavramları içermektedir:
Kümeler, alt kümeler, güç kümeleri
Sayma fonksiyonları, kombinatorik, sayılabilirlik
Temel ispat teknikleri: tümevarım, çelişkili kanıtlama
Tümevarım, tümdengelim ve önermeli mantığın temelleri
Temel veri yapıları: yığınlar, kuyruklar, grafikler, diziler, karma tablolar, ağaçlar
Grafik özellikleri: bağlı bileşenler, derece, maksimum akış / minimum kesim kavramları, grafik renklendirme
Nüks (Tekrarlama) ilişkileri ve denklemler
Fonksiyonların büyümesi ve O(n) gösterim kavramı
Veri Bilimi Açısından Bu Kavramları Nerelerde Kullanabilirsiniz?
Herhangi bir sosyal ağ analizinde, ağı aramak ve ağda dolaşmak için bir grafiğin özelliklerini ve hızlı algoritmayı bilmeniz gerekir. Herhangi bir algoritma seçiminde, zaman ve mekan karmaşıklığını – yani, O (n) (Big-Oh) gösterimini kullanarak çalışma süresi ve alan gereksiniminin giriş veri boyutu ile nasıl büyüdüğünü anlamanız gerekir.
Peki Bu Kavramları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?
Optimizasyon ve Yöneylem Araştırması Konuları

Bu konular en çok teorik bilgisayar bilimi, kontrol teorisi veya yöneylem araştırması gibi uzmanlık alanlarıyla ilgilidir. Ancak bu güçlü tekniklerin temel olarak kavranması, makine öğrenimi pratiğinde de verimli olabilir. Hemen hemen her makine öğrenme algoritması, çeşitli kısıtlamalara tabi olan bir tür tahmin hatasını en aza indirmeyi amaçlamaktadır; ki bu bir optimizasyon sorunudur.
İşte bu alandaki öğrenilecek konular:
Optimizasyonun temelleri, sorunun nasıl formüle edileceği
Maxima, minima, dışbükey fonksiyon, global çözüm
Doğrusal programlama, simpleks algoritması
Tamsayılı programlama
Kısıt programlama, sırt çantası problemi
Rastgele optimizasyon teknikleri: yokuş yukarı tırmanma, benzetimli tavlama, genetik algoritmalar
Veri Bilimi Açısından Bu Konuları Nerelerde Kullanabilirsiniz?
En küçük kareler kaybı işlevini kullanan basit doğrusal regresyon problemleri, genellikle kesin bir analitik çözüme sahiptir, ancak lojistik regresyon problemlerinde bu yoktur. Bunun nedenini anlamak için, optimizasyonda “dışbükeylik” kavramına aşina olmanız gerekir. Bu, çoğu makine öğrenimi probleminde neden “yaklaşık” çözümlerden memnun kalmamız gerektiğini de aydınlatmaktadır.
Peki Bu Konuları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?
edX: İş Analizinde Optimizasyon Yöntemleri
Coursera: Soyut Optimizasyon
edX: Deterministik Optimizasyon
Son Sözler
Öğrenilecek çok şey olmasına karşılık kendinizi çaresiz hissetmeyin sakın, zira bunların tamamını öğrenebilmeniz için çevrim-içi bir çok mükemmel kaynak var. Bu konular (muhtemelen bir lisans öğrencisi olarak okuyorsanız) hakkında yeni bir bilgi edindikten ve yeni kavramlar öğrendikten sonra, günlük veri analizi ve makine öğrenme projelerinizdeki gizli müziği duyabilme gücüne sahip olacaksınız. Ve bu, inanılmaz bir veri bilimcisi olabilmeniz için büyük bir sıçrama yaratacak!
Diğer Kaynaklar
KDnuggets: Veri bilimi için 15 matematik MOOC
EliteDataScience: Veri bilimi için matematik nasıl öğrenilir?
Data Science Weekly: Veri bilimimde özgeçmişim için ne kadar matematik ve istatistiğe ihtiyacım var?
Analytics Vidhya: Veri bilimi ve makine öğrenimi için matematik ve istatistik üzerine 19 MOOC
Y Combinator: Makine öğrenimi için matematik öğrenme
留言