top of page

Blog Posts

Veri Bilimi için Hangi Matematik Konularını ve Kavramlarını Öğrenmeniz Gerektiğini Biliyor Musunuz?

Burada daha iyi bir veri bilimcisi olmak için iyi seviyede öğrenmeniz gereken matematik konularını ve kavramlarını ele alacağız…



Matematik, tüm çağdaş bilim disiplinlerinin temelini oluşturur. Makine öğrenimi de dahil olmak üzere modern veri biliminin neredeyse tüm tekniklerinin, derin bir matematiksel dayanağı muhakkak vardır.


Üst düzey bir veri bilimcisi olarak çalışabilmek için veri konusundaki tüm bilgilerin yanında, bir miktar programlama yeteneğine, bir miktar iş zekasına ve çok iyi seviyede analitik ve meraklı bir zihne sahip olmanız gerektiğini söylememe hiçte gerek yok sanırım. Bunun yanında; otomobil konusunda hiçbir bir bilgisi olmayan birinin, tekerleğin arkasındaki teknolojiyi bilmesinden ziyade, kaputun altındaki motoru bilmesi her zaman daha iyidir değil mi? Bu nedenle, havalı algoritmaları çalıştıran arka plandaki makinelerin matematiksel olarak sağlam bir şekilde anlaşılması, veri bilimini öğrenmek konusunda sizinle aynı seviyede olanlar arasında bir avantaj sağlayacaktır muhakkak.


Bu noktada temel matematik bilgisi, diğer mesleklerden veri bilimine gelen ve henüz emekleme aşamasında olanlar için özellikle önemlidir: zira donanım mühendisliği, perakende, kimyasal proses endüstrisi, tıp ve sağlık, iş yönetimi, vb. gibi alanlar elektronik tablolar, sayısal ve olasılık hesaplamaları konusunda deneyim gerektirse de, veri biliminde gerekli olan matematiksel beceriler önemli ölçüde farklılıklar gösterebilir.


Bir web geliştiricisini veya bir iş analistini düşünün. Günlük olarak birçok veri ve bilgi ile uğraşıyor olabilirler, ancak bu verilerin titiz bir şekilde modellenmesi de gerekmeyebilir. Genellikle, verinin derin bir şekilde bilimsel olarak araştırılması yerine, acil ihtiyaç için kullanılması ve bu şekilde devam edilmesi üzerinde durulur. Veri bilimi ise her zaman bilimle ilgili olmalıdır (verilerle değil). Bu konuyu takiben, bazı araçlar ve teknikler vazgeçilmez hale gelir.


Bu konuların bir çoğu sağlam bir bilimsel sürecin ayırt edici özellikleridir:

  • Temel dinamikleri inceleyerek bir süreci (fiziksel veya bilgilendirici bir şekilde) modellemek

  • Hipotez oluşturmak

  • Veri kaynağının kalitesini titizlikle tahmin etmek

  • Veriler ve tahminler etrafındaki belirsizlikleri belirlemek

  • Bir modelin sınırlamasını anlamak

  • Matematiksel kanıtları ve arkasındaki soyut mantığı anlamak


Veri bilimi, doğası gereği, belirli bir alanla sınırlı değildir. Kanser teşhisinden, sosyal davranış analizine kadar çok çeşitli fenomenlerle ilgili olabilir. Ayrıca veri bilimi, n-boyutlu matematiksel nesnelerin baş döndürücü bir dizisini, istatistiksel dağılımları, optimizasyon objektif fonksiyonlarını vb. matematiksel hesaplamaları gerektirebilir.


Veri biliminde zirveye oynamak isteyenlere tavsiye edebileceğim Matematik konuları:


 

Temel Matematik: Fonksiyonlar, Değişkenler, Denklemler ve Grafikler

Fonksiyonlar, Değişkenler, Denklemler ve Grafikler

Temel Matematik, bir çizgi denkleminden, binom teoremine ve aradaki her şeyde dahil; tüm şu temel konuları kapsar:

  • Logaritma, üstlü sayılar, polinom fonksiyonları, rasyonel sayılar

  • Temel geometri ve teoremler, trigonometrik özdeşlikler

  • Reel ve karmaşık sayılar, ve temel özellikleri

  • Seriler, toplamlar, ve eşitsizlikler

  • Grafikler ve çizimler, Kartezyen ve kutupsal koordinatlar, konik kesitleri


Veri Bilimi Açısından Bu Temel Matematik Konularını Nerelerde Kullanabilirsiniz?


Bir aramayı sıraladıktan sonra bir milyonluk veritabanında nasıl daha hızlı çalışılacağını anlamak istiyorsanız, “ikili arama” kavramıyla karşılaşırsınız. Veri biliminin dinamiklerini anlamak için logaritmaları ve tekrarlama (Nüks) denklemlerini anlamanız gerekir. Veya bir zaman serisini analiz etmek isterseniz, “periyodik fonksiyonlar” ve “üstel bozunma” gibi kavramlarla karşılaşabilirsiniz.


Peki Bu Temel Matematik Konularını Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?


 

İstatistik

geralt/Pixabay/CC0

Temel istatistik ve olasılık kavramları üzerinde sağlam bir kavrayışa sahip olmanın önemi göz ardı edilemez. Veri bilimi alanındaki birçok uygulayıcı, klasik (sinirsel ağ olmayan) makine öğreniminin istatistiksel öğrenmeden başka bir şey olmadığını düşünmektedir.


Bu konu çok kapsamlıdır ve şu temel kavramlar kritik öneme sahiptir:

  • Veri özetleri ve tanımlayıcı istatistikler, merkezi eğilim, varyans, kovaryans, korelasyon

  • Temel olasılık: Temel fikir, beklenti, olasılık hesabı, Bayes teoremi, koşullu olasılık

  • Olasılık dağılım fonksiyonları: düzgün, normal, binom, iki-kare, Öğrencinin t-dağılımı, merkezi limit teoremi

  • Örnekleme, ölçme, hata, rasgele sayı üretimi

  • Hipotez testi, A / B testi, güven aralıkları, p-değerleri

  • ANOVA, t-testi

  • Doğrusal regresyon, düzenlenme


Veri Bilimi Açısından Bu Temel Kavramları Nerelerde Kullanabilirsiniz?


Mülakatlarda, bu kavramlarda ustalaştığınızı gösterebilirseniz, karşı tarafı en hızlı şekilde etkileyebilirsiniz. Ve bu kavramları neredeyse her gün bir veri bilimcisi olarak kullanacaksınız.


Peki Bu Temel Kavramları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?


 


Doğrusal Cebir

Doğrusal Cebir

Doğrusal Cebir, Makine Öğrenimi (ML) algoritmalarının bir veri akışı üzerinde nasıl çalıştığını anlamak açısından önemli bir matematik dalıdır. Facebook’taki arkadaş önerilerinden Spotify’daki şarkı önerilerine, hatta derin transfer öğrenimini kullanarak selfie fotoğrafınızı Salvador Dali tarzı bir portreye aktarmaya kadar kullanılan bir çok yazılımdaki her şey matrisleri ve matris cebirini içerir.


İşte öğrenmeniz gereken doğrusal cebirdeki temel konular:

  • Matris ve vektörlerin temel özellikleri: skaler çarpım, doğrusal dönüşüm, devrik, konjugat, sıralama, determinant

  • İçler ve dışlar çarpımı, matris çarpım kuralı ve çeşitli algoritmalar, ters matris

  • Özel matrisler: kare matris, birim matrisi, üçgen matris, seyrek ve yoğun matris, birim vektörler, simetrik matris, Hermitian, asimetrik-Hermitian ve üniter matrisler

  • Matrisi çarpanlara ayırma kavramı / LU ayrışması, Gauss / Gauss-Jordan elemasyonu, Ax = b lineer denklem çözme sistemi

  • Vektör uzayı, temel, açıklık, diklik, ortanormallik, doğrusal en küçük kare

  • Özdeğerler, özvektörler, köşegenleştirme, tekil değer ayrışımı


Veri Bilimi Açısından Bu Temel Konuları Nerelerde Kullanabilirsiniz?


Boyut küçültme tekniği ile temel bileşen analizini kullandıysanız, veri kümenizin daha az parametre ile kompakt bir boyut temsili elde etmek için muhtemelen tekil değer ayrışmasını kullanmış olursunuz. Tüm sinir ağı algoritmaları, ağ yapılarını ve öğrenme işlemlerini temsil etmek ve işlemek için doğrusal cebir teknikleri kullanılır.


Peki Bu Temel Konuları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?


 

Kalkülüs

Calculus

İster üniversitede iken sevin isterse nefret edin, Kalkülüs veri bilimi ve makine öğreniminin birçok yerinde karşınıza muhakak çıkacak. Doğrusal regresyonda sıradan bir en küçük kareler probleminin basit görünümlü analitik çözümünün arkasından size gülümser veya sinir ağınızın yeni bir örüntü öğrenmek için yaptığı her geri yayılmada gömülüdür. Repertuarınıza eklemek açısından son derece değerli bir beceridir.


İşte bu alanda öğrenilecek konular:

  • Tek değişkenli fonksiyonlar, limit, süreklilik, türevlenebilirlik

  • Ortalama değer teoremleri, belirsiz formlar, L’Hospital kuralı

  • Maxima ve minima

  • Çarpım ve dizi kuralı

  • Taylor serileri, sonsuz seriler toplama/integrasyon kavramları

  • İntegral hesabın temel ve ortalama değer teoremleri, belirli ve belirsiz integrallerin değerlendirilmesi

  • Beta ve Gama fonksiyonları

  • Çok değişkenli fonksiyonlar, limit, süreklilik, kısmi türevler

  • Adi ve kısmi diferansiyel denklemlerin temelleri


Veri Bilimi Açısından Bu Konuları Nerelerde Kullanabilirsiniz?


Lojistik regresyon algoritmasının tam olarak nasıl uygulandığını hiç merak ettiniz mi? Minimum kayıp fonksiyonunu bulmak için “gradyanlı iniş” adı verilen bir yöntemi bu noktada kullanmanız çok olasıdır. Bunun nasıl çalıştığını anlamak için, matematikten gelen kavramları kullanmanız gerekir: gradyan, türevler, limitler ve dizi kuralı gibi…


Peki Bu Konuları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?


 

Soyut Matematik

Soyut Matematik

Bu matematik alanı, veri biliminde çok sık karşımıza çıkmaz, ancak tüm modern veri bilimi, hesaplama sistemlerinin yardımıyla gerçekleştirilir ve soyut matematik de bu tür sistemlerin kalbinde yer alır.


Soyut matematik, analiz projelerindeki algoritmaların ve veri yapılarının günlük kullanımı açısından kritik olan şu kavramları içermektedir:

  • Kümeler, alt kümeler, güç kümeleri

  • Sayma fonksiyonları, kombinatorik, sayılabilirlik

  • Temel ispat teknikleri: tümevarım, çelişkili kanıtlama

  • Tümevarım, tümdengelim ve önermeli mantığın temelleri

  • Temel veri yapıları: yığınlar, kuyruklar, grafikler, diziler, karma tablolar, ağaçlar

  • Grafik özellikleri: bağlı bileşenler, derece, maksimum akış / minimum kesim kavramları, grafik renklendirme

  • Nüks (Tekrarlama) ilişkileri ve denklemler

  • Fonksiyonların büyümesi ve O(n) gösterim kavramı


Veri Bilimi Açısından Bu Kavramları Nerelerde Kullanabilirsiniz?


Herhangi bir sosyal ağ analizinde, ağı aramak ve ağda dolaşmak için bir grafiğin özelliklerini ve hızlı algoritmayı bilmeniz gerekir. Herhangi bir algoritma seçiminde, zaman ve mekan karmaşıklığını – yani, O (n) (Big-Oh) gösterimini kullanarak çalışma süresi ve alan gereksiniminin giriş veri boyutu ile nasıl büyüdüğünü anlamanız gerekir.

Peki Bu Kavramları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?


 

Optimizasyon ve Yöneylem Araştırması Konuları

Optimizasyon ve Yöneylem Araştırması Konuları

Bu konular en çok teorik bilgisayar bilimi, kontrol teorisi veya yöneylem araştırması gibi uzmanlık alanlarıyla ilgilidir. Ancak bu güçlü tekniklerin temel olarak kavranması, makine öğrenimi pratiğinde de verimli olabilir. Hemen hemen her makine öğrenme algoritması, çeşitli kısıtlamalara tabi olan bir tür tahmin hatasını en aza indirmeyi amaçlamaktadır; ki bu bir optimizasyon sorunudur.


İşte bu alandaki öğrenilecek konular:

  • Optimizasyonun temelleri, sorunun nasıl formüle edileceği

  • Maxima, minima, dışbükey fonksiyon, global çözüm

  • Doğrusal programlama, simpleks algoritması

  • Tamsayılı programlama

  • Kısıt programlama, sırt çantası problemi

  • Rastgele optimizasyon teknikleri: yokuş yukarı tırmanma, benzetimli tavlama, genetik algoritmalar


Veri Bilimi Açısından Bu Konuları Nerelerde Kullanabilirsiniz?


En küçük kareler kaybı işlevini kullanan basit doğrusal regresyon problemleri, genellikle kesin bir analitik çözüme sahiptir, ancak lojistik regresyon problemlerinde bu yoktur. Bunun nedenini anlamak için, optimizasyonda “dışbükeylik” kavramına aşina olmanız gerekir. Bu, çoğu makine öğrenimi probleminde neden “yaklaşık” çözümlerden memnun kalmamız gerektiğini de aydınlatmaktadır.


Peki Bu Konuları Hangi Çevrim İçi Platformlardan Öğrenebilirsiniz?

  • edX: İş Analizinde Optimizasyon Yöntemleri

  • Coursera: Soyut Optimizasyon

  • edX: Deterministik Optimizasyon


Son Sözler

Öğrenilecek çok şey olmasına karşılık kendinizi çaresiz hissetmeyin sakın, zira bunların tamamını öğrenebilmeniz için çevrim-içi bir çok mükemmel kaynak var. Bu konular (muhtemelen bir lisans öğrencisi olarak okuyorsanız) hakkında yeni bir bilgi edindikten ve yeni kavramlar öğrendikten sonra, günlük veri analizi ve makine öğrenme projelerinizdeki gizli müziği duyabilme gücüne sahip olacaksınız. Ve bu, inanılmaz bir veri bilimcisi olabilmeniz için büyük bir sıçrama yaratacak!


Diğer Kaynaklar

  • KDnuggets: Veri bilimi için 15 matematik MOOC

  • EliteDataScience: Veri bilimi için matematik nasıl öğrenilir?

  • Data Science Weekly: Veri bilimimde özgeçmişim için ne kadar matematik ve istatistiğe ihtiyacım var?

  • Analytics Vidhya: Veri bilimi ve makine öğrenimi için matematik ve istatistik üzerine 19 MOOC

  • Y Combinator: Makine öğrenimi için matematik öğrenme


75 views0 comments
  • Beyaz LinkedIn Simge
  • Beyaz Facebook Simge
  • Beyaz Heyecan Simge

BU İÇERİĞE EMOJİ İLE TEPKİ VER

bottom of page