Veri bilimi yolculuğunuzun nihai yol haritası…
YouTube kanalımın (Data Professor) takipçileri tarafından veri bilimine nasıl giriş yapılacağına dair sık sık şu sorular soruluyor:
Nasıl Veri Bilimcisi olunur?
Veri Bilimini öğrenmek için hangi dersleri almalıyım?
Bu sebepten bu konuda bir makale yazmanın muhtemelen harika bir fikir olacağını düşündüm. Ve işte şimdi buradayım. Veri bilimini öğrenmek hakkında burada sizlere aktaracağım ve eminin ki bilmek isteyeceğiniz 10+1 şeyin, kendi kendini yetiştirmiş bir veri bilimcisi olarak kişisel yolculuğuma dayandığını belirtmek isterim. Mesele şu ki, zamanı geriye alabilseydim ve 22 yaşındaki benliğime veri bilimini öğrenme konusunda tavsiyede bulunabilseydim, o zaman bunlar söylemek istediğim şeylerden bazıları olurdu…
Veri bilimi yolculuğuma 2004 yılında ilk adımımı attım. Veri bilimi teriminin emekleme döneminde olduğu ve daha yaygın olarak kullanılan terimin de veri madenciliği olduğu bir dönemdi. 2012 yılına kadar veri bilimi terimi popülerlik kazanmaya başlamamıştı henüz ve Harvard Business Review’de “Veri Bilimcisi: 21. Yüzyılın En Seksi İşi” başlıklı makalenin kaleme alınmasıyla birlikte popülarite kazanmaya başladı…
Adımlar:
Veri Bilimini Öğrenmek için Kaynaklar (Ücretli & Ücretsiz)
Tam Sorumluluk Almak (Bonus Adım)
Adım #1| Veri Bilimi Nedir?
Özetle, Veri Bilimi, esas olarak sorunları çözmek ve şirketlere ve kuruluşlara etki, değer ve anlayış getirmek için verileri kullanan bir alandır. Veri bilimi; eğitim, finans, sağlık, jeoloji, perakende, seyahat ve e-sporu kapsayan çok çeşitli disiplinlere ve endüstrilere uygulanmıştır.
Veri biliminin teknik beceri setleri, veri toplama, veri ön işleme, keşifsel veri analizi, veri görselleştirme, istatistiksel analiz, makine öğrenimi, programlama ve yazılım mühendisliğinin kullanımını içerir.
Teknik yönünün yanı sıra, bir veri bilimcisi için arzu edilen çeşitli beceriler vardır. Aşağıdaki infografikte bir Veri Bilimcisinin temel becerilerine ilişkin üst düzey bir genel bakış sunulmaktadır.
Veri Bilimi Yolculuğu kişiden kişiye farklılıklar gösterebilir; yani kişiseldir. Kendinizi başkalarıyla kıyaslamayın bu noktada, herkesin benzersiz olduğunu ve her birimizin farklı yollarda olduğunu unutmayın. Neden başka birinin gittiği yoldan illa gitmek isteyelim ki? Kendi veri bilimi yolculuğunuza odaklanın. Aksilikler olabilir ve bu serüven ertelenebilir, ancak bu engellerin sizi hedefinize ulaşmaktan alıkoymasına asla izin vermeyin.
Geç olması hiç olmamasından daha iyidir.
İmposter (taklitçilik) sendromunu benimseyin ve güvensizlikleri, veri bilimi yolculuğunuzun büyük resmini görebilmenizde size yardımcı olacak ve yol gösterebilecek bir harita olarak düşünün. Özellikle bu, sizi kendinizi geliştirme yoluna götürebilir.
Öğrenmek ve uygulamak için kendi listenizi oluşturun. Henüz bilmediğiniz veri bilimi kavramlarını ve becerilerini belirleyin ve bilmek istediklerinizi not edin.
Ardından, bu veri bilimi kavramları/becerileri listesinden günde yalnızca 1 yeni şey öğrenmeye odaklanın. 1 yılın sonunda, bileşik etkiye ve ne kadar yeni kavram ve beceri öğreneceğinize şaşıracaksınız.
3.1| Öğrenme Stilleri
Nasıl öğreniriz? Öğrenme stili* yaygın olarak 3 ana tipte sınıflandırılır:
Görsel (Görerek)
İşitsel (Duyarak)
Kinestetik (Yaparak, Uygulayarak)
* Sorumluluk Reddi: Öğrenme stilleri için bilimsel bir kanıt bulunmadığına dikkat edilmelidir ve bu nedenle burada ana akım popülerliğini iade etmek için ‘popüler olarak’ terimini kullandık. Öğrenme stili, burada var olan çeşitli ve birçok biçim ve ortamı göstermek için kullanılmaktadır. Burada sunulan tavsiyeler tamamen kendi görüş ve deneyimlerime dayanmaktadır. Öğrenme stili mitiyle ilgili yayınlanmış araştırmaya buradan bakabilirsiniz.
Bilgi her yerdedir ve öğrenmenin kaynağı birçok şekil ve biçimde olabilir. Örneğin kitaplardan, bloglardan, videolardan, podcast’lerden, sesli kitaplardan, okuldaki yada kurslardaki derslerden, öğretmenlerden ve hepsinden önemlisi uygulayarak öğrenebilirsiniz.
“Veri Bilimini Öğrenmenin En İyi Yolu Veri Bilimi Yapmaktır.” Chanin Nantasenamat
Yeni kavramlar veya beceriler (ör. görsel ve işitselden) öğrendikçe, öğrendiklerinizi bu yeni bilgiyi hemen veri bilimi projenize (yani kinestetik, yaparak) uygulayarak pekiştirebilirsiniz. Sürekli veri bilimi yaparak, öğrenmiş olduğunuz yeni kavramları ve becerileri yavaş yavaş pekiştirecek ve geliştireceksiniz. Ve zamanla onlara hakim olacaksınız…
Ek olarak, bu yeni kavramlar veya beceriler hakkındaki anlayışınızı daha da güçlendirmek için başkalarına öğretebilirsiniz (örneğin, bir öğretici blog yazmak, bir video eğitimi yapmak ve başkalarına anlatarak, aktararak). Bunu yaparak, yukarıda belirtilen 3 öğrenme stilini kullanabilir ve böylece öğrenme potansiyelinizi en üst düzeye çıkarabilirsiniz. Şunu da belirtmekte fayda var ki, başkalarına öğretmek, yeni kavramları veya becerileri kendi ifadelerinizle somutlaştırmanıza ve bunu yaparken düşüncelerinizi yeniden düzenlemenize ve onu daha iyi anlamanıza yardımcı olacaktır.
Bu, nasıl öğrenileceğine dair tavsiyeler konusunda buzdağının sadece görünen kısmı. Aslında, Coursera’da Dr. Barbara Oakley ve Dr. Terrence Sejnowski tarafından Öğrenmeyi Öğrenme adlı çevrimiçi bir kurs var, bu size daha verimli öğrenmenize yardımcı olacak bazı öğrenme tekniklerini öğretecektir; ki bence harika bir kurs.
Bir başka harika öğrenme yolu da, Evernote’un Nobel ödüllü ve fizikçi Richard Feynman tarafından tasarlanan öğrenme tekniğini özetleyen Feynman Tekniğinden Öğrenme başlıklı bir Medium makalesidir. Ek olarak, En İyi 25 Bilimsel Çalışma İpuçları konulu bir YouTube videosu var, ki burada veri bilimini öğrenirken kullanabileceğiniz etkili çalışma ipuçları sunulmaktadır…
Ayrıca Scott Young, Ultra öğrenme üzerine mükemmel bir kitap yazmış ve burada MIT’nin 4 yıllık bilgisayar bilimleri müfredatını sadece 1 yılda öğrenme konusundaki kendi kendine öğrenme deneyimini bizlerle paylaşmaktadır. Buna ek olarak, Josh Kaufman’ın gerçekleştirdiği bir TED konuşmasında, İlk 20 Saat adlı kitabından aktarıldığına göre, istediğimiz her şeyi sadece 20 saatte öğrenebileceğimiz anlatılıyor…
Öğrenme sanatında ustalaşmak, veri bilimini daha etkili bir şekilde öğrenmenize ve incelemenize olanak tanır ve karşılığında öğrenme deneyiminizi çok daha keyifli hale getirir.
2020 yılının başlarında, veri bilimi yolculuğunuza başlamak için bazı pratik ipuçlarını ve püf noktalarını paylaştığım 2020’de Veri Bilimi Öğrenme Stratejileri adlı bir YouTube videosu yayınlamıştım. Ayrıca, sizi kuş bakışı alıp veri biliminin bütünsel manzarasına baktığım Veri Bilimcisi Nasıl Olunur (Öğrenme Yolu ve Gerekli Beceri Setleri) kitabına da göz atmak isteyeceksinizdir eminim ve tüm Veri Bilimcilerinin bilmesi gereken 8 önemli beceri anlatılıyor burada.
2021’in başında, veri bilimini öğrenmeye nasıl başlayabileceğinize dair en iyi ipuçlarımı paylaştığım daha geniş kapsamlı bir Veri Bilimi Öğrenme Sanatı (2021’de veri bilimi nasıl öğrenilir) videosunu yayınladım. Bu videoda, veri bilimi öğrenme yolculuğunuza hızlı bir başlangıç yapmak için yapabileceğiniz temel en iyi uygulamaları araştırdım ve damıttım. Veri bilimi öğrenmeye ilişkin stratejiler ve tavsiyeler sağlayan ek videolara, Data Professor YouTube kanalındaki Data Science 101 oynatma listesinden erişebilirsiniz.
Veri Bilimini Öğrenme Sanatı (2023’de Veri Bilimi Nasıl Öğrenilir)
Nasıl Veri Bilimcisi Olunur? (Öğrenme Yolu ve Beceri Setleri)
Ken Jee, “Veri Bilimi Nasıl Ultra Öğrenilir?” başlıklı mükemmel bir Medium makalesi ve YouTube videosu hazırladı. Ek olarak, başka bir YouTube videosu, Veri Bilimini Nasıl Öğrenirim (Yeniden Başlamak Zorunda Olsaydım) da bazı ipuçları paylaşıyor.
Veri Bilimini Nasıl Öğrenirdim (Yeniden Başlamak Zorunda Kalsaydım)
Adım #4| Veri Bilimini Öğrenmek için Kaynaklar (Ücretli & Ücretsiz)
Veri bilimini öğrenmek için çok sayıda kaynak var. Aslında, o kadar çok ki, aralarından seçim yapmak oldukça zor gelebilir. Mevcut öğrenme kaynaklarını 2 ana türe ayıracağım: Ücretli ve Ücretsiz.
Aşağıdaki bölümlerde, veri bilimi öğrenmek için bazı kaynakları ücretli ve ücretsiz olarak listeleyeceğim.
365 Data Science
DataCamp
DataQuest
Data Science Dojo 1. Data Science Bootcamp 2. Python for Data Science 3. Practicum
O’Reilly Online Learning ($49/month or $499/year)
Udemy (Veri Bilimi kursu) — Aşağıdakiler en iyi kurslardır: 1. Machine Learning A-Z™: Hands-On Python & R In Data Science 2. Python for Data Science and Machine Learning Bootcamp 3. The Data Science Course 2020: Complete Data Science Bootcamp 4. Data Science A-Z™: Real-Life Data Science Exercises Included 5. R Programming A-Z™: R For Data Science With Real Exercises! 6. Artificial Intelligence A-Z™: Learn How To Build An AI 7. Machine Learning, Data Science and Deep Learning with Python 8. Python A-Z™: Python For Data Science With Real Exercises! 9. Statistics for Data Science and Business Analysis 10. Complete Machine Learning and Data Science: Zero to Mastery
edX — CS50 dışında, diğerleri ücretlidir 1. CS50 (Free / Verifiable certificate for $90) 2. Professional Certificate in Data Science (Harvard University) 3. MicroMasters® Program in Statistics and Data Science (MIT) 4. MicroMasters® Program in Data Science (UC San Diego) 5. IBM’s Professional Certificate in IBM Data Science (IBM) 6. MicroMasters® Program in Analytics: Essential Tools and Methods (Georgia Tech University) 7. Master of Science in Analytics (Georgia Tech University)
Coursera — Sertifika almak isterseniz ücretli 1. Machine Learning (Andrew Ng / Stanford University) 2. Data Science Specialization (10 courses / John Hopkins University) 3. Executive Data Science Specialization (5 courses / John Hopkins University) 4. Data Mining Specialization (6 courses / University of Illinois) 5. Master of Computer Science in Data Science (8 courses / University of Illinois at Urbana-Champaign) 6. Master of Applied Data Science (University of Michigan)
Udacity — Udacity’nin Veri Bilimi Okulu ve Yapay Zeka Okulu’nda bulunan belirli giriş kursları için ücretsiz veya Nanodegree programları için ücretlidir 1. Intro to Data Science (Free) 2. Intro to Data Analysis (Free) 3. Data Analysis and Visualization (Free) 4. SQL for Data Analysis (Free) 5. Intro to Inferential Statistics (Free) 6. Data Scientist Nanodegree Program (Fee) 7. Data Analyst Nanodegree Program (Fee) 8. Data Visualization Nanodegree Program (Fee) 9. Data Engineer Nanodegree Program (Fee) 10. Machine Learning Engineer Nanodegree Program (Fee)
Kaggle Micro-Kurslar — Aşağıdakilerden oluşan 14 mikro kurs var: 1. Python 2. Intro to Machine Learning 3. Intermediate Machine Learning 4. Data Visualization 5. Pandas 6. Feature Engineering 7. Deep Learning 8. Intro to SQL 9. Advanced SQL 10. Geospatial Analysis 11. Microchallenges 12. Machine Learning Explainability 13. Natural Language Processing 14. Intro to Game AI and Reinforcement Learning
YouTube — Veri biliminde birkaç önemli konuyu kapsayan birkaç mükemmel kanal var. 1. Data Professor 2. Ken Jee 3. Krish Naik 4. Codebasics 5. 3Blue1Brown 6. StatQuest with Josh Starmer 7. Sentdex 8. Data School 9. Python Programmer 10. Lex Fridman 11. Abhishek Thakur 12. Two-Minute Papers 13. Andreas Kretz 14. Cory Schafer 15. Siraj Raval 16. Story by Data (Kate Strachnyi) 17. RichardOnData 18. Joma Tech (Data Science Playlist) 19. 365 Data Science 20. Data Science Dojo 21. Data Camp 22. Import Data 23. Data Science Jay 24. David Langer 25. Daniel Bourke 26. Python Engineer
Veri bilimini öğrenmenin ve bu alandaki becerilerinizi geliştirmenin bir başka yolu da veri bilimi yarışmalarına ve hackathon’a katılmaktır. Veri bilimi yarışmasına katılabileceğiniz bilinen ve popüler bir platform olan Kaggle, ve makine öğrenimi hackathon’una ev sahipliği yapan bir platform da MachineHack’tir.
Bu etkinliklerde yer almanın büyük bir kısmını, eldeki problemin üstesinden gelebilmek için gerekli olan büyük ölçüde doğaçlama ve yaratıcılık yeteneği belirler. Bu olaylar bir zaman faktörü içerdiğinden (yani belirli bir son teslim tarihi söz konusudur), bilinçaltında projeyi devam ettirebilmek açısından bu motive edicidir.
Veri bilimi projesini belirli bir tarih veya saate kadar bitirmeniz için herhangi bir baskının olmadığı bir öğrenme senaryosunda ise , o zaman gecikme olasılığınız olabileceği (yani, erteleme veya yaşamda meydana gelen olaylardan kaynaklanabilecek) tasavvur edilebilir. Okulda olduğunuz ve belirli bir tarih ve saatte yapılacak bir sınava çalışmak zorunda olduğunuz zamanları bir hatırlayın.
Böylece sınava girebilmeniz ve geçebilmeniz için (gerekli okuma, hatırlama, anlama ve ezber yaparak) sınava hazırlanırsınız. Benzer şekilde, bir yarışmaya veya hackathon’a katılmaya ve tamamlamaya kararlıysanız, bu etkinlikler tarafından verilen veri setini (yani veri ön işleme, keşifsel veri analizini, mühendisliğini, model oluşturmayı ve model yorumlamayı) hazırlamanız ve analiz etmeniz gerekir.
Yarışmalara ve hackathonlara katılmanın bir başka harika nedeni de model performansını iyileştirmenin yaratıcı yollarını bularak kazanabileceğiniz değerli ipuçları ve püf noktalarıdır.
Bunu yaparken, veri kümesine nasıl yaklaşılacağına dair yeni yolları tartışmak için diğer veri bilimcilerine ulaşmanıza ve bunu yaparken birkaç yeni şey öğrenmenize yol açabilecek öğrenme sürecine dahil olabilirsiniz. Ek olarak, model performansını iyileştirmenin yollarını arama yolculuğunuz, araştırma literatürünü derinlemesine incelemenize ve yeni şeyler, kütüphaneler ve/veya yaklaşımlar denemenize yol açabilir. Bütün bunlar, sadece geleneksel ve pasif yollarla öğrenmeyi tercih etseydiniz muhtemelen mümkün olmayacaktı.
Daha büyük veri bilimi yarışmaları ve hackathonlar için lütfen Benedict Neo’nun, Towards Data Science’da yayınlanan 2020 için becerilerinizi geliştirmeniz için 10 Veri Bilimi Yarışması başlıklı mükemmel gönderisine bakmanızı tavsiye ediyorum.
Ayrıca, bir Veri Bilimi Yarışması Nasıl Kazanılır: En İyi Kaggle’lardan Öğrenin ve bu yarışmalarda kazanmak için en iyi uygulamalardan bazılarını öğrenin konulu Coursera kursuna katılmanızı da öneriyorum.
Ayrıca Abhishek Thakur’un My Journey: How I Became The World’s First 4x (ve 3x) Grand Master On Kaggle’daki YouTube videosuna da göz atmak isteyebilirsiniz.
Adım #5| Neden Veri Bilimi?
Veri Bilimini neden öğrenmek istediğinize ilişkin net bir amaç ve nedene sahip olmak, veri bilimini daha fazla takdir etmenize yardımcı olabilir. Aşağıdaki ana soruları inceleyerek bunun hakkında düşünmek için kendinize biraz zaman ayırın.
Kendinize sormak istediğiniz en önemli soru basitçe neden veri bilimini öğrenmek istiyorsunuz? Bu soruyu yanıtlayarak, veri biliminin öncelikle hangi alanına odaklanmanız gerektiğini daha iyi anlayacaksınız, çünkü alan çok geniş ve içinde kaybolmak ve bir tavşan deliğine düşmeniz muhtemel.
Projelerinizde Veri Bilimi’ni nasıl kullanacağınızı belirlemeniz bu noktada çok önemli.
Cevaplamak isteyeceğiniz sorulardan bazıları şunlardır:
Keşfedici veri analizi yapacak mısınız?
Bir regresyon/sınıflandırma/kümeleme modeli geliştirecek misiniz?
Bir sohbet botu geliştirecek misiniz?
Bir öneri sistemi geliştirecek misiniz?
Stephen Covey’in Etkili İnsanların 7 Alışkanlığı kitabında da belirttiği gibi,
“Aklınızdaki Son Şey ile Başlayın.”
Bu nedenle, Veri Bilimi ile ulaşmayı umduğunuz ve arzuladığınız hedef hakkında kendinize bir dakika ayırın.
Açıkçası, aklınızda net bir hedef olduğunda, bu hedefe ulaşmak için ne kadar kararlı olduğunuza şaşıracaksınız.
İlk olarak, kendi gelişiminizden sorumlu olmanız, yolda kalmanıza yardımcı olacaktır. Ken Jee tarafından kurulan harika bir çevrimiçi veri bilimcisi topluluğunun parçası olun. Bu çevrimiçi toplulukta, üyelerin hafta veya ay için amaçlarının ne olduğunu herkese açık olarak yayınlayabilecekleri bir tartışma panosu olacak. Bunu yaparken, başlangıçta amaçladığınız hedefe bağlı kalmanıza yardımcı olacaktır.
Ken ayrıca, Veri Bilimi Öğrenirken Nasıl Motive Edilir ve Üretken Kalınır başlıklı Medium makalesinde motive olmak ve üretken kalmak için daha fazla ipucu ve püf noktası paylaşıyor. Ek ipuçları için, Kevin Daum tarafından kaleme alınan Son Derece Sorumlu Kişilerin 8 Alışkanlığı başlıklı makalede okunabilir.
İşte üretken olmak için verebileceğim bazı temel tavsiyeler:
Veri bilimi öğrenmeye ve uygulamaya her gün (tercihen her gün 1–2 saat veya en az 45 dakika) zaman ayırın.
Dikkat dağıtıcı şeylerden kaçının (Telefonunuzu, Tabletinizi vs. kapatın, sosyal medyayı kontrol etmekten kaçının vb.). Dikkat dağıtıcı şeylerin size ulaşmasını engelleyemiyorsanız, o zaman belki de dikkatinizi dağıtan bir ortamdan uzaklaşmak daha iyi bir fikir olabilir. Bu, dikkatinizi odaklanmaya verebileceğiniz sessiz bir yer bulmanız gerektiği anlamına gelebilir.
Erteleme, fazla düşünme ve sadece yap! Bunun üstesinden gelmenize yardımcı olması için, hareket halinde kalmanıza yardımcı olması için 2 dakikalık kuralı uygulamayı deneyin (“2 Dakika Kuralını Kullanarak Ertelemeyi Nasıl Durdurursunuz” konulu Medium makalesini okuyun).
Çünkü günün sonunda, gelişim kaydedemiyorsanız, öğrenmiyorsunuz ve hedeflere ulaşmak ve kariyerinizde olmak istediğiniz yerde olmak için ilerlemiyorsunuz demektir.
İyi bir arkadaşım Ken Jee, öğrenme yolculuğunuz için sorumluluk sağlamaya yardımcı olan #66daysofdata öğrenme mücadelesine başladı. Ken’in dediği gibi #66daysofdata yarışmasına katılmak için:
Bir veri bilimi projesini okumak, öğrenmek veya uygulamak için kendinize günde en az 5 dakika ayırın.
#66daysofdata’yı kullanarak ilerlemenizi sosyal platformlarda (Twitter, LinkedIn, vb.) paylaşın.
Hepsi bu kadar ve artık veri bilimi öğrenim yolculuğunuzda sizi sorumlu tutmak için büyük bir veri bilimi öğrenen topluluğuna sahipsiniz. Bu #66daysofdata girişimi hakkında aşağıdaki videodan bilgi edinebilirsiniz:
#66DaysOfData nedir?
Başarısızlığı kucaklayın. Rahatsızlığa alışmayı öğrenmen gerekecek. Çünkü basitçe söylemek gerekirse, Bedava Öğle Yemeği Yok. Kolay para yok.
Bu yüzden başarısızlıkla karşılaştığınızda, bunun üzerinde durmayın, sadece ayağa kalkın ve denemeye devam edin.
Takılıp kalmakta sorun yok, X algoritmasını anlamamakta sorun yok ve başarısız kodunuzda nasıl hata ayıklayacağınızı bilmemekte sorun yok. Meydan okumanın üstesinden gelmeden önce zihninizi tazelemek için bir mola verebilirsiniz. Bazen zihniniz tıkanır ve halsizleşir ve bu nedenle ara vermek zihnin gençleşmesine ve tazelenmesine yardımcı olabilir.
Veri bilimi projeniz için bir kodlama hatasıyla karşılaştığınızda ve nasıl ilerleyeceğinizden emin değilseniz; kodlama konusunda bilgili bir arkadaşınız varsa ona sorun.
Hata ayıklamayı sevmeyi öğrenin, bunu başarısızlıklardan ve hatalardan öğrenilen değerli içgörüler ve dersler elde edebileceğiniz bir öğrenme fırsatı olarak kabul edin. Çünkü başarısız olmazsanız, öğrenemezsiniz. Ancak başarısız olduğunuzda, kendinize karşı çok sert olmayın ve ayağa kalkıp yeniden başlamayı öğrenin. Başarısızlığa karşı dirençli olun.
Veri Bilimine yeni başlayan biri, tüm süslü terminolojiler karşısında şaşkına dönebilir, ancak gözünüzü korkutmamaya çalışın ve Veri bilimi ve Makine öğreniminin dinamik, büyüyen ve gelişen bir alan olduğunu ve bu nedenle her zaman yeni teknolojilerin geliştirildiğini unutmayın.
Basitçe söylemek gerekirse, sabit kalacak tek şey değişimin ta kendisidir.
Yukarıda bahsedildiği gibi, korkmayın ve derinlere dalın ve sadece başlayın. Nereden başladığınız önemli değil, önemli olan en önemli şey, veri bilimi yolculuğunuza gerçekten bir şekilde başlamanızdır.
Veri tartışması (Python — pandalar, R — dplyr)
Modellerinize uygulayabilmeniz için istatistikleri okuyun. Örneğin, Modelleri Karşılaştır’a uygun istatistikleri uygulamak (parametrik ve parametrik olmayan).
Verilere genel bir bakış elde etmek için keşifsel veri analizi ve tanımlayıcı istatistikler
Basit ve yorumlanabilir makine öğrenimi modelleri oluşturmaya başlayın (doğrusal regresyon, ağaç tabanlı yöntemler)
Kullanacağınızdan emin olduğunuz makine öğrenimi yaklaşımlarını kullanın (arkasındaki matematiği bilerek)
Fazla düşünmeyin. “Hangi dili öğrenmeliyim?” sorusunun üstesinden gelin. ikilemde kalmayın, birini seçin ve devam edin.
Programlamanın, projenizin fikrini geliştirme ve dağıtım için ileriye taşımanıza yardımcı olması gereken bir araç olduğunu bilin.
Programlamanın altında yatan kavramlar dilden bağımsızdır:
Değişkenleri, dizileri, veri çerçevelerini vb. tanımlama
Akış kontrolü (ör. döngüler için, if ve else deyimleri)
Veri biliminde belirli görevler:
– Veri tartışması / Veri ön işleme – Veri goruntuleme – Model oluşturma – Model dağıtımı
Veri bilimi projelerinizi tekrarlanabilir hale getirmenin faydalarından bazıları şunlardır:
Bir kodlama hatasıyla karşılaştığınızda, diğerlerinin size yardımcı olabilmeleri için hatalarınızı yeniden oluşturmasına izin vereceğinden, minimum çalışan bir örnek (MWE) yapmak önemlidir.
Projenizi Python ve Conda ortamlarının yanı sıra Docker ile dışa aktarın. Çünkü kodlama ortamınızda kurulu olan temel kitaplıkların sürekli değişen sürümleri nedeniyle bugün işe yarayan şey bundan 6 ay sonra çalışmayabilir. Bu nedenle sanal ortamları, Docker kullanmak veya en azından kitaplık sürümlerini dışa aktarmak (pip ve conda için aşağıda gösterilmiştir) önemlidir.
Ortamı pip olarak dışa aktarma:
pip freeze > requirements.txt
Conda’da dışa aktarma ortamı:
conda env export > environment.yml
Bu bölüm, veri bilimi yolculuğunuzun başarı düzeyinin içeriden başladığı fikrini araştırıyor. Zihninizi başınıza geleceklere hazırlamakla ilgilidir. Buradaki kavramlar şunlardır: Merak, Süreci Sevmek, Büyüme Zihniyeti ve Cesaret.
10.1| Merak
Merak, bir veri bilimcisi olmak için temel ve gerekli becerilerden biri olarak kabul edilebilir, çünkü bizi, sorunları çözmenin yaratıcı yollarını arama konusunda motive ve ısrarcı tutar.
Albert Einstein bir keresinde merak ve bilgiyi karşılaştırmıştır.
“Merak bilgiden daha önemlidir.” Albert Einstein
Eric Colson, Harvard Business Review’de Merak Odaklı Veri Bilimi başlıklı makalesinde merakın önemini şöyle vurgulamıştır:
“…veri biliminin planlarınızı nasıl destekleyeceği ve uygulayacağı hakkında daha az düşünün ve veri bilimcilerinizi asla hayal etmediğiniz şeyleri ortaya çıkarmaları için güçlendirecek bir ortamın nasıl oluşturulacağı hakkında daha fazla düşünün.” Eric Colson
10.2| Süreci Sevmek
Veri bilimini öğrenmek o kadar da kolay değildir yada hiç te imkansız değildir. Önceki Medium makalemde Bir Biyolog Nasıl Veri Bilimcisi Oldu’nda tartıştığım gibi, teknik olmayan bir geçmişe sahip bir kişinin veri bilimine girmesi kesinlikle mümkündür.
Süreci sevmekten bahsederken akla üç isim geliyor: Michael Jordan, Gary Vaynerchuk ve Clément Mihailescu. Bu üç kişi, yaptıkları işte en iyisi olarak kabul edilebilir ve yaptıkları işe olan tutkuları son derece yüksekti.
Michael Jordan, ilk profesyonel basketbol sözleşmesini imzalarken; her zaman ve her yerde kısıtlama olmaksızın basketbol oynamasına izin verecek özel bir madde sözleşmeye dahil edildi.
Gary Vaynerchuk’un (VaynerX Başkanı, VaynerMedia CEO’su) bir YouTube videosunda, söylediği gibi:
“İşin sürecini seviyorum, zorlanmayı seviyorum, tırmanmayı seviyorum….İstediğim şeyleri başarmak için gereken işi bitirimezsem boğulurum.” Gary Vaynerchuk
Clément Mihailescu (AlgoExpert’in CEO’su, Eski Facebook Yazılım Mühendisi ve Teknoloji YouTuberî) bir YouTube videosunda tükenmişlik sendromunu yaşamadığını şöyle ifade ediyor:
“Günün sonunda, sürecin tadını çıkarmalısınız. Yaptığınız şey ne olursa olsun, peşinden koştuğunuz çaba ne olursa olsun, günden güne zevk almalısınız, küçük cesur şeyleri sevmelisiniz. Yaşamak ve nefes almak zorundasınız.” Clément Mihailescu
Angela Duckworth (Karakter Laboratuvarı Kurucusu ve CEO’su ve Pennsylvania Üniversitesi’nde Psikoloji Profesörü) gerçekleştirdiği birkaç yıllık araştırmaya dayanarak, en çok satan kitabı Grit: The Power of Passion and Perseverance’da (YouTube videosu) azim terimini şu şekilde tanımlıyor: Tutkunun ve ısrarın birleşimi. Özellikle, onun azim tanımından bir alıntı:
“Azim, çok uzun vadeli hedeflere yönelik ilgiyi ve çabayı sürdürme eğilimidir.” Angela Duckworth
Carol Dweck, Mindset: Changing The Way to Thinking The Way to Fulfill Your Potential adlı kitabında, hayatımızı yönlendiren iki ana zihniyet üzerine yaptığı araştırmadan elde ettiği bulguları açıklıyor: (1) gelişme zihniyeti ve (2) sabit zihniyet.
Birincisi başarı ile ilişkilendirilirken, ikincisi genellikle kendinden şüphe duymaya ve doyumsuz bir hayata yol açacaktır. TED konuşmasında Dweck, performansınızı iyileştirmenin anahtarı olarak konfor alanınızın dışında çalışmanın önemini öne sürüyor.
Veri biliminde, önceki kavramların üzerine yazabilecek veya tamamen yeniden tanımlayabilecek yeni ve zorlu kavramların tanıtımı her zaman olacağından değişim kaçınılmazdır. Her zaman karmaşık zorluklarla bombardımana tutulacağız, bu değişim ve zorluklarla başa çıkmak için, özellikle başarıya giden yolunuzu yönlendirmeye yardımcı olacak doğru zihniyete sahip olmak içten başlar…
Adım #11| Tam Sorumluluk Almak (Bonus Adım)
Hayatın talihsizlikleri için bahaneler bulmak ve sayısız şeyi suçlamak çoğu zaman kolay olanı seçmektir. Bunu yaptığımızda, Gary Vaynerchuk’un her zaman söylediği gibi “sıfır sorumluluğumuz var” (Başkalarını Suçlamayı Durdur ve Tüm Sorumluluğu Al üzerine mükemmel bir YouTube videosu).
Veri bilimini öğrenmek, hayatımızda yaptığımız diğer çabalardan farklı değildir. Mesele şu ki, öğrenme yolculuğumuz sırasında karşılaştığımız kendi gecikmelerimizden veya engellerden sorumlu olacak mıyız yoksa tüm sorumluluğu alıp suçu başka yere mi atacağız. Öncelikle bunu cevaplamalıyız.
Tam sorumluluk almakla ilgili aşağıdaki alıntıları göz önünde bulundurun (ilk iki alıntı ve üçüncü alıntı için bunları YouTube’da izleyin)
“Başınıza gelenlerin tüm sorumluluğunu alın, bu insan olgunluğunun en yüksek mertebelerinden biridir. Tüm sorumluluğu kabul ederek, çocukluktan yetişkinliğe geçtiğinizi bildiğiniz gündür.” Jim Rohn
“Hayatınızın sorumluluğunu kabul edene kadar, hayatınızı başka biri yönetiyordur.” Orrin Woodward
“Her şey sana ait, ve her şey senin suçun. Hayatta gerçekten kazanmak istiyor musun? Gerçekten mutlu olmak istiyor musun? Gerçekten neden mutluyum biliyor musun? Çünkü her şeyin benim suçum olduğunu düşünüyorum. Beğenmezsem değiştirebilirim.” Gary Vaynerchuk
Şimdi bir dakikanızı ayırın ve düşünün. Sorumluluk almaya ve tam sorumluluk almaya başlayalım, veri bilimi yolculuğunuzda ne kadar başarabileceğinize şaşıracaksınız. Yalnızca nesnel olabilirsek ve eylemlerimiz ve ilerleme eksikliğimiz için tam sorumluluk alabilirsek, bu konuda bir şeyler yapma yetkisine sahip olabiliriz. Sizi Jim Rohn’un şu alıntısıyla baş başa bırakıyorum.
“Başarı peşinden koştuğun bir şey değil, başarı olduğun bir şeydir.” Jim Rohn
Son Sözler
Ve işte karşınızda, zamanda geriye gidip 22 yaşındaki benliğime veri bilimi öğrenmeyi anlatabilseydim, veri bilimi öğrenme hakkında bilmek istediğim 10 şey ve hatta 11 şey bunlardır. Bunların veri bilimi yolculuğunuza başlamanıza yardımcı olacağını umuyorum veya zaten başladıysanız, bunlardan yararlı bir şeyler bulabileceğinizi düşünüyorum.
Bir dahaki sefere kadar, veri bilimini öğrenmenin en iyi yolu veri bilimi yapmak, uygulamaktır ve lütfen bu yolculuğun tadını çıkarın!
Hakkımda
Tayland’daki bir Araştırma Üniversitesinde Biyoinformatik Doçenti ve Veri Madenciliği ve Biyomedikal Bilişim Başkanı olarak tam zamanlı olarak çalışıyorum. Çalışma saatlerim içinde, veri bilimi hakkında çevrimiçi videolar yayınlayan bir YouTuber’ım (AKA Data Professor). Yaptığım tüm eğitim videolarında ayrıca GitHub’da (Data Professor GitHub sayfasında) Jupyter notebookları paylaşıyorum.
Veri Bilimi alanındaki en iyi paylaşımlarım (ve bazen ücretsiz olanlar) için E-Posta Listeme abone olun!
留言