13 Temmuz 2020 tarihinde oluşturuldu.En son 13 Temmuz 2020 tarihinde güncellendi

Makine Öğrenmesinin 7 Adımı

Makine öğrenmesi pek çok alanda kullanılmaya devam ediyor. Ele alınan model sonucunda tahminler yaparak sorunlara çözüm getirmesi amaçlanır. Cilt kanserinin tespitinden chatbotlara, arttırılmış gerçeklik uygulamalarından otomotive pek çok alan ve amaç için kullanılan makine öğrenmesinin 7 adımını en yalın haliyle aktarmaya çalıştım.
<img width="804" height="408" decoding="async" src="https://ceotudent.com/wp-content/images/post/user-38001/apgrc3.png">
1. Verilerin toplanması (Gathering the Data) 
İlk adım: verileri toplamak. Sağlıklı bir tahmin oluşturulması için ihtiyaç duyulan değişkenlere ait değerler içeren verilere ihtiyaç vardır. Bu veriler aracılığıyla modelimizi eğitir ve tahminler yapmasını sağlarız. Toplanılan verilerin miktarı ve niteliği modelin doğruluk oranını doğrudan etkiler. Toplanan veriler birbiri ardına sıralanarak bir tablo oluşturur. 
<img width="995" height="144" decoding="async" src="https://ceotudent.com/wp-content/images/post/user-38001/h6i15j.png">
Tabloda da görüleceği üzere bahşiş ve masada bulunan kişi sayısı – gün – geçirilen süre arasında ağlantı kurulmaya çalışılıyor. Elbette sağlıklı bir model oluşturmak için 5 adet veri asla yeterli olmayacaktır.
 2. Veri Ön İşleme (Data Preperation) 
En önemli basamaklardan biridir. Başarılı bir model oluşturmak için asla atlanmaması gereklidir. Başlangıç olarak verileri görselleştirmek değişkenler arası olası ilişkileri ve düzensizlikleri fark etmek için uygun bir adım olabilir. Örneğin pazartesi günlerine ait verilerin sayısının diğer günlere oranla çok daha fazla olması… 
Ele alınması gereken bir başka husus ise veriyi eğitim (train) ve test seti olarak 2’ye ayırmak. Veri setinin büyük bir kısmı modeli eğitmek, geri kalan kısmı ise modeli test etmek ve doğruluk oranını görmek için kullanılır. Eğitim için kullanılan verileri tekrar test için kullanmak hiç sağlıklı sonuçlar doğurmayacaktır. 
Ayrıca eksik verilerin incelenmesi, normalizasyon, aykırı verilerin incelenmesi gibi uygulanabilecek veri ön işleme basamakları bulunur. 
 
  3. Model Seçimi 
3. adım: model seçimi. Araştırmacıların ve veri bilimcilerin ortaya koyduğu farklı ihtiyaçlar için ortaya konmuş birçok model bulunur. Bazı modeller daha karmaşık veri setleri üzerinde çok iyi çalışırken, bazıları basit sayılacak veri setleri üzerinde çok iyi çalışır; ancak karmaşık veri setlerinde çok iyi bir sonuç doğurmayabilir. Aynı şekilde verilerin türü (görsel, nümerik, metin veya müzik) de seçilmesi gereken modelin türünü etkiler. 
 
 4. Modelin Eğitilmesi (Training) 
Eğitim (train) veri seti yardımıyla modelin eğitildiği adımdır. 
Örneğin Basit Doğrusal Regresyonu ele aldığımızı düşünelim. Basit doğrusal regresyonun tahmin modeli şu şekildedir;
<img width="1026" height="444" decoding="async" src="https://ceotudent.com/wp-content/images/post/user-38001/vkz9ng.png">
Burada y tahmin sonucunu; b1 değişkenin ağırlığını (weight) ; b0 ise önyargı (bias) ifade eder. Bağımsız değişkenlerin sayısına bağlı olarak bu ağırlıklar (weight) ve önyargılar (bias) ile birer matris oluşturulur. Ağırlıklar genelde W, önyargılar ise b ile temsil edilir. 
En başta ağırlık ve önyargı için random bir değer atanır, eğitimin her adımı bu değerler güncellenerek en doğru değerler yakalanmaya çalışılır.
  5. Değerlendirme (Evaluation) 
Modelin eğitilmesi tamamlandıktan sonra test veri seti ile değerlendirme yapılır. (Test veri seti eğitimde kullanılmayan verilerden oluşmalıdır.) Bu sayede modelin daha önce karşılaşmadığı verilerle karşılaştığında üreteceği sonuçlar görülebilir. Modelin gerçek dünyada üreteceği sonuçların temsili niteliğinde olduğu söylenebilir. 
6. 6. Parametre İyileştirmeleri (Parameter Tuning) 
Modeli daha doğru hale getirmek, doğruluk oranını arttırmak için tuning işlemi yapılır. Bu işlemde modelin hiperparametrelerine verilen değerlerin olası sonuçları karşılaştırılarak en iyisi bulunmaya çalışılır. Bu hiperparametreler kullanılan modele bağlı olarak değişebilir. Örneğin Gradient Boosting Machines’de “learning_rate, n_estimators, subsample” gibi hiperparametrelerin en iyi değerleri araştırılarak modelin doğruluğu artırılabilir. 
7. 7. Tahmin (Prediction) 
Modelin amacını yerine getirdiği adımdır. Modelin tahminler yaparak sorularımıza cevap verdiği, ele alınan problemin çözümü için kullanıldığı adımdır. 
Kaynaklar: Google Cloud Platform, The 7 steps of Machine Learning
https://www.youtube.com/watch?v=nKW8Ndu7Mjw

2 makale

Benzer içerikler

Girişimcilik Kariyer

Bir Girişimde ya da Bir Şirkette Çalışmak Arasındaki 7 Fark

Kariyer Kreatif

Sıradan Olan Özgeçmişini LEGO Karakterine Dönüştüren Adam

ATT

Eğitim Kariyer

ATT Nedir? Acil Tıp Teknisyeninin Görevleri Nelerdir?

Başarı Kariyer

Apple’da Çalışan Türk Makine Mühendisi: Mert Onay

cryptocurrency

Staj ya da İş Ararken En Çok Yapılan 5 Hata

Her Liderin Sözlüğünden Çıkarması Gereken 3 Kelime

Patronun Senin İşini Yapabiliyorsa, İş Yerinde Mutlu Olma Olasılığın Daha Yüksek

4 Adımda Networking’i Sevmeyi Öğrenmek

Kariyer Uncategorized @tr

En Popüler 40 İngilizce Mülakat Sorusu

Çıraklıktan CEO’luğa Uzanan Başarı Hikayesi

Başarı Kariyer

Üniversiteden sonra işsiz kalmamak için mezun olmadan yapmanız gerekenler

Dikkat! Kariyer Tercihinizi Yaparken Bu 8 Hataya Düşmeyin

İş Hayatında Fark Yaratacak ve Sizi Başarıya Taşıyacak 10 İpucu

İlerleyen Yaşlarına Rağmen Kariyer Değişikliği Yaparak Başarıya Ulaşmış 11 İnsan

En zayıf yönünüz

En Zayıf Yönünüz: Mülakatları Kendi Lehinize Çevirin