Makine Öğrenimi Mühendisi Olmak | Adım 4: Uygulama, Uygulama, Uygulama

Temel makine öğrenme becerilerini hızlı bir şekilde toplamanın en iyi yöntemi, küçük, anlaşılması kolay veri kümeleriyle becerilerinizi geliştirmeye çalışmaktır. Bu teknik, işlemlerinizi excel veya WEKA'ya bakmanız için yeterince küçük, ilginç gerçek dünyadaki verileri kullanarak oluşturmanıza yardımcı olur. Bu makalede, zamanınızı sizin için önemli olan noktalara odaklamanıza yardımcı olacak bol miktarda veri seti ve bazı ipuçları içeren yüksek kaliteli bir veritabanı öğreneceksiniz!

Neden veri kümeleriyle pratik yapmalı?

Çevrimiçi derslerin ardından sizi herhangi bir sorunu çözmeyi NASIL öğrenemediğinizden büyümenizi sınırlayacak bağımlılıkta kalacaktır. Belirli bir probleme özel bir çözümü nasıl uygulayacağınızı öğreniyorsunuz. Hepimizin kötü gerçek dünya performansına yol açtığını bildiğimiz, aşırı donanımın eşdeğeri. Bir makine öğrenim mühendisi olmakla ilgileniyorsanız, gerçek verilere genelleştirebileceğinizden emin olmanız gerekir. Her gün kendinize sorun ve tanımlı bir işlemi kullanarak sorunlara saldırın. Veri setlerini kullanarak yeteneklerinizi uygulamak, bunu yapmanın en iyi yoludur.

Veri kümelerini nereden edinebilirim?

Neyse ki, herkes için, ücretsiz olarak erişebileceğiniz harika bir makine öğrenme problemleri havuzu var.

UCI Makine Öğrenim Deposu

Kaliforniya Üniversitesi'nde makine öğrenimi ve akıllı sistemler olan Irvine, UCI makine öğrenimi havuzunu inşa etti. 30 yıl boyunca, makine öğrenmesi araştırmacıları ve uygulama yapacak veri setlerine ihtiyaç duyan makine öğrenimi öğrencileri için gidilecek yer olmuştur. Mevcut tüm veri setlerini web sayfalarından indirebilirsiniz. Ayrıca, soruna neden olan araştırmacıları öğrenmek istediğinizde gerçekten yararlı olan, onu kullanan yayınlar da dahil olmak üzere tüm ayrıntılarını listeler. Veri setleri de birkaç farklı şekilde indirilebilir (CSV / TXT).

UCI veri kümelerinin sadece iki olumsuz tarafı vardır.

  1. Diğer bir dezavantajı, küçük olmalarıdır, böylece büyük ölçekli projelerde fazla tecrübe kazanmazsınız, ama bunun önemi yoktur çünkü çocuklar bu konuda yeni! Küçük başla!
  2. En önemli dezavantajı bu veri kümelerinin temizlenmiş ve önceden işlenmiş olmasıdır. Temizlik ve ön işleme, kariyerinizde karşılaşacağınız makine öğrenme sürecinin önemli parçalarıdır. Bu beceriyi uygulamak için zaman harcamak değil, daha sonra size yolunuza zarar verir.

Hedeflenen şekilde uygulama

Çok fazla veri kümesi olduğunda hedefli bir şekilde pratik yapma hakkında nasıl gidiyorsunuz? Kalkınan bir makine öğrenim mühendisi, amaçlarının ne olduğunu bulmak ve bu hedefe en iyi şekilde ulaşabilecek bir veri seti seçmek için elinden geleni yapacaktır. Veri kümelerinin sayısını daraltmak için kendi kendinize sorabileceğiniz bazı sorular geliştirdim.

  • Ne tür bir problem çözmek istiyorsun?
  • Regresyon, Sınıflandırma, Regresyon, Kümeleme?
  • Hangi büyüklükteki veri kümesi? Onlarca veri noktası veya milyonlarca
  • Veri setinin kaç özelliği vardır?
  • Ne Tür Özellikler?
  • Bu veri kümesi hangi etki alanından?

Daha geniş hedeflerinizle eşleştirmek için ne tür veri kümelerine odaklanmak istediğinizi belirleyin. Bunu yaptıktan sonra, platformda mevcut olan çok sayıda veri kümesini filtreleyebilmelisiniz.

Örnek Problemler

Ne öğrenmeye çalıştığınızdan tam olarak emin değilseniz endişelenmeyin. Mükemmel bir çalışma planı bulmaya çalışırken takılıp kalmamak çok daha iyi. İlginç bulabileceğiniz bazı veri setlerinin bir listesini yaptım. Burada birkaç tür sorun var bu yüzden hepsine bir şans verin.

Regresyon: http://archive.ics.uci.edu/ml/datasets/Wine+Quality

Kümeleme: https://archive.ics.uci.edu/ml/datasets/Bag+of+Words

Sınıflandırma: http://archive.ics.uci.edu/ml/datasets/Wine

Sağlık Sınıflandırması: https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Original%29

Fakat..

Bunun için yeteneklerim olduğunu düşünmüyorum ya da bir şeyin başlamamı engelliyor gibi hissediyorum
Zaman zaman kendinizden şüphe duymanız sorun değil, ancak bir makine öğrenimi mühendisi olma hedeflerinizden sizi durdurmasına izin veremezsiniz. Zihniyetinizi ayarlama zamanı.

Nasıl programlandığını bilmiyorum!
Sorun değil, çünkü “Makine Öğrenimi Mühendisi Olmak | 3. Adım: bir araç seçin, kullanmak için herhangi bir programlama becerisine ihtiyaç duymayan ve birçok Makine öğrenme algoritması uygulamanıza olanak tanıyan bir araç üzerinden geçer.

Sorunları çözme konusunda nereden başlamalıyım?
Herhangi bir soruna bakmanıza izin veren bir süreç çok önemlidir ve bu sürecin öğrenilmesinin geri yayılımın nasıl işlediğini öğrenmekten daha iyi olduğuna inanıyorum. Bir işlem seçme ile ilgili ayrıntılara girdiğim makaleme bakın Bir işlem seçme bağlantısı

Bunu yalnız yapabileceğimi sanmıyorum?
Makine öğrenmeyi kendiniz öğrenmek, öğrenmenin en iyi yolu değildir. Benzer düşünen bir grup gruba katılmak, öğrenebilme yeteneğine doğru harikalar yaratacaktır. Daha fazla bilgi için bu makaleye göz atın.

Paket servisi

Bireysel çalışma konusunda ciddiysen, daha fazla araştırmak istediğin mütevazı veri listesini oluşturmayı düşün. Daha karmaşık ve heyecan verici makine öğrenme problemlerine dalmak için değerli bir temel oluşturmak için hedeflenen uygulama planını takip edin.

Okuduğunuz için teşekkürler :) Eğer zevk aldıysanız, aşağıdaki alkış düğmesine basın ve beni takip edin! Benim için çok şey ifade eder ve bunun gibi daha fazla hikaye yazmaya teşvik ederdi.

Ayrıca Twitter, LinkedIn veya e-posta ile de bağlantı kuralım.