Makine Öğrenmesi

menu icon

Makine Öğrenmesi

Makine öğrenmesine yaptığımız bu giriş; tarihine, önemli tanımlarına, uygulamalarına ve işletmelerin günümüzdeki kaygılarına yönelik genel bir bakış sağlıyor.

Makine öğrenmesi nedir?

Makine öğrenmesi, insanların öğrenme şekillerini taklit etmek için veri ve algoritmaların kullanımına odaklanıp doğruluğunu kademeli olarak artıran bir yapay zeka (AI) ve bilgisayar bilimi dalıdır.

IBM, makine öğrenmesi konusunda zengin bir tarihe sahiptir. "Makine öğrenmesi" terimini ilk kez IBM'in içinden biri olan Arthur Samuel'in, dama oyunu ile ilgili olan araştırmasında (PDF, 481 KB) (bağlantı IBM dışındadır) kullandığı biliniyor. Uzman dama oyuncusu Robert Nealey, oyunu 1962 yılında bir IBM 7094 bilgisayarında oynamış ve bilgisayara karşı kaybetmiştir. Günümüzde mümkün olanlar düşünüldüğünde bu başarı neredeyse önemsiz gelebilir; ancak yapay zeka alanında önemli bir dönüm noktası olarak görülür. Önümüzdeki birkaç on yıl içinde, depolama ve işlem gücü etrafındaki teknolojik gelişmeler, Netflix'in tavsiye motoru veya sürücüsüz araçlar gibi günümüzde tanıdığımız ve sevdiğimiz bazı yenilikçi ürünleri mümkün kılacak.

Makine öğrenmesi, büyüyen veri birimi alanının önemli bir bileşenidir. İstatistiksel yöntemler kullanılarak, algoritmalar; sınıflandırmalar veya tahminler yapmak üzere eğitilir ve veri madenciliği projelerinde temel içgörüleri ortaya çıkarmaktadır. Bu içgörüler, sonrasında uygulamalar ve işler dahilinde karar verme sürecini teşvik ederek, ideal anlamda önemli büyüme ölçütlerini etkiler. Büyük veri genişleyip büyümeye devam ederken, veri mühendislerine yönelik piyasa talebi artacak ve bu mühendislerin en önemli iş sorularını ve nihayetinde bu sorulara yanıt vermek için kullanılacak verilerin tanımlanmasına yardımcı olmaları gerekecek.

Karşılaştırma: Makine Öğrenmesi ve Derin Öğrenme ve Nöral Ağlar

Derin öğrenme ve makine öğrenmesi genellikle birbirleri yerine kullanıldığından, ikisi arasındaki nüansları belirtmek önemlidir. Makine öğrenmesi, derin öğrenme ve nöral ağlar, yapay zekanın alt alanlarıdır. Ancak derin öğrenme aslında makine öğrenmesinin alt alanıdır ve nöral ağlar, derin öğrenmenin alt alanıdır.

Derin öğrenme ve makine öğrenmesinin birbirinden ayrıldığı nokta, algoritmalarının öğrenme şeklidir. Derin öğrenme, işlemin özellik ayıklama kısmını büyük ölçüde otomatikleştirir ve gerekli olan bazı manuel insan müdahalesini ortadan kaldırarak, daha büyük veri kümelerinin kullanılmasını sağlar. Derin öğrenmeyi, Lex Fridman'ın bu MIT dersinde (00:30) (bağlantı IBM dışındadır) belirttiği gibi, "ölçekenebilir makine öğrenmesi" olarak düşünebilirsiniz. Klasik veya "derin olmayan", makine öğrenmesi, öğrenmek için insan müdahalelerine daha bağımlıdır. İnsan uzmanlar, genellikle öğrenmek için daha fazla yapılandırılmış veriye ihtiyaç duyarak, veri girişleri arasındaki farkları anlamak amacıyla bir dizi özellik belirler.

"Derin" makine öğrenmesi, algoritmasını bilgilendirmek için gözetimli öğrenme olarak da bilinen etiketli veri kümelerinden faydalanabilir; ancak bu öğrenme türü için mutlaka bir etiketli veri kümesine ihtiyaç yoktur. Derin makine öğrenmesi, yapılandırılmamış verileri ham halinde (ör. metin, görseller) bünyesine katabilir ve farklı veri kategorilerini birbirinden ayıran özellik kümelerini otomatik olarak belirleyebilir. Makine öğrenmesinin aksine, veri işlemek için insan müdahalesi gerektirmeyerek, makine öğrenmesini daha ilginç şekilde ölçeklememize olanak tanır. Derin öğrenme ve nöral ağlar öncelikle bilgisayar görüşü, doğal dil işleme ve konuşma tanıma gibi alanlarda kaydedilen ilerlememenin hızlanmasının sebebi olarak görülmektedir.

Nöral ağlar ya da yapay nöral ağlar (ANN'ler); bir giriş katmanı, bir veya birden fazla gizli katman ve bir çıkış katmanı içeren düğüm katmanlarından oluşur. Her düğüm ya da yapay nöron birbirine bağlanır ve ilişkili bir ağırlığa ve eşiğe sahiptir. Üstteki herhangi bir bireysel düğümün çıkışı belirtilen eşik değerin üzerindeyse, bu düğüm aktifleşir ve sonraki ağ katmanına veri gönderir. Aksi takdirde, sonraki ağ katmanına veri gönderilmez. Derin öğrenmenin "derin" kısmı, sadece bir nöral ağdaki katmanların derinliğine atıfta bulunur. Üçten fazla katmandan oluşan -girişleri ve çıkışı bünyesinde barındıran- bir nöral ağ, bir derin öğrenme algoritması veya derin nöral ağ olarak görülebilir. Sadece iki veya üç katmana sahip bir nöral ağ, temel bir nöral ağdır.

Farklı kavramların birbiriyle olan ilişkisini daha derinlemesine incelemek için "AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?" blog gönderisine bakın.

Makine öğrenmesi nasıl çalışır?

UC Berkeley (bağlantı IBM dışındadır) bir makine öğrenmesi algoritmasının öğrenme sistemini üç ana bölüme ayırır.

  1. Bir Karar Süreci: Genel olarak, makine öğrenmesi algoritmaları bir tahmin ya da sınıflandırma yapmak için kullanılır. Etiketli ya da etiketsiz olabilecek bazı giriş verilerine dayanarak, algoritmanız verilerdeki bir kalıpla ilgili bir tahmin üretecektir.
  2. Bir Hata İşlevi: Bir hata işlevi, modelin tahminini değerlendirmek için kullanılır. Bilinen örnekler varsa, bir hata işlevi, modelin doğruluğunu değerlendirmek için bir kıyaslama yapabilir.
  3. Bir Model Optimizasyonu Süreci: Model, eğitim kümesindeki veri noktalarına daha iyi uyuyorsa, bu durumda ağırlıklar bilinen örnek ve model tahmini arasındaki çelişkiyi azaltmak üzere düzenlenir. Algoritma, bu değerlendirmeyi tekrarlayıp süreci eniyileyerek, bir doğruluk eşiğine ulaşılana denk ağırlıkları otonom bir şekilde günceller.

Makine öğrenmesi yöntemleri

Makine öğrenmesi sınıflandırıcıları üç ana kategoriye ayrılır.

Gözetimli makine öğrenmesi

Aynı zamanda gözetimli makine öğrenmesi olarak da bilinen gözetimli öğrenme, verileri sınıflandırmak ve sonuçları doğru bir şekilde tahmin eden algoritmaları eğitmek için etiketli veri kümelerini kullanması şeklinde tanımlanır. Girdi verileri modele aktarıldıkça, model, uygun hale getirilene dek ağırlıklarını düzenler. Bu modelin aşırı uyum ya da yetersiz uyumdan kaçınmasını sağlamaya yönelik bir çapraz doğrulama sürecinin bir parçası olarak gerçekleşir. Gözetimli öğrenme, tıpkı gelen kutunuzda istenmeyen e-postaların ayrı bir klasörde tutulması gibi, kuruluşların gerçek zamanlı sorunları ölçekli olarak çözmelerine yardımcı olur. Gözetimli öğrenmede kullanılan yöntemler arasında; nöral ağlar, naïve Bayes, doğrusal regresyon, lojistik regresyon, rastgele orman, destek vektörü makinesi (SVM) gibi yöntemler yer alır.

Gözetimsiz makine öğrenmesi

Gözetimsiz öğrenme, denetimsiz makine öğrenmesi olarak da bilinen, makine öğrenmesi algoritmalarını çözümlemek ve etiketsiz veri kümelerini kümelemek için kullanır. Bu algoritmalar, insan müdahalesine gerek olmadan saklı kalıpları veya veri gruplamalarını keşfederler. Bilgi içindeki benzerlikleri ve farklılıkları keşfetme yeteneği; bu algoritmayı, keşif amaçlı veri analizi, çapraz satış stratejileri, müşteri segmentasyonu, görüntü ve kalıp tanıma için ideal bir çözüm haline getirir. Aynı zamanda bir modeldeki özellik sayısını, boyutluluk azaltma yoluyla düşürmek için de kullanılır; birincil bileşen analizi (PCA) ve tekil değer ayrıştırma (SVD) buna yönelik iki yaygın yaklaşımdır. Gözetimsiz öğrenmede kullanılan diğer algoritmalardan bazıları nöral ağlar, k-ortalamalar kümesi, olasılıklı kümeleme yöntemleri vb. şeklindedir.

Yarı gözetimli öğrenme

Yarı gözetimli öğrenme, gözetimli ve gözetimsiz tür arasında bir orta yol sunar. Eğitim sırasında, daha geniş, etiketsiz bir veri kümesinden sınıflandırmaya ve özellik ayrıştırmaya yön vermek için daha küçük, etiketli bir veri kümesi kullanır. Yarı gözetimli öğrenme, gözetimli bir öğrenme algoritmasını eğitmek için yeterli etiketlenmiş veriye sahip olmama (veya yeterli miktarda veriyi etiketleyecek kapasitede olmama) sorununu çözebilir.

Bu yaklaşımlar arasında farklılıkları ayrıntılarıyla incelemek için "Supervised vs. Unsupervised Learning: What's the Difference?" başlıklı makaleye göz atın.

Pekiştirmeli makine öğrenmesi

Pekiştirmeli makine öğrenmesi, gözetimli öğrenmeyle benzerlik gösteren, ancak algoritmanın basit veri kullanılarak eğitilmediği bir davranışsal makine öğrenmesi modelidir. Bu model, deneme yanılma yöntemiyle öğrenir. Belirli bir sorun için en iyi öneriyi ya da ilkeyi geliştirmek üzere başarılı sonuçlar dizisi pekiştirilir.

2011'de Jeopardy! kazananı olan IBM Watson® buna iyi bir örnek. Sistem bir yanıt (veya duruma göre soru) verilip verilmeyeceğine, panoda hangi karenin seçileceğine ve özellikle çifte bahislerde, ne kadar bahse girileceğine karar vermek için pekiştirmeli öğrenmeyi kullandı.

Pekiştirmeli öğrenmeyle ilgili daha fazla bilgi edinin.

Gerçek dünyadan makine öğrenmesi kullanım senaryoları

Günlük yaşamda karşılaşabileceğiniz birkaç makine öğrenmesi örneği:

Konuşma Tanıma: Otomatik konuşma tanıma (ASR), bilgisayar konuşma tanıma ya da metne dönüştürülen konuşma olarak da bilinir ve insan konuşmasını yazılı bir biçimde işlemek için doğal dil işlemeden (NLP) faydalanan bir yetenektir. Birçok mobil cihaz, sesli arama yapmak için sistemlerine konuşma tanımayı dahil eder (örneğin, Siri) ya da mesajlaşma çerçevesinde daha fazla erişilebilirlik sağlar.

Müşteri Hizmetleri: Müşteri yolculuğunda, çevrimiçi konuşma robotları, insan temsilcilerin yerine geçiyor. Gönderim gibi konularla ilgili sık sorulan soruları (SSS) yanıtlıyorlar, kullanıcılar için kişisel tavsiye, çapraz satış ürünleri ya da beden önerileri veriyorlar ve web siteleri ve sosyal medya platformlarında müşteri etkileşimini düşünme şeklimizi değiştiriyorlar. Örnekler arasında, sanal temsilcilerle birlikte e-ticaret sitelerindeki mesajlaşma robotları, Slack ve Facebook Messenger gibi mesajlaşma uygulamaları yer alır ve görevler genellikle sanal asistanlar ve sesli asistanlar tarafından gerçekleştirilir.

Bilgisayar Görüşü: Bu yapay zeka teknolojisi, bilgisayar ve sistemlerin dijital görüntülerden, videolardan ve diğer görsel girdilerden anlamlı bilgiler elde etmesine olanak sağlıyor ve bu girdilere dayalı olarak eyleme geçebiliyor. Bu öneri sağlama yeteneği, onu resim tanıma görevlerinden ayırıyor. Gücünü evrişimli nöral ağlardan alan bilgisayar görüşü, sosyal medyada fotoğraf etiketleme, sağlık hizmetlerinde radyoloji görüntüleme ve otomotiv endüstrisinde sürücüsüz araçlar gibi alanlarda uygulanıyor.

Öneri Motorları: Geçmiş tüketim davranışı verilerini kullanarak, yapay zeka algoritmaları daha etkili çapraz satış stratejileri geliştirmek için kullanılabilecek veri eğilimlerini keşfetmeye yardımcı olabilir. Bu, çevrimiçi perakendeciler için sipariş tamamlama adımında müşterilere ilgili ek öneriler yapmak için kullanılır.

Otomatik hisse senedi alım satımı: Hisse senedi portföylerini optimize etmek için tasarlanmıştır, yapay zeka odaklı yüksek frekanslı ticaret platformları, insan müdahalesi olmadan günde binlerce ya da hatta milyonlarca alım satım işlemi yapar.

Makine öğrenmesinin zorlukları

Makine öğrenmesi teknolojisi ilerledikçe, hayatımızı kesinlikle kolaylaştırdı. Ancak, makine öğrenmesinin işletmelerde devreye alınması, yapay zeka teknolojilerine ilişkin bir dizi etik endişeyi beraberinde getirdi. Bunlardan bazıları şunlar:

Teknolojik Tekillik

Bu konu kamuoyunun dikkatini çok çekse de, çoğu araştırmacı, yapay zekanın yakın gelecekte insan zekasını geçme fikrinden endişe duymuyor. Bu ayrıca, süperzeka olarak da biliniyor. Nick Bostrum, süperzekayı şöyle tanımlıyor; "bilimsel yaratıcılık, genel bilgelik ve sosyal beceriler dahil kısaca her alanda en iyi insan beyinlerinin açık ara önünde olan zeka". Güçlü yapay zeka ve süperzekanın toplumda olması an meselesi olmasa da, sürücüsüz araçlar gibi otonom sistemlerin kullanımını düşündüğümüzde fikir olarak ilginç soruları ortaya koyuyor. Sürücüsüz bir aracın asla kaza yapmayacağını düşünmek gerçekçi değildir; ancak bu durumda sorumluluk ve yükümlülük kime ait olur? Otonom araçların peşinde olmaya devam mı etmeliyiz, ya da bu teknolojinin entegrasyonunu sürücüler arasında güvenliği teşvik eden yarı otomatik araçlar yaratacak şekilde sınırlamalı mıyız? Bu konuda henüz verilmiş bir karar yok; ancak bunlar, yeni ve yenilikçi yapay zeka teknolojisi geliştikçe ortaya çıkan etik tartışma türlerinden bazıları.

Yapay Zekanın İşler Üzerindeki Etkisi:

Yapay zekaya ilişkin kamuoyu algısının büyük bir kısmı iş kaybıyla ilgili olsa da, bu kaygıya muhtemelen farklı bir açıdan bakmak gerekiyor. Her aksatıcı ve yeni teknolojiyle, belirli iş rollerine ilişkin pazar talebinin değişiklik gösterdiğini görüyoruz. Örneğin, otomotiv endüstrisine baktığımızda, GM gibi birçok üretici yeşil girişimlerle uyumlu hale gelmek için elektrikli araç üretimine odaklanmak üzere değişiklikler yapıyor. Enerji endüstrisi bir yere gitmiyor, ama enerji kaynağı yakıt ekonomisinden elektrik enerjisine doğru kayıyor. Yapay zekanın, iş taleplerini diğer alanlara kaydıracak şekilde, benzer bir bakış açısıyla değerlendirilmesi gerekiyor. Veriler her gün büyüyüp değiştikçe, bu sistemlerin yönetimi için insanlara ihtiyaç duyulacak. Müşteri hizmetleri gibi, iş talebi değişikliklerinden etkilenmesi en muhtemel sektörlerdeki karmaşık sorunları ele almaya yönelik kaynak ihtiyacı devam edecek. Yapay zekanın ve iş pazarı üzerindeki etkisinin önemli yönü, insanların pazar talebi olan bu yeni alanlara geçiş yapmasına yardım etmek olacak.

Gizlilik:

Gizlilik, genellikle veri gizliliği, veri koruma ve veri güvenliği bağlamında tartışılır ve bu kaygılar, politika yapıcıların bu konuda son yıllarda yeni atılımlar yapmasına olanak tanımıştır. Örneğin 2016 yılında, Avrupa Birliği ve Avrupa Ekonomik Alanındaki kişilerin kişisel verilerini korumak amacıyla Genel Veri Koruma Yönetmeliği (GDPR) mevzuatı oluşturularak, kişilere verileri üzerinde daha fazla denetim tanındı. Amerika Birleşik Devletleri'nde, bazı eyaletler, işletmelerin veri toplama hakkında tüketicileri bilgilendirmesini gerektiren Kaliforniya Tüketici Gizlilik Yasası (CCPA) gibi politikalar geliştiriyor. Yakın zamandaki bu mevzuat, şirketleri kişileri tanımlamak için kullanılan verileri saklama ve kullanma konusunda yeniden düşünmeye zorladı. Bunun bir sonucu olarak, güvenlik alanındaki yatırımlar, gözetim, bilgisayar korsanlığı ve siber saldırılara ilişkin güvenlik açıklarını ve fırsatları ortadan kaldırma uğraşındaki şirketler için artan bir öncelik haline geldi.

Önyargı ve Ayrımcılık:

Bir dizi akıllı sistemde yanlılık ve ayrımcılık örnekleri, yapay zekanın kullanımı ile ilgili birçok etik sorunun ortaya çıkmasına neden oldu. Eğitim verilerinin kendisi önyargıya elverişliyken, önyargı ve ayrımcılığa karşı nasıl önlem alabiliriz? Şirketlerin otomasyon çabalarına yönelik niyetleri genelde iyi olsa da, Reuters (bağlantı IBM dışındadır), yapay zekayı işe alma uygulamalarına dahil etmenin öngörülemeyen sonuçlarından bazılarını vurguluyor. Bir süreci otomatikleştirme ve basitleştirme çabasında olan Amazon, açık teknik roller için potansiyel iş adaylarına cinsiyet açısından önyargılı davrandı ve nihayetinde, projeyi rafa kaldırmak zorunda kaldı. Bu tür olaylar ortaya çıkarken, Harvard Business Review (bağlantı IBM dışındadır), bir rol için aday değerlendirmesi yaparken hangi verilerin kullanılabileceği gibi, yapay zekanın işe alım sürecinde kullanımı konusunda başka isabetli soruları ortaya koydu.

Önyargı ve ayrımcılık, sadece insan kaynakları işleviyle sınırlı değil; yüz tanımlama yazılımlarından sosyal medya algoritmalarına bir dizi uygulamada görülebilir.

İş kolları yapay zekanın risklerinden daha çok haberdar oldukça, yapay zeka etiği ve değerler hakkındaki bu tartışmada daha da aktif hale geldi. Örneğin, IBM CEO'su Arvind Krishna, geçen yıl IBM'in genel amaçlı yüz tanıma ve analiz ürünlerini sonlandırdığını paylaşarak, "IBM'in, diğer satıcılar tarafından sunulan yüz tanıma teknolojileri dahil olmak üzere herhangi bir teknolojinin toplu izleme, ırksal profilleme, temel insan hak ve özgürlüklerinin ihlali veya IBM değerleri ve Güven ve Şeffaflık İlkeleri ile tutarlı olmayan herhangi bir amaçla kullanımına şiddetle karşı çıktığı ve onaylamadığı" vurgusunu yaptı.

Bu konuda daha fazla bilgi almak için, "Yüz Tanıma Teknolojisi İhracatlarının Kontrol Edilmesinde Hassas Reglaj Yaklaşımı" hakkındaki bakış açısını aktaran IBM ilkeleri bloğuna göz atın.

Hesap verebilirlik

Yapay zeka uygulamalarını düzenlemeye ilişkin önemli bir mevzuat olmadığından, etik yapay zeka kullanımını sağlamaya yönelik gerçek bir uygulama mekanizması yoktur. Şirketlerin bu yönergelere uymalarına yönelik mevcut teşvikler, özetle etik olmayan yapay zeka sisteminin olumsuz sonuçlarından ibarettir. Bu boşluğu doldurmak için, ahlakbilimciler ve araştırmacılar arasında, toplum içerisinde yapay zeka modellerinin oluşturulması ve dağıtımının yönetimine yönelik işbirliğinin bir parçası olarak, etik çerçeveler ortaya çıktı. Ancak şu anda bunlar sadece rehberlik ediyor ve araştırmaya (bağlantı IBM dışındadır) (PDF, 984 KB) göre, dağıtılmış sorumluluk ve olası sonuçlara yönelik öngörü eksikliğinin birleşimi, aslında toplumun zarar görmesini engellemeye yardımcı olmuyor.

IBM'in Yapay Zeka Etiği hakkındaki pozisyonu hakkında daha fazla bilgi için, buraya tıklayın.

Makine öğrenmesi ve IBM Cloud

IBM Watson Machine Learning, makine öğrenmesi yaşam döngüsünü uçtan ucan destekler. Makine öğrenmesi modellerini, verileriniz nerede olursa olsun oluşturmanızı ve hibrit çok bulutlu ortamınızda her yerde devreye almanızı sağlayan çeşitli ürünlerde sunulur.

IBM Cloud Pak for Data'daki IBM Watson Machine Learning, kurumsal veri bilimi ve yapay zeka ekiplerinin bulut tabanlı veriler ve yapay zeka platformunda yapay zekayı geliştirme ve devreye alma sürecini hızlandırmanıza yardımcı olur. IBM Cloud ortamında yönetilen bir hizmet olan IBM Watson Machine Learning Cloud, modelleri, masaüstünde deney aşamasından üretim iş yükleri için devreye alma aşamasına taşımanın en hızlı yoludur. Makine öğrenmesi devreye alımlarını ölçeklemek isteyen daha küçük çaplı ekipler için, IBM Watson Machine Learning Server özel veya genel bir bulutta basit kurulum olanağı sunar.

Başlangıç yapmak için bir IBMid için kaydolun ve IBM Cloud hesabınızı yaratın.