Derin öğrenme yıllardır teknolojide manşetlerde yer alıyor. Ve nedenini anlamak çok basit.
Yapay zekanın bu dalı, sağlıktan bankacılığa ve ulaşıma kadar uzanan sektörleri dönüştürerek daha önce düşünülemez ilerlemeler sağlıyor.
Derin öğrenme, büyük hacimli verilerden karmaşık kalıpları çıkarmayı ve tahmin etmeyi öğrenen bir dizi gelişmiş algoritma üzerine kuruludur.
Bu yazıda Evrişimli Sinir Ağlarından Üretken Düşman Ağlara ve Uzun Kısa Süreli Bellek ağlarına kadar en iyi 15 derin öğrenme algoritmasına bakacağız.
Bu gönderi, bir yeni başlayan veya derin öğrenme uzmanı.
1. Trafo Şebekeleri
Trafo şebekeleri dönüştü Bilgisayar görüşü ve doğal dil işleme (NLP) uygulamaları. Gelen verileri analiz ederler ve uzun vadeli ilişkileri yakalamak için dikkat süreçlerini kullanırlar. Bu, onları geleneksel diziden diziye modellerden daha hızlı hale getirir.
Trafo ağları ilk olarak Vaswani ve diğerleri tarafından "Dikkat Tek İhtiyacınız Olan" yayınında açıklanmıştır.
Bir kodlayıcı ve bir kod çözücüden (2017) oluşurlar. Transformatör modeli, aşağıdakiler de dahil olmak üzere çeşitli NLP uygulamalarında performans göstermiştir: duyguları analiz, metin sınıflandırması ve makine çevirisi.
Transformatör tabanlı modeller, uygulamalar için bilgisayarla görmede de kullanılabilir. Nesne tanıma ve görüntü altyazısı yapabilirler.
2. Uzun Kısa Süreli Bellek Ağları (LSTM'ler)
Uzun Kısa Süreli Bellek Ağları (LSTM'ler), sinir ağı sıralı girişi işlemek için özel olarak üretilmiştir. Uzun zaman önceki bilgileri hatırlayabildikleri ve gereksiz bilgileri de unutabildikleri için “uzun kısa vadeli” olarak adlandırılırlar.
LSTM'ler, ağ içindeki bilgi akışını yöneten bazı "kapılar" aracılığıyla çalışır. Bilginin önemli olup olmadığına bağlı olarak, bu kapılar içeri girmesine izin verebilir veya engelleyebilir.
Bu teknik, LSTM'lerin konuşma tanıma, doğal dil işleme ve zaman serisi tahmini gibi görevler için kritik olan geçmiş zaman adımlarındaki bilgileri hatırlamasını veya unutmasını sağlar.
LSTM'ler, değerlendirilmesi veya tahmin edilmesi gereken sıralı verilere sahip olduğunuz her durumda son derece faydalıdır. Genellikle ses tanıma yazılımlarında konuşulan kelimeleri metne dönüştürmek için kullanılırlar veya Borsa önceki verilere dayanarak gelecekteki fiyatları tahmin etmek için analiz.
3. Kendi Kendini Düzenleyen Haritalar (SOM'lar)
SOM'lar bir tür yapay öğrenebilen sinir ağı ve düşük boyutlu bir ortamda karmaşık verileri temsil eder. Yöntem, yüksek boyutlu girdi verilerini, girdi uzayının farklı bir bölümünü temsil eden her birim veya nöron ile iki boyutlu bir ızgaraya dönüştürerek çalışır.
Nöronlar birbirine bağlanır ve giriş verilerini öğrenmelerine ve bunlara uyum sağlamalarına izin veren bir topolojik yapı oluşturur. Dolayısıyla, SOM denetimsiz öğrenmeye dayanmaktadır.
Algoritmaya gerek yok etiketli veri den öğrenmek. Bunun yerine, değişkenler arasındaki modelleri ve korelasyonları keşfetmek için girdi verilerinin istatistiksel özelliklerini kullanır.
Eğitim aşamasında, nöronlar girdi verilerinin en iyi göstergesi olmak için yarışırlar. Ve anlamlı bir yapı içinde kendi kendilerine organize olurlar. SOM'lar, görüntü ve konuşma tanıma, veri madenciliği ve örüntü tanıma dahil olmak üzere çok çeşitli uygulamalara sahiptir.
onlar için yararlıdır karmaşık verileri görselleştirme, ilgili veri noktalarını kümeleme ve anormallikleri veya aykırı değerleri tespit etme.
4. Derin Takviyeli Öğrenme
Derin Takviye Öğrenme bir temsilcinin ödül sistemine dayalı kararlar vermek üzere eğitildiği bir tür makine öğrenimidir. Ajanın çevresiyle etkileşime girmesine ve deneme yanılma yoluyla öğrenmesine izin vererek çalışır.
Aracı, yaptığı her eylem için ödüllendirilir ve amacı, faydalarını zaman içinde nasıl optimize edeceğini öğrenmektir. Bu, ajanlara oyun oynamayı, otomobil kullanmayı ve hatta robotları yönetmeyi öğretmek için kullanılabilir.
Q-Learning, iyi bilinen bir Derin Güçlendirmeli Öğrenme yöntemidir. Belirli bir durumda belirli bir eylemi gerçekleştirmenin değerini değerlendirerek ve aracı çevre ile etkileşime girdikçe bu tahmini güncelleyerek çalışır.
Temsilci daha sonra hangi eylemin en büyük ödülle sonuçlanacağını belirlemek için bu tahminleri kullanır. Q-Learning, temsilcileri Atari oyunları oynama konusunda eğitmek ve veri merkezlerinde enerji kullanımını iyileştirmek için kullanıldı.
Deep Q-Networks, başka bir ünlü Derin Güçlendirmeli Öğrenme yöntemidir (DQN). DQN'ler, bir tablo yerine derin bir sinir ağı kullanarak eylem değerlerini tahmin etmeleri açısından Q-Learning'e benzer.
Bu, çok sayıda alternatif eylemle devasa, karmaşık ayarlarla başa çıkmalarını sağlar. DQN'ler, ajanları Go ve Dota 2 gibi oyunları oynamaları ve yürümeyi öğrenebilen robotlar yaratmaları için eğitmek için kullanılmıştır.
5. Tekrarlayan Sinir Ağları (RNN'ler)
RNN'ler, dahili bir durumu korurken sıralı verileri işleyebilen bir tür sinir ağıdır. Bunu, her kelimenin kendisinden önce gelenlere göre sindirildiği bir kitap okuyan bir kişiye benzer şekilde düşünün.
RNN'ler bu nedenle konuşma tanıma, dil çevirisi ve hatta bir sonraki kelimeyi tahmin etme gibi görevler için idealdir.
RNN'ler, her zaman adımının çıkışını bir sonraki zaman adımının girişine bağlamak için geri besleme döngüleri kullanarak çalışır. Bu, ağın gelecekteki zaman adımları için tahminlerini bildirmek üzere önceki zaman adımı bilgisini kullanmasını sağlar. Ne yazık ki, bu aynı zamanda, RNN'lerin, eğitim için kullanılan gradyanların çok küçük hale geldiği ve ağın uzun vadeli ilişkileri öğrenmek için mücadele ettiği, kaybolan gradyan sorununa karşı savunmasız olduğu anlamına gelir.
Bu bariz kısıtlamaya rağmen, RNN'ler çok çeşitli uygulamalarda kullanım alanı bulmuştur. Bu uygulamalar arasında doğal dil işleme, konuşma tanıma ve hatta müzik üretimi yer alır.
Google Translateörneğin, diller arasında çeviri yapmak için RNN tabanlı bir sistem kullanırken sanal asistan Siri, sesi algılamak için RNN tabanlı bir sistem kullanır. RNN'ler ayrıca hisse senedi fiyatlarını tahmin etmek ve gerçekçi metin ve grafikler oluşturmak için kullanılmıştır.
6. Kapsül Ağları
Kapsül Ağları, verilerdeki kalıpları ve korelasyonları daha etkin bir şekilde tanımlayabilen yeni bir tür sinir ağı tasarımıdır. Bir girdinin belirli yönlerini kodlayan "kapsüller" halinde nöronları düzenlerler.
Bu sayede daha doğru tahminlerde bulunabilirler. Kapsül Ağları, çok sayıda kapsül katmanı kullanarak girdi verilerinden aşamalı olarak karmaşık özellikler çıkarır.
Kapsül Ağları'nın tekniği, verilen girdinin hiyerarşik temsillerini öğrenmelerini sağlar. Kapsüller arasında iletişim kurarak bir resmin içindeki öğeler arasındaki uzamsal bağlantıları düzgün bir şekilde kodlayabilirler.
Nesne tanımlama, resim bölümleme ve doğal dil işleme, Kapsül Ağlarının tüm uygulamalarıdır.
Kapsül Ağları şu alanlarda kullanılma potansiyeline sahiptir: özerk sürüş teknolojiler. Otomobiller, insanlar ve trafik işaretleri gibi öğeleri tanıma ve ayırt etme konusunda sisteme yardımcı olurlar. Bu sistemler, nesnelerin ortamlarındaki davranışları hakkında daha kesin tahminler yaparak çarpışmaları önleyebilir.
7. Değişken Otomatik Kodlayıcılar (VAE'ler)
VAE'ler, denetimsiz öğrenme için kullanılan bir tür derin öğrenme aracıdır. Verileri daha düşük boyutlu bir alana kodlayarak ve ardından orijinal formata geri getirerek, verilerdeki kalıpları tespit etmeyi öğrenebilirler.
Bir tavşanı şapkaya ve sonra tekrar tavşana dönüştürebilen bir sihirbaz gibiler! VAE'ler, gerçekçi görseller veya müzik oluşturmak için faydalıdır. Ve orijinal verilerle karşılaştırılabilir yeni veriler üretmek için kullanılabilirler.
VAE'ler gizli kod kırıcıya benzer. Altta yatanı keşfedebilirler veri yapısı tıpkı bir bulmacanın nasıl parçalandığı gibi, onu daha basit parçalara bölerek. Parçaları ayırdıktan sonra orijinaline benzeyen yeni veriler oluşturmak için bu bilgileri kullanabilirler.
Bu, çok büyük dosyaları sıkıştırmak veya belirli bir tarzda yeni grafikler veya müzik üretmek için kullanışlı olabilir. VAE'ler ayrıca haber hikayeleri veya müzik sözleri gibi yeni içerikler üretebilir.
8. Üretici Düşman Ağları (GAN'lar)
GAN'lar (Generative Adversarial Networks), orijinaline benzeyen yeni veriler üreten bir derin öğrenme sistemi biçimidir. İki ağı eğiterek çalışırlar: bir üretici ve bir ayrımcı ağ.
Oluşturucu, orijinaliyle karşılaştırılabilir yeni veriler üretir.
Ayırıcı, orijinal ve oluşturulan verileri birbirinden ayırmaya çalışır. İki ağ, üreticinin ayrımcıyı aldatmaya çalışması ve ayrımcının orijinal verileri doğru bir şekilde tanımlamaya çalışmasıyla art arda eğitilir.
GAN'ları bir sahtekar ve bir dedektif arasında bir geçiş olarak düşünün. Jeneratör, bir sahteciye benzer şekilde çalışır ve orijinaline benzeyen yeni sanat eserleri üretir.
Ayrımcı, gerçek sanat eseri ile sahtecilik arasında ayrım yapmaya çalışan bir dedektif gibi hareket eder. İki ağ, üreticinin makul sahtekarlıklar yapmada gelişmesi ve ayrımcının bunları tanımada gelişmesiyle, tandem olarak eğitilmiştir.
GAN'ların gerçekçi insan veya hayvan resimleri üretmekten yeni müzik veya yazı oluşturmaya kadar çeşitli kullanımları vardır. Ayrıca, makine öğrenimi modellerini eğitmek için daha büyük bir veri kümesi oluşturmak üzere üretilen verileri gerçek verilerle birleştirmeyi içeren veri artırma için de kullanılabilirler.
9. Derin Q Ağları (DQN'ler)
Derin Q Ağları (DQN'ler), bir tür karar verme pekiştirmeli öğrenme algoritmasıdır. Belirli bir koşulda belirli bir eylemi gerçekleştirmenin beklenen ödülünü tahmin eden bir Q-fonksiyonu öğrenerek çalışırlar.
Q işlevi, algoritmanın çeşitli eylemleri denemesi ve sonuçlardan öğrenmesi ile deneme yanılma yoluyla öğretilir.
gibi düşün video oyunu çeşitli eylemleri deneyen ve hangisinin başarıya götürdüğünü keşfeden karakter! DQN'ler, derin bir sinir ağı kullanarak Q işlevini eğiterek, onları zor karar verme görevleri için etkili araçlar haline getirir.
Go ve satranç gibi oyunların yanı sıra robotik ve sürücüsüz otomobillerde insan şampiyonları bile yendiler. Sonuç olarak, DQN'ler zaman içinde karar verme becerilerini geliştirmek için deneyimlerden öğrenerek çalışır.
10. Radyal Temel Fonksiyon Ağları (RBFN'ler)
Radyal Temelli Fonksiyon Ağları (RBFN'ler), fonksiyonlara yaklaşmak ve sınıflandırma görevlerini gerçekleştirmek için kullanılan bir tür sinir ağıdır. Bir dizi radyal tabanlı fonksiyon kullanarak girdi verilerini daha yüksek boyutlu bir alana dönüştürerek çalışırlar.
Ağın çıktısı, temel fonksiyonların doğrusal bir kombinasyonudur ve her radyal temel fonksiyon, giriş uzayında bir merkez noktayı temsil eder.
RBFN'ler özellikle karmaşık girdi-çıktı etkileşimlerinin olduğu durumlar için etkilidir ve denetimli ve denetimsiz öğrenme de dahil olmak üzere çok çeşitli teknikler kullanılarak öğretilebilir. Finansal tahminlerden resim ve konuşma tanımaya ve tıbbi teşhise kadar her şey için kullanıldılar.
RBFN'leri, zorlu arazide yolunu bulmak için bir dizi bağlantı noktası kullanan bir GPS sistemi olarak düşünün. Ağın çıktısı, radyal temel işlevleri yerine getiren bağlantı noktalarının bir kombinasyonudur.
RBFN'leri kullanarak karmaşık bilgilere göz atabilir ve bir senaryonun nasıl sonuçlanacağına dair kesin tahminler üretebiliriz.
11. Çok Katmanlı Algılayıcılar (MLP'ler)
Sınıflandırma ve regresyon gibi denetimli öğrenme görevleri için çok katmanlı algılayıcı (MLP) adı verilen tipik bir sinir ağı biçimi kullanılır. Her bir katman gelen verileri doğrusal olmayan bir şekilde değiştirerek, birkaç bağlantılı düğüm veya nöron katmanını istifleyerek çalışırlar.
Bir MLP'de, her nöron bir alt katmandaki nöronlardan girdi alır ve bir üst katmandaki nöronlara bir sinyal gönderir. Her nöronun çıktısı, ağa doğrusal olmayanlık veren bir aktivasyon fonksiyonu kullanılarak belirlenir.
Birkaç gizli katmana sahip olabildikleri için girdi verilerinin karmaşık temsillerini öğrenme yeteneğine sahiptirler.
MLP'ler, duygu analizi, dolandırıcılık tespiti ve ses ve resim tanıma gibi çeşitli görevlere uygulanmıştır. MLP'ler, zor bir vakayı çözmek için birlikte çalışan bir grup araştırmacıya benzetilebilir.
Her birinin belirli bir uzmanlık alanı olmasına rağmen, birlikte gerçekleri bir araya getirebilir ve suçu çözebilirler.
12. Konvolüsyonel Sinir Ağları (CNN'ler)
Görüntüler ve videolar, bir tür sinir ağı olan evrişimli sinir ağları (CNN'ler) kullanılarak işlenir. Girdi verilerinden önemli özellikleri çıkarmak için bir dizi öğrenilebilir filtre veya çekirdek kullanarak çalışırlar.
Filtreler, görüntünün temel özelliklerini yakalayan bir özellik haritası oluşturmak için kıvrımlar yürüterek girdi resmi üzerinde kayar.
CNN'ler, resim özelliklerinin hiyerarşik temsillerini öğrenebildikleri için, çok büyük miktarda görsel veri içeren durumlar için özellikle yararlıdır. Nesne algılama, resim sınıflandırma ve yüz algılama gibi çeşitli uygulamalar bunlardan yararlanmıştır.
CNN'leri bir şaheser yaratmak için birkaç fırça kullanan bir ressam olarak düşünün. Her fırça bir çekirdektir ve sanatçı birçok çekirdeği karıştırarak karmaşık, gerçekçi bir görüntü oluşturabilir. CNN'leri kullanarak fotoğraflardan önemli özellikler çıkarabilir ve bunları görüntünün içeriğini doğru bir şekilde tahmin etmek için kullanabiliriz.
13. Derin İnanç Ağları (DBN'ler)
DBN'ler, boyut azaltma ve özellik öğrenme gibi denetimsiz öğrenme görevleri için kullanılan bir sinir ağı biçimidir. Girdi verilerini yeniden oluşturmayı öğrenebilen iki katmanlı sinir ağları olan Sınırlı Boltzmann Makinelerinin (RBM'ler) birkaç katmanını istifleyerek çalışırlar.
DBN'ler, girdinin derli toplu ve verimli bir temsilini öğrenebildikleri için yüksek boyutlu veri sorunları için çok faydalıdır. Ses tanımadan resim sınıflandırmaya ve ilaç keşfine kadar her şey için kullanıldılar.
Örneğin, araştırmacılar, ilaç adaylarının östrojen reseptörüne bağlanma afinitesini tahmin etmek için bir DBN kullandılar. DBN, kimyasal özelliklerin ve bağlanma afinitelerinin bir koleksiyonu üzerinde eğitildi ve yeni ilaç adaylarının bağlanma afinitesini doğru bir şekilde tahmin edebildi.
Bu, DBN'lerin ilaç geliştirmede ve diğer yüksek boyutlu veri uygulamalarında kullanımını vurgulamaktadır.
14. Otomatik kodlayıcılar
Otomatik kodlayıcılar, denetimsiz öğrenme görevleri için kullanılan sinir ağlarıdır. Girdi verilerini yeniden yapılandırmaları amaçlanır, bu da bilgileri kompakt bir gösterime kodlamayı öğrenecekleri ve ardından orijinal girdiye geri kodunu çözmeyi öğrenecekleri anlamına gelir.
Otomatik kodlayıcılar, veri sıkıştırma, gürültü giderme ve anormallik tespiti için çok etkilidir. Otomatik kodlayıcının kompakt temsilinin denetimli bir öğrenme görevine beslendiği özellik öğrenimi için de kullanılabilirler.
Otomatik kodlayıcıları sınıfta not alan öğrenciler olarak düşünün. Öğrenci dersi dinler ve en alakalı noktaları özlü ve verimli bir şekilde not alır.
Daha sonra öğrenci notlarını kullanarak ders çalışabilir ve dersi hatırlayabilir. Öte yandan bir otomatik kodlayıcı, girdi verilerini, daha sonra anormallik tespiti veya veri sıkıştırma gibi farklı amaçlar için kullanılabilecek kompakt bir gösterime kodlar.
15. Sınırlı Boltzmann Makineleri (RBM'ler)
RBM'ler (Kısıtlı Boltzmann Makineleri), denetimsiz öğrenme görevleri için kullanılan bir tür üretken sinir ağıdır. Görünür bir katmandan ve gizli bir katmandan oluşurlar, her katmanda nöronlar birbirine bağlıdır, ancak aynı katman içinde değildir.
RBM'ler, eğitim verilerinin olasılığını optimize etmek için görünür ve gizli katmanlar arasındaki ağırlıkların değiştirilmesini gerektiren, kontrastlı sapma olarak bilinen bir teknik kullanılarak eğitilir. RBM'ler, öğrenilen dağılımdan örnek alarak eğitildikten sonra yeni veriler oluşturabilir.
Görüntü ve konuşma tanıma, işbirlikçi filtreleme ve anormallik algılama, RBM'leri kullanan uygulamaların tümü. Ayrıca, kullanıcı davranışından kalıpları öğrenerek özel öneriler oluşturmak için öneri sistemlerinde de kullanılmıştır.
RBM'ler, yüksek boyutlu verilerin kompakt ve verimli bir temsilini oluşturmak için özellik öğrenmede de kullanılmıştır.
Özet ve Ufukta Umut Veren Gelişmeler
Konvolüsyonel Sinir Ağları (CNN'ler) ve Tekrarlayan Sinir Ağları (RNN'ler) gibi derin öğrenme yöntemleri, en gelişmiş yapay zeka yaklaşımları arasındadır. CNN'ler resim ve ses tanımayı dönüştürürken, RNN'ler doğal dil işleme ve sıralı veri analizinde önemli ölçüde ilerlemiştir.
Bu yaklaşımların evrimindeki bir sonraki adımın, daha büyük ve daha karmaşık veri kümelerini analiz etmelerine olanak tanıyarak, yorumlanabilirliklerini ve daha az etiketlenmiş verilerden öğrenme yeteneklerini geliştirerek verimliliklerini ve ölçeklenebilirliklerini geliştirmeye odaklanması muhtemeldir.
Derin öğrenme, ilerledikçe sağlık, finans ve otonom sistemler gibi alanlarda atılımlara izin verme olasılığına sahiptir.
Yorum bırak