Yapay Zeka İçin Sizce Yeterince Datanız Var Mı?
Üreticiler yapay zeka çözümlerini üretim hatlarına entegre etmeye başladıkça, data kıtlığı büyük bir zorluk olarak karşılarına çıktı. Güçlü AI modellerini oluşturmak için milyarlarca kullanıcıdan gelen verilere sahip olan tüketici internet şirketlerinin aksine, üretimde büyük eğitim veri setleri toplamak çoğu zaman mümkün değil.
Örneğin, 6 Sigma uygulamalarının yaygın olarak benimsendiği otomotiv üretiminde, çoğu OEM ve Tier 1 tedarikçisi, milyon parça başına üç ila dört hatalı parçadan daha azına sahip olmaya çalışır. Bu hataların nadir olması, görsel kontrol modellerini eğitmek için yeterli hatalı ürün datasına sahip olmayı zorlaştırır.
Yakın tarihli bir MAPI (Üretkenlik ve Yenilik için Üreticiler İttifakı) anketinde, araştırmaya katılanların %58'i, yapay zeka çözümlerinin artmasının önündeki en önemli engelin veri kaynaklarının eksikliği olduğunu bildirdi.
Örneğin yapay zekanın bir uçak görselini tanımlaması için ne kadar veri tanımlanmalı?
Yapay zeka bu uçak görselini, bir helikopterden, bir kuştan veya bir uçurtmadan başarılı olarak ayırabilmesi için ne kadar veri oluşturmalı. Tüm verileri ekleyebilir miyiz? Veya eklememiz gerekir mi? Yapay zeka mühendisleri hiç durmadan bu soruların üstesinden gelmeye çalışıyor.
Peki endüstri aynı zamanda yapay zekanın küçük verilerle çalışmasını sağlayabilir mi?
Aslında, yapay zekadaki son gelişmeler bunu mümkün kılıyor. Üreticiler, yapay zeka projelerinin yalnızca düzinelerce veya daha az örnekle bile hayata geçmesine yardımcı olmak için küçük veri sorununu aşmak için aşağıdaki teknikleri ve teknolojileri kullanabilir:
Yapay veri üretimi, gerçek hayatta toplanması zor olan yeni görüntüleri sentezlemek için kullanılır. Bunu yapmak için değişken otomatik kodlayıcılar, alan rastgeleleştirme ve veri artırma gibi tekniklerdeki son gelişmeler kullanılabilir.
Aktarım öğrenimi, yapay zekanın yeterli miktarda verinin bulunduğu ilgili bir görevden öğrenmesini sağlayan ve ardından bu bilgiyi küçük veri görevini çözmeye yardımcı olmak için kullanan bir tekniktir. Örneğin, bir yapay zeka, çeşitli ürün ve veri kaynaklarından toplanan 1.000 göçük resminden çentik bulmayı öğrenir. Daha sonra bu bilgiyi, yalnızca birkaç çentik resmiyle belirli bir yeni üründeki çentikleri tespit etmek için aktarabilir.
Kendi kendine denetimli öğrenme: Aktarım yoluyla öğrenmeye benzer. Ancak elde edilen bilgi, biraz farklı bir görev çözülerek elde edilir ve daha sonra küçük veri problemine uyarlanır. Örneğin, çok sayıda OK görüntüsü alabilir ve temel modele göre sıralanacak bulmaca benzeri bir filtreleme oluşturabilirsiniz. Bu yapay problemin çözülmesi, modeli küçük veri görevinde başlangıç noktası olarak kullanılabilecek alan bilgisi edinmeye zorlayacaktır.
Birkaç adımlı öğrenmede, yetersiz veri sorunu, AI sisteminin aynı hedefe ulaşırken daha kolay, daha az veriye ihtiyaç duyan bir kontrol görevi öğrenmesine yardımcı olmak için yeniden formüle edilir. Bu senaryoda, AI'ya her görevin yalnızca 10 (veya benzer şekilde az sayıda) örneğinin olduğu binlerce daha kolay denetim görevi verilir. Bu, yapay zekayı yalnızca küçük bir veri kümesine sahip olduğu için en önemli kalıpları tespit etmeyi öğrenmeye zorlar. Bundan sonra, bu AI'yı önemsediğiniz soruna maruz bıraktığınızda, sadece benzer sayıda örneği olan performansı, binlerce benzer küçük veri görevini görmüş olmasından faydalanacaktır.
Tek aşamalı öğrenme, sınıf başına öğrenmesi gereken örnek sayısının birkaç yerine bir olduğu (yukarıdaki örnekte olduğu gibi) birkaç adımlı öğrenmenin özel bir durumudur.
Anormallik tespitinde, AI sıfır kusur örneği ve yalnızca OK görüntülerinin örneklerini görür. Algoritma, OK görüntülerinden önemli ölçüde sapan her şeyi potansiyel bir sorun olarak işaretlemeyi öğrenir.
Elle kodlanmış bilgi, bir AI ekibinin denetim mühendisleriyle görüştüğü ve kurumsal bilgilerinin mümkün olduğu kadar çoğunu bir sisteme kodlamaya çalıştığı bir örnektir. Modern makine öğrenimi, insan bilgisinden ziyade verilere dayanan sistemlere yöneliyor, ancak veriler mevcut olmadığında, yetenekli AI ekipleri bu bilgiden yararlanan makine öğrenimi sistemleri tasarlayabilir.
Döngüdeki insan, yukarıda listelenen teknikler daha fazla hata örneği oluşturmak için kullanılabilir. Ancak yapay zeka, bir etikete ne zaman güvenip güvenmediğini bilecek kadar akıllıdır ve bunu bir insan uzmana göstermeyi ve ikinci durumda onların kararlarına uymayı bilir. Bunu her yaptığında, aynı zamanda insandan da öğrenir, böylece zaman içinde çıktısında doğruluğu ve güveni artırır.
Üreticiler, bu yaklaşımların bir kombinasyonunu kullanarak, en az 10 örnek üzerinde eğitilmiş etkili görsel denetim modelleri oluşturabilir ve uygulayabilir. Küçük verilere sahip sistemler oluşturmak, yalnızca küçük veri kümelerinin mevcut olduğu milyonlarca kullanım örneğini aşmak için önemlidir. Üreticiler için bu, canlıya geçmek ve yapay zekadan pratik değer yaratmak için gereken zamanı, mühendislik çabasını ve verileri en aza indirir.