Perakende rafları için ürün tanıma sistemi oluştururken ilk mimari karar, sıfır eğitimli yaklaşım mı yoksa ince ayarlı model mi kullanılacağıdır. Her ikisinin de meşru kullanım alanları vardır, ancak doğruluk özellikleri, dağıtım zaman çizelgeleri, operasyonel yük ve toplam sahip olma maliyeti açısından önemli ölçüde farklılık gösterirler. Bu ödünleşimleri anlamak doğru seçimi yapmak için esastır.
İnce ayarlı modeller geleneksel denetimli öğrenme hattını izler. Çeşitli raf koşullarında her ürünün binlerce etiketli görselini toplar, eğitim ve doğrulama setlerine ayırır, bir evrişimli sinir ağı veya transformer tabanlı sınıflandırıcı eğitir, performansı değerlendirir ve modeli dağıtırsınız. Kataloğa yeni bir ürün eklendiğinde süreci tekrarlarsınız: yeni eğitim verisi toplayın, modeli yeniden eğitin, doğrulayın ve yeniden dağıtın. Bu döngü genellikle ürün güncellemesi başına iki ila dört hafta sürer.
Sıfır eğitimli modeller temelden farklı bir yaklaşım benimser. Belirli ürünleri sınıflandırmayı öğrenmek yerine, görsel özellikleri referans gömme vektörleriyle eşleştirmeyi öğrenirler. Her ürünün birkaç referans görselini yüklersiniz, model gömme vektörleri oluşturur ve çıkarım zamanında raf görselini tüm referans gömme vektörleriyle karşılaştırarak ürünleri tanımlar. Yeni ürün eklemek, referans görselleri yüklemek ve gömme vektörleri oluşturmak anlamına gelir; bu işlem haftalar yerine dakikalar sürer.
Doğruluk, karşılaştırmanın nüanslı hale geldiği yerdir. İnce ayarlı modeller genellikle eğitildikleri ürünlerde daha yüksek ilk-1 doğruluğu elde eder ve kontrollü koşullarda sıklıkla %96-99'a ulaşır. Ancak eğitimden sonra eklenen ürünlerde, alışılmadık raf konfigürasyonlarında veya ambalaj değişikliği olan ürünlerde doğrulukları önemli ölçüde düşer. İnce ayarlı model yalnızca eğitim verileri kadar iyidir ve perakende raf koşulları doğası gereği değişkendir.
Sıfır eğitimli modeller genellikle her koşulda %90-95 doğruluk elde eder ve çeşitli koşullarda daha tutarlı performans gösterir. Yeni ürünleri, ambalaj değişikliklerini ve alışılmadık mağaza ortamlarını bozulma olmadan işlerler çünkü ezberlenmiş sınıflandırmalar yerine görsel benzerliğe güvenirler. Sıklıkla yeni ürün lansman yapan, sınırlı süreli ambalaj çalıştıran veya çeşitli perakende formatlarında faaliyet gösteren FMCG şirketleri için bu tutarlılık, statik bir ürün setinde zirve doğruluğundan daha değerlidir.
Dağıtım hızı genellikle belirleyici faktördür. İnce ayarlı bir hat, veri toplama altyapısı, etiketleme iş akışları, GPU eğitim kümeleri, model versiyonlama, A/B test çerçeveleri ve aşamalı dağıtım prosedürleri gerektirir. İlk dağıtım üç ila altı ay sürebilir. Sonraki her ürün kataloğu güncellemesi iki ila dört hafta alır. Aylık ürün lansmanlarıyla yüzlerce SKU yöneten bir şirket için bu kalıcı bir operasyonel darboğaz oluşturur.
Sıfır eğitimli sistem günler içinde dağıtılır. Ürün kataloğu görsellerinizi yükleyin, gömme vektörleri oluşturun ve raf fotoğraflarını analiz etmeye başlayın. Yeni ürün lansman yaptığınızda referans görseller ekleyin ve sistem anında tanır. Eğitim kuyruğu yok, etiketleme ekibi yok ve model versiyonlama karmaşıklığı yok. Operasyonel yük bir mertebe daha düşüktür.
Çıkarım maliyeti ve gecikme de farklılık gösterir. İnce ayarlı sınıflandırıcılar genellikle çıkarım zamanında daha küçük ve hızlıdır çünkü yalnızca sınıflandırıcı üzerinden ileri geçiş yapmaları gerekir. Sıfır eğitimli modeller tüm referans gömme vektörlerine karşı benzerlik hesaplaması yapmalıdır ve bu katalog boyutuyla orantılıdır. Ancak modern gömme vektör dizinleri ve yaklaşık en yakın komşu araması, 50.000 SKU'luk kataloglar için bile bunu standart bulut altyapısında beş saniyenin altında çıkarım süreleriyle pratik hale getirir.
Hibrit yaklaşımlar, altyapıya yatırım yapmaya istekli kuruluşlar için her iki dünyanın da en iyisini sunar. Anında dağıtım ve geniş kapsam için sıfır eğitimli tanıma ile başlayabilir, ardından doğruluk farkının önemli olduğu yüksek değerli ürün kategorileri için özelleştirilmiş ince ayarlı modeller eğitebilirsiniz. Sıfır eğitimli model uzun kuyruk ürünleri ve yeni lansmanları işlerken, ince ayarlı modeller temel SKU'lar için premium doğruluk sağlar.
Uç cihaz dağıtımı sorusu başka bir boyut ekler. Tanımanın çevrimdışı senaryolar için cihaz üzerinde gerçekleşmesi gerekiyorsa, model boyutu önemlidir. İnce ayarlı modeller mobil donanımda verimli çalışacak şekilde damıtılabilir ve kuantize edilebilir. Büyük gömme vektör veritabanlarına sahip sıfır eğitimli modellerin cihaz üzerinde dağıtımı daha zorludur, ancak gömme vektör sıkıştırma ve hiyerarşik eşleştirme gibi teknikler bu açığı hızla kapatmaktadır.
Mühendislik perspektifinden bakım yükü önemli ölçüde farklılık gösterir. İnce ayarlı modeller, ürünler ve raf koşulları değiştikçe doğruluk sapması için sürekli izleme gerektirir. Veri toplama, etiketleme kalite güvencesi, yeniden eğitim tetikleyicileri ve kanarya dağıtımları için otomatik hatlar gerekir. Sıfır eğitimli modeller temiz, güncel bir referans görsel kataloğu sürdürmeyi gerektirir; bu operasyonel olarak daha basittir ancak yine de disiplin gerektirir.
FMCG dağıtımlarının çoğunluğu için önerimiz sıfır eğitimli tanıma ile başlamaktır. Dağıtım hızı, operasyonel basitlik ve ürün kataloğu genelinde tutarlı doğruluk, onu pragmatik seçim haline getirir. İnce ayarlama, %3-5'lik doğruluk priminin mühendislik yatırımını haklı kıldığı belirli kullanım durumları için ayrılmalıdır; örneğin her yanlış tanımlamanın önemli mali sonuçları olan üst düzey perakende ortakları için yüksek değerli uyumluluk denetimi gibi.
Karar nihayetinde operasyonel bağlamınız tarafından yönlendirilmelidir: ürün kataloğunuz ne sıklıkla değişiyor, perakende ortamlarınız ne kadar çeşitli, model operasyonlarına ne kadar mühendislik kaynağı ayırabilirsiniz ve ince ayarlamanın doğruluk primi dağıtım karmaşıklığını haklı kılıyor mu. FMCG raf tanıma kullanım durumlarının büyük çoğunluğu için sıfır eğitimli yaklaşım doğruluk, hız ve operasyonel basitliğin doğru dengesini sağlar.