Yaş İlerlemesi Çeşitliliği ile AB/BK Dışı Yüz Görüntüsü Veri Seti Oluşturma
Bilgisayarlı görüş modelleri için adaleti ve sağlamlığı güçlendirmek amacıyla 1,205 katılımcılı, zamana göre ayrılmış yüz görüntüsü gövdesi.
Projeye Genel Bakış
Güvenlik, kişiselleştirme ve kimlik deneyimleri için yüz merkezli yapay zeka geliştiren küresel bir teknoloji şirketi, önyargıyı azaltmak ve yaş, çevre ve aksesuarlar arasında model dayanıklılığını artırmak için zaman ayrımlı fotoğraflardan oluşan AB dışı/BK veri kümesi aradı.
Müşteri, Shaip ile ortaklık kurdu topla, düzenle ve doğrula Her katılımcının yakın tarihli ve eski fotoğraflarını paylaştığı geniş bir yüz görüntüsü topluluğu. Amaç, doğal yaş ilerlemesini kodlamak, aynı zamanda AB/BK dışı kökenleri sıkı bir şekilde uygulamak ve dengeli cinsiyet/yaş kotaları elde etmekti.
Anahtar İstatistikler
Katılımcılar
1,205 (Sadece AB/BK dışı, %50/50 cinsiyet ±10–15%)
Yaş Karışımı
%40 (10–29), %40 (30–49), %20 (50+) ±10–15% tolerans
Kapsam
Güney/Güneydoğu Asya, Kuzey ve Kuzey/Doğu Afrika, Singapur, Güney Amerika
Tarihçesi
19 hafta
Meydan Okumalar
Coğrafi kısıtlama
Yalnızca AB/BK dışındaki nüfustan kaynak alınarak, AB/BK'ya ait seyahat kaynaklı görsellerden kaçınılıyor.
Ölçekte dengeli kotalar
Sıkı cinsiyet ve yaş toleranslarıyla 1,205 katılımcıya ulaşıldı.
Zamanla ayrılmış kanıtlar
Her kimlikte yaş gruplarına uygun, hem güncel hem de geçmişe ait fotoğrafların yer almasını sağlamak.
Operasyonel kalite
Verimi yavaşlatmadan minimum görüntü/yüz boyutu, çeşitlilik ve çoğaltma sınırlarının uygulanması.
Çözüm
1. Ülke Panelleri ve Menşe Kontrolleri
kurduk ülke düzeyinde kaynak kapsülleri hedef bölgelerde ve eğitimli ortaklar arasında menşe kuralları (Yalnızca AB/BK dışı). Fotoğraflar, seyahat kaynaklı riskler açısından şu şekilde tarandı: meta veri ipuçları (yıl, konum belirteçleri) Ayrıca gönderici onayları, kalite kontrolünden önce AB/BK sızıntısını azaltır. Bu, Shaip'in aşağı akış verimini korumak için risk kontrollerini önceden yükleme konusundaki kanıtlanmış uygulamasını yansıtır.
2. Yaş İlerlemesi Yakalama Tasarımı
"20 resim isteyin" yerine, iki parçalı gönderim akışı katılımcıları şu şekilde yönlendirdi:
- A Parçası (Son): son iki yıla ait fotoğraflar;
- B Parçası (Tarihsel): Katılımcının gönderim anındaki yaş aralığına uygun daha eski fotoğraflar (örneğin, 2–10/15/20 yıllık pencereler).
Portal, kullanıcıları, fazla ayrıntıya girmeden çeşitliliği sağlamak için örneklerle (iç/dış mekan, açılar, aksesuarlar) dürttü.
3. Çeşitlilik Orkestrasyonu ve Kota Korumaları
A gerçek zamanlı kota panosu izlenen kayıtlar cinsiyet, yaş aralığı ve coğrafya, bir katman planlanan sınırlara ulaştığında alımı durdurdu. Bu, geç döngü yeniden çalışmasını engelledi ve Shaip'in standart yaklaşımını yansıttı. katmanlı kayıt + kilitlenmeler Önceki biyometrik veri kümelerinde dengeli bir temsil sağlamak için kullanılmıştır.
4. Kalite Süreci (Döngüdeki İnsan + Otomatik Ön Kontroller)
- Otomatik kapılar: yüz algılama + minimum boyut eşikleri, temel bulanıklık/gürültü kontrolleri ve potansiyel kopyaları erken işaretlemek için aynı gün kümeleme.
- İnsan QA katmanları: görüntü düzeyindeki incelemeciler tarafından doğrulandı konu ayrıcalığı (sadece birincil katılımcı), sahne/açı çeşitliliği, ve güzelleştirme filtresi yok; CQA denetçileri, kabulden önce partileri rastgele kontrol etti. çok katmanlı QA Shaip'in yayınladığı biyometrik veri programlarını yansıtıyor.
5. Uyumluluk ve Onay
kayıt ≥20 yaş İmzalı onamla; 20'den az vaka yalnızca veli onayıyla kabul edildi. Meta verilerde onay varlığını yakaladık ve gözden geçiren kontrol listelerini uyumlu hale getirdik. uygunluk + onay alanlar, denetlenebilirliği garanti altına alıyor.
6. Meta Veri ve İzlenebilirlik
teslim ettik katılımcı ve görüntü düzeyinde meta veriler (Kimlik bağlantıları, demografik bilgiler, uyruk/ikamet, fotoğraf yılı, gönderim tarihi, vb.) ve basitleştirmek için standartlaştırılmış alan adları aşağı akış etiketleme ve değerlendirmeBu, Shaip'in en iyi uygulamasını takip eder zengin meta veri etiketleme biyometrik veri kümeleri için.
7. Risk Ölçeğine Kademeli Teslimat
An 8 parti planı ile başladı 10 katılımcı kalibrasyonu 1. partiden sonra müşteri geri bildirimleri, ölçütlerde yapılan değişiklikleri bilgilendirdi ve ardından hacimler öngörülebilir dilimler halinde artırılarak 1,205 katılımcıları ~19 hafta içinde.
Proje kapsamı
| Boyut | Neler Sunduk |
|---|---|
| nüfus | Cinsiyet ve yaş aralıkları dengeli 1,205 AB/BK dışı katılımcı. |
| İçerik | Katılımcı başına ≥20 görüntü: Yaş ilerlemesini kodlamak için yakın + geçmiş; çeşitli sahneler, açılar ve aksesuarlar. |
| Kalite Operasyonları | Otomatik ön kontroller + insan çok katmanlı QA (tekrarlama kontrolleri; denek ayrıcalığı; filtre reddi). |
| Uygunluk | AB/BK dışı menşe doğrulaması; onay yönetimi ve uygunluk doğrulaması. |
| Metadata | İzlenebilirlik ve akış aşağısı ML değerlendirmesi için Katılımcı + görüntü nitelikleri. |
| Teslim Şekli | Kalibrasyonla başlayıp kararlı durum teslimatıyla son hedefe kadar 8 aşamalı parti. |
Sonuç
- Dengeli, denetime hazır korpus: Demografik kotalar tolerans sınırları içerisinde karşılandı; Uyumlu eğitim için tüm görsellerde AB/BK dışı menşe zorunluluğu getirildi.
- Modele hazır değişkenlik: Zamana göre ayrılmış görüntüler, farklı ortamlar/açı ve aksesuar kapsamı sağlamlık testini ve önyargı analizini destekler.
- Operasyonel öngörülebilirlik: Kalibrasyon ilk lansman + kota korumaları, yeniden çalışmayı azalttı ve zaman çizelgesini tam 1,205 katılımcı hedefine ulaştırdı.
- Aşağı akış verimliliği: Shaip'in biyometrik veri seti kılavuzlarını izleyerek zengin meta veriler ve tutarlı dosya hijyeni, açıklama ve kıyaslama oluşturma yolunu kısalttı.
Shaip, karmaşık bir AB dışı/BK yüz veri seti özetini dengeli ve denetime hazır bir yapıya dönüştürdü. Yaş ilerlemesi tasarımı ve kademeli kalite güvencesi, özgeçmiş ekibimize program riski olmadan güvenebileceğimiz temiz ve çeşitli veriler sağladı.