Bir AI algoritması, yalnızca onu beslediğiniz veriler kadar iyidir.
Bu ne cesur ne de alışılmadık bir ifadedir. AI, birkaç on yıl önce oldukça uzak görünebilirdi, ancak Yapay Zeka ve Makine Öğrenimi o zamandan beri çok uzun bir yol kat etti.
Bilgisayar görüşü bilgisayarların etiketleri ve görüntüleri anlamasına ve yorumlamasına yardımcı olur. Bilgisayarınızı doğru türden görüntü veri kümelerini kullanarak eğittiğinizde, çeşitli yüz özelliklerini algılama, anlama ve tanımlama, hastalıkları tespit etme, otonom araçları sürme ve ayrıca çok boyutlu organ taraması kullanarak hayat kurtarma yeteneği kazanabilir.
Bilgisayarla Görme Pazarının ulaşacağı tahmin ediliyor $ XMUMX Milyar 2028'de 7.04 Milyar Dolar'dan 2020'e kadar, 45.64 ile 2021 arasında %2028'lük bir CAGR'de büyüyor.
The görüntü veri kümesi Yapay Zeka projenizin başarısı için Makine Öğrenimi ve bilgisayarla görme görevlerinizi besliyor ve eğitiyorsunuz. Kaliteli bir veri seti elde etmek oldukça zordur. Projenizin karmaşıklığına bağlı olarak, bilgisayarla görü amaçları için güvenilir ve ilgili veri kümelerinin elde edilmesi birkaç gün ile birkaç hafta arasında sürebilir.
Burada, hemen kullanabileceğiniz bir dizi (kolaylığınız için kategorilere ayrılmış) açık kaynaklı görüntü veri kümesi sunuyoruz.
Bilgisayar Görüntüsü Modelinizi Eğitmek İçin Kapsamlı Görüntü Veri Kümeleri Listesi
Genel:
IMAGEnet
ImageNet yaygın olarak kullanılan bir veri kümesidir ve 1.2 kategoriye ayrılmış 1000 milyon şaşırtıcı görüntüyle birlikte gelir. Bu veri seti WorldNet hiyerarşisine göre düzenlenmiştir ve eğitim verileri, görüntü etiketleri ve doğrulama verileri olmak üzere üç bölüme ayrılmıştır.
Kinetik 700
Kinetics 700, 650,000 farklı insan eylemi sınıfından oluşan 700'den fazla klip içeren yüksek kaliteli devasa bir veri kümesidir. Sınıf eylemlerinin her birinin yaklaşık 700 video klibi vardır. Veri setindeki klipler, insan-nesne ve insan-insan etkileşimlerine sahiptir ve bu etkileşimler, videolardaki insan eylemlerini tanırken oldukça yardımcı olmaktadır.
Cifar-10
CIFAR 10, on farklı sınıfı temsil eden 60000 32 x 32 renkli görüntüye sahip en büyük bilgisayarlı görme veri setlerinden biridir. Her sınıf, bilgisayarla görme algoritmalarını ve makine öğrenimini eğitmek için kullanılan yaklaşık 6000 görüntüye sahiptir.
Oxford-IIIT Evcil Hayvan Görüntüleri Veri Seti
Evcil hayvan görüntü veri seti, sınıf başına 37 görüntü içeren 200 kategoriden oluşur. Bu görüntüler ölçek, poz ve aydınlatma açısından farklılık gösterir ve cins, baş ROI ve piksel düzeyinde trimmap segmentasyonu için açıklamalarla birlikte gelir.
Google'ın Açık Görselleri
Etkileyici 9 milyon URL ile bu, listedeki en büyük resim veri kümelerinden biridir ve 6,000 kategoride etiketlenmiş milyonlarca resim içerir.
Bitki Resimleri
Bu derleme, yaklaşık 1 türü kapsayan etkileyici 11 milyon bitki görüntüsünü içeren birden fazla görüntü veri setini içerir.
Yüz tanıma:
Vahşi Doğada Etiketlenmiş Yüzler
Labeled Faced in the Wild, internetten tespit edilen yaklaşık 13,230 kişinin 5,750'dan fazla görüntüsünü içeren devasa bir veri kümesidir. Bu yüz veri seti, kısıtlamasız yüz algılamayı incelemeyi kolaylaştırmak için tasarlanmıştır.
CASIA WebYüzü
CASIA Web yüzü, makine öğrenimine ve sınırsız yüz tanıma konusunda bilimsel araştırmalara yardımcı olan iyi tasarlanmış bir veri kümesidir. Neredeyse 494,000 gerçek kimliğin 10,000'den fazla görüntüsü ile yüz tanıma ve doğrulama görevleri için idealdir.
UMD Yüzleri Veri Kümesi
UMD, durağan görüntüler ve video kareleri olmak üzere iki bölümden oluşan iyi açıklamalı bir veri kümesiyle karşı karşıyadır. Veri kümesinde 367,800'den fazla yüz açıklaması ve 3.7 milyon açıklamalı konu video karesi vardır.
Yüz Maskesi Algılama
Bu veri seti, PASCAL VOC formatında sınırlayıcı kutularıyla birlikte, "maskeli", "maskesiz" ve "yanlış takılmış maske" olmak üzere üç sınıfa ayrılmış 853 görüntüyü içerir.
Feret
FERET (Yüz Tanıma Teknolojisi Veritabanı), 14,000'den fazla açıklamalı insan yüzü görüntüsünü içeren kapsamlı bir görüntü veri kümesidir.
Elyazısı tanıma:
MNIST Veritabanı
MNIST, 0'dan 9'a kadar el yazısı rakam örneklerini içeren bir veri tabanıdır ve 60,000 ve 10,000 eğitim ve test görüntüsüne sahiptir. 1999 yılında piyasaya sürülen MNIST, Derin Öğrenmede görüntü işleme sistemlerini test etmeyi kolaylaştırır.
Yapay Karakterler Veri Kümesi
Yapay Karakterler Veri Kümesi, adından da anlaşılacağı gibi, İngilizce dil yapısını on büyük harfle tanımlayan yapay olarak oluşturulmuş verilerdir. 6000'den fazla görüntü ile birlikte gelir.
Nesne Algılama:
MS COCO
MS COCO veya Bağlamdaki Ortak Nesneler, bir nesne algılama ve resim yazısı veri kümesidir.
Anahtar nokta algılama, çoklu nesne algılama, resim yazısı ve segmentasyon maskesi açıklamaları ile 328,000'den fazla görüntüye sahiptir. 80 nesne kategorisi ve resim başına beş resim yazısı ile birlikte gelir.
LSUN
Büyük Ölçekli Sahne Anlayışı'nın kısaltması olan LSUN, 20 nesne ve 10 sahne kategorisinde bir milyondan fazla etiketli görüntüye sahiptir. Bazı kategoriler, 300,000'ü doğrulama için özel olarak ve 300'i test verileri için olmak üzere 1000'e yakın görüntüye sahiptir.
Ev Nesneleri
Ev Nesneleri veri kümesi, mutfak, oturma odası ve banyo gibi evin her yerinden rastgele nesnelerin açıklamalı görüntülerini içerir. Bu veri kümesinde ayrıca test için tasarlanmış birkaç açıklamalı video ve 398 açıklamasız fotoğraf bulunmaktadır.
Otomotiv:
şehir manzarası veri seti
Cityscape, birkaç alıntının sokak sahnelerinden kaydedilmiş çeşitli video dizilerini ararken gidilecek veri setidir. Bu görüntüler uzun bir süre boyunca ve farklı hava ve ışık koşullarında çekildi. Ek açıklamalar, sekiz farklı kategoriye ayrılmış 30 görüntü sınıfı içindir.
Barkley Derin Sürücü
Barkley DeepDrive, otonom araç eğitimi için özel olarak tasarlanmıştır ve 100 binden fazla açıklamalı video dizisine sahiptir. Değişen yol ve sürüş koşullarına göre otonom araçlar için en faydalı eğitim verilerinden biridir.
Akçaağaç
Mapillary, dünya çapında 750 milyondan fazla sokak görüntüsüne ve trafik işaretine sahiptir ve bu, makine öğrenimi ve yapay zeka algoritmalarında görsel algı modellerinin eğitiminde çok faydalıdır. Çeşitli aydınlatma ve hava koşullarına ve bakış açılarına hitap eden otonom araçlar geliştirmenize olanak tanır.
Tıbbi Görüntüleme:
Covid-19 Açık Araştırma Veri Kümesi
Bu orijinal veri seti, AP/PA göğüs röntgenleri hakkında yaklaşık 6500 piksel poligonal akciğer segmentasyonuna sahiptir. Ek olarak, adı, konumu, kabul ayrıntılarını, sonucu ve daha fazlasını içeren etiketlerle birlikte Covid-517 hasta röntgenlerinin 19 görüntüsü mevcuttur.
100,000 Göğüs Röntgeni NIH Veritabanı
NIH veritabanı, 100,000 göğüs röntgeni görüntüsü ve bilim ve araştırma topluluğu için yararlı olan ilgili verileri içeren, halka açık en kapsamlı veri kümelerinden biridir. İleri akciğer rahatsızlıkları olan hastaların görüntüleri bile var.
Dijital Patoloji Atlası
Dijital Patoloji Atlası, farklı organlara ait 17,000'e yakın açıklamalı slayttan toplamda 100'den fazla çeşitli histopatolojik yama görüntüsü sunar. Bu veri seti, bilgisayarla görme ve örüntü tanıma yazılımı geliştirmede kullanışlıdır.
Sahne Tanıma:
İç Mekan Sahne Tanıma
İç Mekan Sahne Tanıma, makine öğrenimi ve veri eğitiminde kullanılacak yaklaşık 15620 nesne ve iç mekan manzarası görüntüsü içeren yüksek düzeyde kategorize edilmiş bir veri kümesidir. 65'ten fazla kategoriyle birlikte gelir ve her kategoride en az 100 resim bulunur.
xGörünüm
Kamuya açık en iyi bilinen veri kümelerinden biri olan xView, çeşitli karmaşık ve büyük sahnelerden tonlarca açıklamalı tepeden görüntü içerir. Yaklaşık 60 sınıfa ve bir milyondan fazla nesne örneğine sahip olan bu veri kümesinin amacı, uydu görüntülerini kullanarak daha iyi afet yardımı sağlamaktır.
Yerler
MIT'nin katkıda bulunduğu bir veri seti olan Places, 1.8 farklı sahne kategorisinden 365 milyondan fazla görüntüye sahiptir. Bu kategorilerin her birinde doğrulama için yaklaşık 50 görüntü ve test için 900 görüntü vardır. Sahne tanıma veya görsel tanıma görevleri oluşturmak için derin sahne özelliklerini öğrenmek mümkündür.
Eğlence:
IMDB WIKI Veri Kümesi
IMDB - Wiki, yaş, cinsiyet ve isimlerle yeterince etiketlenmiş yüzlerin en popüler halka açık veritabanlarından biridir. Ayrıca Wikipedia'dan yaklaşık 20 bin ünlü ve 62 bin yüzü var.
ünlü yüzler
Celeb Faces, ünlülerin 200,000 açıklamalı görüntüsünü içeren büyük ölçekli bir veritabanıdır. Görüntüler arka plan gürültüsü ve poz varyasyonları ile birlikte gelir, bu da onları bilgisayarla görme görevlerindeki eğitim test setleri için değerli kılar. Yüz tanıma, düzenleme, yüz parçası lokalizasyonu ve daha fazlasında daha yüksek doğruluk elde etmek için oldukça faydalıdır.
Artık yapay zeka makinenizi beslemek için devasa bir açık kaynaklı görüntü veri kümeleri listeniz var. Yapay zeka ve makine öğrenimi modellerinizin sonucu, öncelikle onları beslediğiniz ve eğittiğiniz veri kümelerinin kalitesine bağlıdır. AI modelinizin doğru tahminler vermesini istiyorsanız, toplanmış, etiketlenmiş ve mükemmel şekilde etiketlenmiş kaliteli veri kümelerine ihtiyacı vardır. Bilgisayarlı görü sisteminizin başarısını artırmak için proje vizyonunuzla ilgili kaliteli görüntü veritabanlarını kullanmalısınız. Daha fazla bu tür veri kümeleri arıyorsanız Buraya Tıkla