Bilgisayar görüşü

22+ Bilgisayarla Görme için En Çok Aranan Açık Kaynak Veri Kümeleri

Bir AI algoritması, yalnızca onu beslediğiniz veriler kadar iyidir.

Bu ne cesur ne de alışılmadık bir ifadedir. AI, birkaç on yıl önce oldukça uzak görünebilirdi, ancak Yapay Zeka ve Makine Öğrenimi o zamandan beri çok uzun bir yol kat etti.

Bilgisayar görüşü bilgisayarların etiketleri ve görüntüleri anlamasına ve yorumlamasına yardımcı olur. Bilgisayarınızı doğru türde görüntüler kullanarak eğittiğinizde, çeşitli yüz özelliklerini algılama, anlama ve tanımlama, hastalıkları tespit etme, otonom araçları kullanma ve ayrıca çok boyutlu organ tarama kullanarak hayat kurtarma becerisi kazanabilir.

Bilgisayarla Görme Pazarının ulaşacağı tahmin ediliyor $ XMUMX Milyar 2028'de 7.04 Milyar Dolar'dan 2020'e kadar, 45.64 ile 2021 arasında %2028'lük bir CAGR'de büyüyor.

Bilgisayarla görmenin kullanım durumlarından bazıları şunlardır:

  • Tıbbi görüntüleme
  • Otonom araç
  • Yüz ve nesne tanıma
  • kusur tanımlama
  • Sahne algılama

The görüntü veri kümesi Yapay Zeka projenizin başarısı için Makine Öğrenimi ve bilgisayarla görme görevlerinizi besliyor ve eğitiyorsunuz. Kaliteli bir veri seti elde etmek oldukça zordur. Projenizin karmaşıklığına bağlı olarak, bilgisayarla görü amaçları için güvenilir ve ilgili veri kümelerinin elde edilmesi birkaç gün ile birkaç hafta arasında sürebilir.

Burada size hemen kullanabileceğiniz bir dizi açık kaynaklı veri seti (kolaylığınız için kategorize edilmiş) sunuyoruz.

Bilgisayarla Görme Veri Kümelerinin Kapsamlı Listesi

Genel:

  1. IMAGEnet (Bağlantı)

    ImageNet yaygın olarak kullanılan bir veri kümesidir ve 1.2 kategoriye ayrılmış 1000 milyon şaşırtıcı görüntüyle birlikte gelir. Bu veri seti WorldNet hiyerarşisine göre düzenlenmiştir ve eğitim verileri, görüntü etiketleri ve doğrulama verileri olmak üzere üç bölüme ayrılmıştır.

  2. Kinetik 700 (Bağlantı)

    Kinetics 700, 650,000 farklı insan eylemi sınıfından oluşan 700'den fazla klip içeren yüksek kaliteli devasa bir veri kümesidir. Sınıf eylemlerinin her birinin yaklaşık 700 video klibi vardır. Veri setindeki klipler, insan-nesne ve insan-insan etkileşimlerine sahiptir ve bu etkileşimler, videolardaki insan eylemlerini tanırken oldukça yardımcı olmaktadır.

  3. Cifar-10 (Bağlantı)

    CIFAR 10, on farklı sınıfı temsil eden 60000 32 x 32 renkli görüntüye sahip en büyük bilgisayarlı görme veri setlerinden biridir. Her sınıf, bilgisayarla görme algoritmalarını ve makine öğrenimini eğitmek için kullanılan yaklaşık 6000 görüntüye sahiptir.

Yüz tanıma:

Yüz tanıma

  1. Vahşi Doğada Etiketlenmiş Yüzler (Bağlantı)

    Labeled Faced in the Wild, internetten tespit edilen yaklaşık 13,230 kişinin 5,750'dan fazla görüntüsünü içeren devasa bir veri kümesidir. Bu yüz veri seti, kısıtlamasız yüz algılamayı incelemeyi kolaylaştırmak için tasarlanmıştır.

  2. CASIA WebYüzü (Bağlantı)

    CASIA Web yüzü, makine öğrenimine ve sınırsız yüz tanıma konusunda bilimsel araştırmalara yardımcı olan iyi tasarlanmış bir veri kümesidir. Neredeyse 494,000 gerçek kimliğin 10,000'den fazla görüntüsü ile yüz tanıma ve doğrulama görevleri için idealdir.

  3. UMD Yüzleri Veri Kümesi (Bağlantı)

    UMD, durağan görüntüler ve video kareleri olmak üzere iki bölümden oluşan iyi açıklamalı bir veri kümesiyle karşı karşıyadır. Veri kümesinde 367,800'den fazla yüz açıklaması ve 3.7 milyon açıklamalı konu video karesi vardır.

Elyazısı tanıma:

  1. MNIST Veritabanı (Bağlantı)

    MNIST, 0'dan 9'a kadar el yazısı rakam örneklerini içeren bir veri tabanıdır ve 60,000 ve 10,000 eğitim ve test görüntüsüne sahiptir. 1999 yılında piyasaya sürülen MNIST, Derin Öğrenmede görüntü işleme sistemlerini test etmeyi kolaylaştırır.

  2. Yapay Karakterler Veri Kümesi (Bağlantı)

    Yapay Karakterler Veri Kümesi, adından da anlaşılacağı gibi, İngilizce dil yapısını on büyük harfle tanımlayan yapay olarak oluşturulmuş verilerdir. 6000'den fazla görüntü ile birlikte gelir.

AI Eğitim Verileri gereksiniminizi bugün tartışalım.

Nesne Algılama:

  1. MS COCO (Bağlantı)

    MS COCO veya Bağlamdaki Ortak Nesneler, bir nesne algılama ve resim yazısı veri kümesidir.

    Anahtar nokta algılama, çoklu nesne algılama, resim yazısı ve segmentasyon maskesi açıklamaları ile 328,000'den fazla görüntüye sahiptir. 80 nesne kategorisi ve resim başına beş resim yazısı ile birlikte gelir.

  2. LSUN(Bağlantı)

    Büyük Ölçekli Sahne Anlayışı'nın kısaltması olan LSUN, 20 nesne ve 10 sahne kategorisinde bir milyondan fazla etiketli görüntüye sahiptir. Bazı kategoriler, 300,000'ü doğrulama için özel olarak ve 300'i test verileri için olmak üzere 1000'e yakın görüntüye sahiptir.

  3. Ev Nesneleri(Bağlantı)

    Ev Nesneleri veri kümesi, mutfak, oturma odası ve banyo gibi evin her yerinden rastgele nesnelerin açıklamalı görüntülerini içerir. Bu veri kümesinde ayrıca test için tasarlanmış birkaç açıklamalı video ve 398 açıklamasız fotoğraf bulunmaktadır.

Otomotiv:

  1. şehir manzarası veri seti (Bağlantı)

    Cityscape, birkaç alıntının sokak sahnelerinden kaydedilmiş çeşitli video dizilerini ararken gidilecek veri setidir. Bu görüntüler uzun bir süre boyunca ve farklı hava ve ışık koşullarında çekildi. Ek açıklamalar, sekiz farklı kategoriye ayrılmış 30 görüntü sınıfı içindir.

  2. Barkley Derin Sürücü (Bağlantı)

    Barkley DeepDrive, otonom araç eğitimi için özel olarak tasarlanmıştır ve 100 binden fazla açıklamalı video dizisine sahiptir. Değişen yol ve sürüş koşullarına göre otonom araçlar için en faydalı eğitim verilerinden biridir.

  3. Akçaağaç (Bağlantı)

    Mapillary, dünya çapında 750 milyondan fazla sokak görüntüsüne ve trafik işaretine sahiptir ve bu, makine öğrenimi ve yapay zeka algoritmalarında görsel algı modellerinin eğitiminde çok faydalıdır. Çeşitli aydınlatma ve hava koşullarına ve bakış açılarına hitap eden otonom araçlar geliştirmenize olanak tanır.

Tıbbi Görüntüleme:

  1. Covid-19 Açık Araştırma Veri Kümesi (Bağlantı)

    Bu orijinal veri seti, AP/PA göğüs röntgenleri hakkında yaklaşık 6500 piksel poligonal akciğer segmentasyonuna sahiptir. Ek olarak, adı, konumu, kabul ayrıntılarını, sonucu ve daha fazlasını içeren etiketlerle birlikte Covid-517 hasta röntgenlerinin 19 görüntüsü mevcuttur.

  2. 100,000 Göğüs Röntgeni NIH Veritabanı (Bağlantı)

    NIH veritabanı, 100,000 göğüs röntgeni görüntüsü ve bilim ve araştırma topluluğu için yararlı olan ilgili verileri içeren, halka açık en kapsamlı veri kümelerinden biridir. İleri akciğer rahatsızlıkları olan hastaların görüntüleri bile var.

  3. Dijital Patoloji Atlası (Bağlantı)

    Dijital Patoloji Atlası, farklı organlara ait 17,000'e yakın açıklamalı slayttan toplamda 100'den fazla çeşitli histopatolojik yama görüntüsü sunar. Bu veri seti, bilgisayarla görme ve örüntü tanıma yazılımı geliştirmede kullanışlıdır.

Sahne Tanıma:

sahne tanıma

  1. İç Mekan Sahne Tanıma (Bağlantı)

    İç Mekan Sahne Tanıma, makine öğrenimi ve veri eğitiminde kullanılacak yaklaşık 15620 nesne ve iç mekan manzarası görüntüsü içeren yüksek düzeyde kategorize edilmiş bir veri kümesidir. 65'ten fazla kategoriyle birlikte gelir ve her kategoride en az 100 resim bulunur.

  2. xGörünüm (Bağlantı)

    Kamuya açık en iyi bilinen veri kümelerinden biri olan xView, çeşitli karmaşık ve büyük sahnelerden tonlarca açıklamalı tepeden görüntü içerir. Yaklaşık 60 sınıfa ve bir milyondan fazla nesne örneğine sahip olan bu veri kümesinin amacı, uydu görüntülerini kullanarak daha iyi afet yardımı sağlamaktır.

  3. Yerler (Bağlantı)

    MIT'nin katkıda bulunduğu bir veri seti olan Places, 1.8 farklı sahne kategorisinden 365 milyondan fazla görüntüye sahiptir. Bu kategorilerin her birinde doğrulama için yaklaşık 50 görüntü ve test için 900 görüntü vardır. Sahne tanıma veya görsel tanıma görevleri oluşturmak için derin sahne özelliklerini öğrenmek mümkündür.

Eğlence:

  1. IMDB WIKI Veri Kümesi (Bağlantı)

    IMDB - Wiki, yaş, cinsiyet ve isimlerle yeterince etiketlenmiş yüzlerin en popüler halka açık veritabanlarından biridir. Ayrıca Wikipedia'dan yaklaşık 20 bin ünlü ve 62 bin yüzü var.

  2. ünlü yüzler (Bağlantı)

    Celeb Faces, ünlülerin 200,000 açıklamalı görüntüsünü içeren büyük ölçekli bir veritabanıdır. Görüntüler arka plan gürültüsü ve poz varyasyonları ile birlikte gelir, bu da onları bilgisayarla görme görevlerindeki eğitim test setleri için değerli kılar. Yüz tanıma, düzenleme, yüz parçası lokalizasyonu ve daha fazlasında daha yüksek doğruluk elde etmek için oldukça faydalıdır.

Artık yapay zeka makinenizi beslemek için devasa bir açık kaynaklı görüntü veri kümeleri listeniz var. Yapay zeka ve makine öğrenimi modellerinizin sonucu, öncelikle onları beslediğiniz ve eğittiğiniz veri kümelerinin kalitesine bağlıdır. AI modelinizin doğru tahminler vermesini istiyorsanız, toplanmış, etiketlenmiş ve mükemmel şekilde etiketlenmiş kaliteli veri kümelerine ihtiyacı vardır. Bilgisayarlı görü sisteminizin başarısını artırmak için proje vizyonunuzla ilgili kaliteli görüntü veritabanlarını kullanmalısınız. Daha fazla bu tür veri kümeleri arıyorsanız Buraya Tıkla

sosyal paylaşım

Hoşunuza gidebilir