Bilgisayar görüşü

Projenizi Hızlandıracak Bilgisayar Görüntüsü için 31 Ücretsiz Görüntü Veri Seti [2025 Güncellendi]

Bir AI algoritması, yalnızca onu beslediğiniz veriler kadar iyidir.

Bu ne cesur ne de alışılmadık bir ifadedir. AI, birkaç on yıl önce oldukça uzak görünebilirdi, ancak Yapay Zeka ve Makine Öğrenimi o zamandan beri çok uzun bir yol kat etti.

Bilgisayarlı görüş, bilgisayarların etiketleri ve görüntüleri anlamasına ve yorumlamasına yardımcı olur. Bilgisayarınızı doğru türden görüntü veri kümelerini kullanarak eğittiğinizde, çeşitli yüz özelliklerini algılama, anlama ve tanımlama, hastalıkları tespit etme, otonom araçları sürme ve ayrıca çok boyutlu organ taraması kullanarak hayat kurtarma yeteneği kazanabilir.

Bilgisayarla Görme Pazarının ulaşacağı tahmin ediliyor 144.46 yılına kadar 2028 Milyar $ mütevazı bir 7.04'da 2020 Milyar Dolar, büyüyen bir 45.64 ve 2021 arasında CAGR %2028.

Makine Öğrenmesi ve bilgisayarlı görüş görevlerinizi beslediğiniz ve eğittiğiniz görüntü veri kümesi, AI projenizin başarısı için çok önemlidir. Kaliteli bir veri kümesi elde etmek oldukça zordur. Sağlam model eğitimi sağlamak ve gerçek dünya karmaşıklığını daha iyi yansıtmak için çeşitli görüntü koleksiyonları kullanmak esastır.

Projenizin karmaşıklığına bağlı olarak, bilgisayar görüşü amaçları için güvenilir ve ilgili veri kümeleri elde etmek birkaç günden birkaç haftaya kadar sürebilir. Çeşitli bilgisayar görüşü görevlerini ve gerçek dünya senaryolarını kapsayacak şekilde çeşitli veri kümeleri gereklidir. Araştırmacılar genellikle kapsamlı model değerlendirmesi sağlamak ve çok çeşitli uygulamaları desteklemek için araştırma amaçları için önemli bir veri kümesi ararlar.

Burada, hemen kullanabileceğiniz bir dizi (kolaylığınız için kategorilere ayrılmış) açık kaynaklı görüntü veri kümesi sunuyoruz.

Görüntü Veri Seti Görevleri: Sınıflandırma, Segmentasyon, Algılama ve Daha Fazlası

Görüntü veri kümeleri modern bilgisayar görüşünün omurgasıdır ve makinelerin görsel bilgileri yorumlamasını ve anlamasını sağlayan çok çeşitli görevlere güç verir. İster otonom araçlar için bir model oluşturuyor olun, ister yüz tanıma teknolojisi geliştiriyor olun veya tıbbi görüntü analizi üzerinde çalışıyor olun, doğru görüntü veri seti başarı için olmazsa olmaz bir araçtır.

Görüntü sınıflandırması en temel bilgisayar görüşü görevlerinden biridir. Bu süreçte, bir model içeriğine göre tüm bir görüntüye bir etiket atamayı öğrenir. Örneğin, bir görüntü sınıflandırma veri kümesi bir modelin kedi ve köpek görüntüleri arasında ayrım yapmasına veya farklı bitki türlerini tanımlamasına yardımcı olabilir. Bu görev, otomatik fotoğraf etiketleme, tıbbi görüntülerden hastalık teşhisi ve sahne kategorizasyon kıyaslamaları gibi uygulamalar için çok önemlidir.

Nesne algılama yalnızca bir görüntüdeki nesnelerin varlığını belirlemekle kalmayıp, sınırlayıcı kutular kullanarak konumlarını da belirleyerek işleri bir adım öteye taşır. Sınırlayıcı kutularla açıklamalı görüntüler içerenler gibi nesne algılama için veri kümeleri, otonom araçlarda yaya algılama, güvenlik gözetimi ve perakende analitiği gibi uygulamalar için hayati öneme sahiptir. Nesne algılama, gerçek dünya senaryoları için sağlam bilgisayarlı görüş algoritmaları geliştirmede de önemli bir bileşendir.

Anlamsal bölümleme bir görüntüdeki her pikseli belirli bir kategoriye sınıflandırmayı içerir ve sahnenin ayrıntılı bir anlayışını sağlar. Bu piksel düzeyindeki trimmap segmentasyonu, organların veya tümörlerin kesin olarak çizilmesinin gerektiği tıbbi görüntüleme gibi görevlerde ve yollar, kaldırımlar ve araçlar arasında ayrım yapmanın kritik olduğu otonom sürüş için kentsel ortamlarda özellikle önemlidir.

Bu temel görevlerin ötesinde, görüntü veri kümeleri ayrıca örnek segmentasyonunu (aynı sınıftaki bireysel nesneler arasında ayrım yapma), görüntü başlığı oluşturmayı (görüntüler için tanımlayıcı metin oluşturma) ve yüz tanımayı (görüntülerdeki insan yüzlerini tanımlama veya doğrulama) destekler. Bu bilgisayarlı görüş görevlerinin her biri, makine öğrenimi modellerini eğitmek ve doğrulamak için yüksek kaliteli, açıklamalı görüntülere güvenir.

Çeşitli ve iyi açıklamalı görüntü veri kümelerinden yararlanarak, veri bilimcileri ve makine öğrenimi uygulayıcıları görüntü tanıma ve sınıflandırma görevlerinden karmaşık segmentasyon ve tespit sorunlarına kadar çeşitli bilgisayar görüşü zorluklarının üstesinden gelebilir. Doğru veri kümesi yalnızca araştırma ve geliştirmeyi hızlandırmakla kalmaz, aynı zamanda bilgisayar görüşü sistemlerinin gerçek dünya uygulamalarında doğru bir şekilde performans göstermesini de sağlar.

Bilgisayar Görüntüsü Modelinizi Eğitmek İçin Kapsamlı Görüntü Veri Kümeleri Listesi

Genel:

  1. IMAGEnet

    ImageNet yaygın olarak kullanılan bir veri kümesidir ve 1.2 kategoriye ayrılmış 1000 milyon şaşırtıcı görüntüyle birlikte gelir. Bu veri seti WorldNet hiyerarşisine göre düzenlenmiştir ve eğitim verileri, görüntü etiketleri ve doğrulama verileri olmak üzere üç bölüme ayrılmıştır.

  2. Kinetik 700

    Kinetics 700, 650,000 farklı insan eylemi sınıfından oluşan 700'den fazla klip içeren yüksek kaliteli devasa bir veri kümesidir. Sınıf eylemlerinin her birinin yaklaşık 700 video klibi vardır. Veri setindeki klipler, insan-nesne ve insan-insan etkileşimlerine sahiptir ve bu etkileşimler, videolardaki insan eylemlerini tanırken oldukça yardımcı olmaktadır.

  3. Cifar-10

    CIFAR 10, on farklı sınıfı temsil eden 60000 32 x 32 renkli görüntüye sahip en büyük bilgisayarlı görme veri setlerinden biridir. Her sınıf, bilgisayarla görme algoritmalarını ve makine öğrenimini eğitmek için kullanılan yaklaşık 6000 görüntüye sahiptir.

  4. Oxford-IIIT Evcil Hayvan Görüntüleri Veri Seti

    Evcil hayvan görüntü veri seti, sınıf başına 37 görüntü içeren 200 kategoriden oluşur. Bu görüntüler ölçek, poz ve aydınlatma açısından farklılık gösterir ve cins, baş ROI ve piksel düzeyinde trimmap segmentasyonu için açıklamalarla birlikte gelir.

  5. Google'ın Açık Görselleri

    Etkileyici 9 milyon URL ile bu, listedeki en büyük resim veri kümelerinden biridir ve 6,000 kategoride etiketlenmiş milyonlarca resim içerir.

  6. Bitki Resimleri

    Bu derleme, yaklaşık 1 türü kapsayan etkileyici 11 milyon bitki görüntüsünü içeren birden fazla görüntü veri setini içerir.

  7. LSUN

    LSUN, çeşitli sahne ve nesne kategorilerinde milyonlarca etiketli görüntü içeren büyük ölçekli bir görüntü veri kümesidir. Veri kümesi, model değerlendirmesi için özel bir test kümesi içerir.

Yüz tanıma:

Yüz tanıma

  1. Vahşi Doğada Etiketlenmiş Yüzler

    Labeled Faced in the Wild, internetten tespit edilen yaklaşık 13,230 kişinin 5,750'dan fazla görüntüsünü içeren devasa bir veri kümesidir. Bu yüz veri seti, kısıtlamasız yüz algılamayı incelemeyi kolaylaştırmak için tasarlanmıştır.

  2. CASIA WebYüzü

    CASIA Web yüzü, makine öğrenimine ve sınırsız yüz tanıma konusunda bilimsel araştırmalara yardımcı olan iyi tasarlanmış bir veri kümesidir. Neredeyse 494,000 gerçek kimliğin 10,000'den fazla görüntüsü ile yüz tanıma ve doğrulama görevleri için idealdir.

  3. UMD Yüzleri Veri Kümesi

    UMD, durağan görüntüler ve video kareleri olmak üzere iki bölümden oluşan iyi açıklamalı bir veri kümesiyle karşı karşıyadır. Veri kümesinde 367,800'den fazla yüz açıklaması ve 3.7 milyon açıklamalı konu video karesi vardır.

  4. Yüz Maskesi Algılama

    Bu veri seti, PASCAL VOC formatında sınırlayıcı kutularıyla birlikte, "maskeli", "maskesiz" ve "yanlış takılmış maske" olmak üzere üç sınıfa ayrılmış 853 görüntüyü içerir.

  5. Feret

    FERET (Yüz Tanıma Teknolojisi Veritabanı), 14,000'den fazla açıklamalı insan yüzü görüntüsünü içeren kapsamlı bir görüntü veri kümesidir.

Elyazısı tanıma:

  1. MNIST Veritabanı

    MNIST, 0'dan 9'a kadar el yazısı rakam örneklerini içeren bir veri tabanıdır ve 60,000 ve 10,000 eğitim ve test görüntüsüne sahiptir. 1999 yılında piyasaya sürülen MNIST, Derin Öğrenmede görüntü işleme sistemlerini test etmeyi kolaylaştırır.

  2. Yapay Karakterler Veri Kümesi

    Yapay Karakterler Veri Kümesi, adından da anlaşılacağı gibi, İngilizce dil yapısını on büyük harfle tanımlayan yapay olarak oluşturulmuş verilerdir. 6000'den fazla görüntü ile birlikte gelir.

Nesne Algılama:

  1. MS COCO

    MS COCO veya Bağlamdaki Ortak Nesneler, bir nesne algılama ve resim yazısı veri kümesidir.

    Anahtar nokta algılama, çoklu nesne algılama, resim yazısı ve segmentasyon maskesi açıklamaları ile 328,000'den fazla görüntüye sahiptir. 80 nesne kategorisi ve resim başına beş resim yazısı ile birlikte gelir.

  2. LSUN

    Büyük Ölçekli Sahne Anlayışı'nın kısaltması olan LSUN, 20 nesne ve 10 sahne kategorisinde bir milyondan fazla etiketli görüntüye sahiptir. Bazı kategoriler, 300,000'ü doğrulama için özel olarak ve 300'i test verileri için olmak üzere 1000'e yakın görüntüye sahiptir.

  3. Ev Nesneleri

    Ev Nesneleri veri kümesi, mutfak, oturma odası ve banyo gibi evin her yerinden rastgele nesnelerin açıklamalı görüntülerini içerir. Bu veri kümesinde ayrıca test için tasarlanmış birkaç açıklamalı video ve 398 açıklamasız fotoğraf bulunmaktadır.

  4. Görsel Genom

    Visual Genome, 108,000'den fazla altyazılı görsele sahip kapsamlı bir görsel bilgi tabanıdır. Nesneler, nitelikler ve ilişkiler için kapsamlı açıklamalar sağlar ve bu da onu nesne tanıma, resim altyazısı ve çok modlu öğrenme görevleri için değerli kılar.

Otomotiv:

  1. şehir manzarası veri seti

    Cityscape, birkaç alıntının sokak sahnelerinden kaydedilmiş çeşitli video dizilerini ararken gidilecek veri setidir. Bu görüntüler uzun bir süre boyunca ve farklı hava ve ışık koşullarında çekildi. Ek açıklamalar, sekiz farklı kategoriye ayrılmış 30 görüntü sınıfı içindir.

  2. Barkley Derin Sürücü

    Barkley DeepDrive, otonom araç eğitimi için özel olarak tasarlanmıştır ve 100 binden fazla açıklamalı video dizisine sahiptir. Değişen yol ve sürüş koşullarına göre otonom araçlar için en faydalı eğitim verilerinden biridir.

  3. Akçaağaç

    Mapillary, dünya çapında 750 milyondan fazla sokak görüntüsüne ve trafik işaretine sahiptir ve bu, makine öğrenimi ve yapay zeka algoritmalarında görsel algı modellerinin eğitiminde çok faydalıdır. Çeşitli aydınlatma ve hava koşullarına ve bakış açılarına hitap eden otonom araçlar geliştirmenize olanak tanır.

Tıbbi Görüntüleme:

  1. Covid-19 Açık Araştırma Veri Kümesi

    Bu orijinal veri seti, AP/PA göğüs röntgenleri hakkında yaklaşık 6500 piksel poligonal akciğer segmentasyonuna sahiptir. Ek olarak, adı, konumu, kabul ayrıntılarını, sonucu ve daha fazlasını içeren etiketlerle birlikte Covid-517 hasta röntgenlerinin 19 görüntüsü mevcuttur.

  2. 100,000 Göğüs Röntgeni NIH Veritabanı

    NIH veritabanı, 100,000 göğüs röntgeni görüntüsü ve bilim ve araştırma topluluğu için yararlı olan ilgili verileri içeren, halka açık en kapsamlı veri kümelerinden biridir. İleri akciğer rahatsızlıkları olan hastaların görüntüleri bile var.

  3. Dijital Patoloji Atlası

    Dijital Patoloji Atlası, farklı organlara ait 17,000'e yakın açıklamalı slayttan toplamda 100'den fazla çeşitli histopatolojik yama görüntüsü sunar. Bu veri seti, bilgisayarla görme ve örüntü tanıma yazılımı geliştirmede kullanışlıdır.

Sahne Tanıma:

sahne tanıma

  1. İç Mekan Sahne Tanıma

    İç Mekan Sahne Tanıma, makine öğrenimi ve veri eğitiminde kullanılacak yaklaşık 15620 nesne ve iç mekan manzarası görüntüsü içeren yüksek düzeyde kategorize edilmiş bir veri kümesidir. 65'ten fazla kategoriyle birlikte gelir ve her kategoride en az 100 resim bulunur.

  2. xGörünüm

    Kamuya açık en iyi bilinen veri kümelerinden biri olan xView, çeşitli karmaşık ve büyük sahnelerden tonlarca açıklamalı tepeden görüntü içerir. Yaklaşık 60 sınıfa ve bir milyondan fazla nesne örneğine sahip olan bu veri kümesinin amacı, uydu görüntülerini kullanarak daha iyi afet yardımı sağlamaktır.

  3. Yerler

    MIT'nin katkıda bulunduğu bir veri seti olan Places, 1.8 farklı sahne kategorisinden 365 milyondan fazla görüntüye sahiptir. Bu kategorilerin her birinde doğrulama için yaklaşık 50 görüntü ve test için 900 görüntü vardır. Sahne tanıma veya görsel tanıma görevleri oluşturmak için derin sahne özelliklerini öğrenmek mümkündür.

  4. SUN Veritabanı

    SUN veritabanı, bilgisayarlı görüşte yaygın olarak kullanılan kapsamlı bir sahne kategorizasyon ölçütüdür. Her sahne için ayrıntılı açıklamalarla birlikte, geniş bir iç ve dış ortam yelpazesini kapsayan binlerce görüntü içerir. SUN veritabanı, farklı sahneleri kapsamasıyla tanınır ve sahne anlama algoritmalarını değerlendirmek için standart bir referans görevi görür.

Eğlence:

  1. IMDB WIKI Veri Kümesi

    IMDB - Wiki, yaş, cinsiyet ve isimlerle yeterince etiketlenmiş yüzlerin en popüler halka açık veritabanlarından biridir. Ayrıca Wikipedia'dan yaklaşık 20 bin ünlü ve 62 bin yüzü var.

  2. ünlü yüzler

    Celeb Faces, ünlülerin 200,000 açıklamalı görüntüsünü içeren büyük ölçekli bir veritabanıdır. Görüntüler arka plan gürültüsü ve poz varyasyonları ile birlikte gelir, bu da onları bilgisayarla görme görevlerindeki eğitim test setleri için değerli kılar. Yüz tanıma, düzenleme, yüz parçası lokalizasyonu ve daha fazlasında daha yüksek doğruluk elde etmek için oldukça faydalıdır.

  3. YouTube-8M Veri Seti

    YouTube-8M, görsel varlıkların yüksek kaliteli makine tarafından oluşturulmuş açıklamalarıyla milyonlarca YouTube video kimliği içeren büyük ölçekli etiketli bir video veri kümesidir. Bu veri kümesi, video içeriğini YouTube video kimlikleri aracılığıyla meta verilere bağlayarak video verilerinin ölçeklenebilir bir şekilde toplanmasını ve açıklanmasını sağladığı için büyük ölçekli video anlama ve görme algoritmalarını eğitme için yaygın olarak kullanılır.

Artık yapay zeka makinenizi besleyecek devasa bir açık kaynaklı görüntü veri kümeleri listeniz var. AI ve makine öğrenimi modellerinizin sonucu, öncelikle onları beslediğiniz ve eğittiğiniz veri kümelerinin kalitesine bağlıdır. AI modelinizin doğru tahminler üretmesini istiyorsanız, mükemmel bir şekilde bir araya getirilmiş, etiketlenmiş ve etiketlenmiş kaliteli veri kümelerine ihtiyacı vardır. Bu veri kümeleriyle çalışmak, pratik, gerçek dünya projeleri aracılığıyla makine öğrenimi becerilerinizi geliştirmenin ve iyileştirmenin mükemmel bir yoludur. Bilgisayarlı görüş sisteminizin başarısını artırmak için, proje vizyonunuzla ilgili kaliteli görüntü veritabanlarını kullanmalısınız.

sosyal paylaşım