Bunlar Herkesin Kullanabileceği En İyi Ücretsiz Açık Veri Kaynaklarıdır

PC: Flickr

Açık Veri Nedir?

Basit bir deyişle, Açık Veri, herkes, herkes için erişim, değişiklik, yeniden kullanım ve paylaşım için açık olan veri türü anlamına gelir.

Açık Veri, temelini açık kaynak, açık donanım, açık hükümet, açık bilim vb. Gibi çeşitli “açık hareketlerden” almaktadır.

Hükümetler, bağımsız kuruluşlar ve ajanslar, serbest ve kolay erişim için gittikçe daha fazla açık veri oluşturmak üzere veri taşıtlarını açmak için sabırsızlanıyor.

Açık Veri Neden Önemli?

Açık veri önemlidir, çünkü dünya giderek artan bir şekilde veri güdümlü hale gelmiştir. Ancak verilere erişim ve kullanım konusunda kısıtlamalar varsa, veriye dayalı işletme ve yönetişim fikri hayata geçirilmeyecektir.

Bu nedenle açık verilerin kendine özgü bir yeri vardır. Küresel sorunların ve evrensel sorunların daha iyi anlaşılmasını sağlar. İşletmelere büyük destek verebilir. Makine öğrenmesi için harika bir itici güç olabilir. Hastalık, suç veya kıtlık gibi küresel sorunlarla mücadelede yardımcı olabilir. Açık veriler vatandaşları güçlendirebilir ve dolayısıyla demokrasiyi güçlendirebilir. Toplumun ve hükümetlerin oluşturduğu süreçleri ve sistemleri düzenleyebilir. Dünyayı anlama ve etkileşim tarzımızı değiştirmeye yardımcı olabilir.

İşte benim 15 harika Açık Veri kaynağı listem:

1. Dünya Bankası Açık Veri

Dünyanın farklı ülkelerinde olup bitenlerle ilgili olarak dünyanın en kapsamlı verilerinin bir deposu olarak, Dünya Bankası Açık Veri hayati bir Açık Veri kaynağıdır. Ayrıca veri katalogunda belirtilen diğer veri setlerine de erişim sağlar.

Dünya Bankası Açık Veri büyüktür çünkü mikro veri, zaman serisi istatistikleri ve coğrafi verileri içeren 3000 veri setine ve 14000 göstergeye sahiptir.

İstediğiniz verilere erişmek ve keşfetmek de oldukça kolaydır. Yapmanız gereken tek şey gösterge isimlerini, ülkeleri veya konuları belirlemektir ve Açık Veri'nin hazine merkezini sizin için açacaktır. Ayrıca CSV, Excel ve XML gibi farklı formatlarda veri indirmenize izin verir.

Eğer bir gazeteci ya da akademisyen iseniz, size uygun olan araçlar dizisi ile büyüleneceksiniz. Araştırmanızı destekleyebilecek analiz ve görselleştirme araçlarına erişebilirsiniz. Küresel sorunların daha derin ve daha iyi anlaşılmasını kolaylaştırır.

İhtiyacınız olan veri görselleştirmelerini, diğer veri kaynaklarıyla canlı kombinasyonları ve daha pek çok özelliği oluşturmanıza yardımcı olacak API'ye erişebilirsiniz.

Bu nedenle, Dünya Bankası Açık Veri'nin Açık Veri kaynaklarının herhangi bir listesine girmesi şaşırtıcı değildir!

2. WHO (Dünya Sağlık Örgütü) - Açık veri deposu

DSÖ'nün Açık Veri deposu, DSÖ'nün 194 Üye Devletinin sağlığa özgü istatistiklerini nasıl takip ettiğini gösterir.

Havuz, verileri sistematik olarak organize tutar. Farklı ihtiyaçlara göre erişilebilir. Örneğin, ölüm veya hastalıkların yükü olup olmadığı, Binyıl Kalkınma Hedefleri (çocuk beslenmesi, çocuk sağlığı, anne ve üreme sağlığı, bağışıklama, HIV / AIDS, tüberküloz, sıtma, ihmal edilen hastalıklar, su ve sanitasyon), bulaşıcı olmayan hastalıklar ve risk faktörleri, salgın eğilimli hastalıklar, sağlık sistemleri, çevre sağlığı, şiddet ve yaralanmalar, eşitlik vb.

Özel ihtiyaçlarınız için, veri kümelerini temalara, kategoriye, göstergeye ve ülkeye göre inceleyebilirsiniz.

İşin iyi yanı, ihtiyacınız olan verileri Excel Formatında indirebilmenizdir. Ayrıca, veri portalını kullanarak verileri izleyebilir ve analiz edebilirsiniz.

Dünya Sağlık Örgütü’nün veri ve istatistik içeriğine ilişkin API de mevcuttur.

3. Google Genel Veri Gezgini

2010 yılında piyasaya sürülen Google Genel Veri Gezgini, büyük miktarda halka açık veri kümelerini keşfetmenize yardımcı olabilir. Kendi kullanımlarınız için verileri görselleştirebilir ve iletebilirsiniz.

Farklı ajanslardan ve kaynaklardan elde edilen verileri mümkün kılar. Örneğin, Dünya Bankası, ABD Çalışma İstatistikleri Bürosu ve ABD Bürosu, OECD, IMF ve diğerlerinden verilere erişebilirsiniz.

Farklı paydaşlar bu verilere çeşitli amaçlarla erişirler. Öğrenci veya gazeteci olun, politika yapıcı veya akademik olsanız da, kamuya açık verilerin görselleştirmelerini oluşturmak için bu aracı kullanabilirsiniz.

Veri Gezgini'nin yardımıyla çizgi grafikler, çubuk grafikler, haritalar ve balon grafikleri gibi verileri temsil etmenin çeşitli yollarını dağıtabilirsiniz.

En iyi bölüm, bu görselleştirmeleri oldukça dinamik bulmanızdır. Bu onların zamanla değiştiğini göreceğiniz anlamına gelir. Konuları değiştirebilir, farklı girişlere odaklanabilir ve ölçeği değiştirebilirsiniz.

Aynı zamanda kolayca paylaşılabilir. Grafiği hazırladığınız anda, web sitenize veya blogunuza gömebilir veya arkadaşlarınızla bir bağlantı paylaşabilirsiniz.

4. AWS’de Açık Veri Kaydı (RODA)

Bu genel veri kümelerini içeren bir depodur. AWS kaynaklarından edinilebilen verilerdir.

RODA’ya gelince, kamuya açık olan verileri keşfedebilir ve paylaşabilirsiniz.

RODA'da, aradığınız veriyi aramak için genomik, uydu görüntüleri ve ulaştırma gibi yaygın veri türleri için anahtar kelimeleri ve etiketleri kullanabilirsiniz. Bütün bunlar basit bir web arayüzünde mümkündür.

Her veri kümesi için, ayrıntı sayfasını, kullanım örneklerini, lisans bilgilerini ve öğreticileri veya bu verileri kullanan uygulamaları keşfedeceksiniz.

Çok çeşitli bilgi işlem ve veri analitiği ürünlerinden faydalanarak açık verileri analiz edebilir ve istediğiniz hizmetleri oluşturabilirsiniz.

Eriştiğiniz verilere AWS kaynakları aracılığıyla ulaşılabilir olmasına rağmen, bunun AWS tarafından sağlanmadığını aklınızda bulundurmanız gerekir. Bu veriler farklı kurumlara, devlet kuruluşlarına, araştırmacılara, işletmelere ve bireylere aittir.

5. Avrupa Birliği Açık Veri Portalı

Avrupa Birliği Açık Veri Portalı gibi tek bir platformda yayınlanan AB kurumları, kurumları ve diğer kuruluşlar ne açık verilere erişebilirsiniz.

AB Açık Veri Portalı, AB politika alanlarıyla ilgili hayati açık verilere ev sahipliği yapmaktadır. Bu politika alanları ekonomi, istihdam, bilim, çevre ve eğitimdir.

Eurostat, Avrupa Çevre Ajansı, Ortak Araştırma Merkezi ve diğer Avrupa Komisyonu Genel Müdürlükleri ve AB Ajansları gibi yaklaşık 70 AB kurumu, kuruluşu veya departmanı veri setlerini halka açıklamış ve erişime izin vermiştir. Bu veri setleri bugüne kadar 11700 sayısını geçti.

Portal, kolay erişim sağlar. Ortak bir meta veri kataloğu üzerinden verileri kolayca arayabilir, inceleyebilir, bağlayabilir, indirebilir ve yeniden kullanabilirsiniz. Özel amaçlarınız için bunu yapabilirsiniz. Ticari veya ticari olmayan amaçlar olabilir.

Meta veri kataloğunu etkileşimli bir arama motoru (Veri sekmesi) ve SPARQL sorguları (Bağlantılı veri sekmesi) aracılığıyla arayabilirsiniz.

Bu katalogdan yararlanarak, AB kurumlarının, kurumlarının ve kuruluşlarının farklı web sitelerinde depolanan verilere erişebilirsiniz.

6. FiveThirtyEight

Veri odaklı gazetecilik ve hikaye anlatımı için harika bir site.

Politika, spor, bilim, ekonomi vb. Çeşitli sektörler için çeşitli veri kaynaklarını sağlar. Verileri de indirebilirsiniz.

Verilere eriştiğinizde, her bir veri setiyle ilgili olarak kaynağına ilişkin kısa bir açıklama ile karşılaşacaksınız. Bunun ne anlama geldiğini ve nasıl kullanılacağını da öğreneceksiniz.

Bu verileri kullanıcı dostu yapmak için, veri kümelerini CSV dosyaları gibi basit, tescilli olmayan biçimlerde mümkün olduğu kadar sağlar. Söylemeye gerek yok, bu biçimlerde insanlar ve makineler tarafından kolayca erişilebilir ve işlenebilir.

Bu veri setlerinin yardımıyla kendi gereksinimlerinize ve tercihlerinize göre hikayeler ve görselleştirmeler oluşturabilirsiniz.

7. ABD Sayım Bürosu

ABD Sayım Bürosu, federal hükümetin en büyük istatistik ajansıdır. Amerika'nın insanları, yerleri ve ekonomisi hakkında güvenilir veriler ve veriler depolar ve sağlar.

Nüfus Sayımı Bürosu, hizmetlerini en güvenilir kalite verisi sağlayıcısı olarak genişletmek için asil misyonudur.

İster federal, eyalet, ister yerel, ister aşiret hükümeti olsun, hepsi nüfus sayımı verilerini çeşitli amaçlar için kullanmaktadır. Bu hükümetler bu verileri yeni konut ve kamu tesislerinin yerini belirlemek için kullanmaktadır. Ayrıca, toplulukların, devletlerin ve ABD'nin demografik özelliklerini incelediklerinde de yararlanırlar.

Bu veriler aynı zamanda ulaştırma sistemlerinin ve karayollarının planlanmasında da kullanılmaktadır. Kotaları belirleme ve polis ve yangın bölgeleri oluşturma söz konusu olduğunda, bu veriler kullanışlı olur. Hükümetler yerel seçim alanları, okullar, kamu hizmetleri vb. Oluşturduğunda, bu verileri kullanırlar. Nüfus bilgisini on yılda bir derlemek bir pratiktir ve bu veriler aynı şeyi yapmakta oldukça faydalıdır.

Verileri aramak, özelleştirmek ve görselleştirmek istediğinizde yararlı olan Amerikan Gerçek Bulucu, Sayım Veri Gezgini ve Hızlı Bilgiler gibi çeşitli araçlar vardır.

Örneğin, Hızlı Bilgiler yalnızca tüm eyaletler, ülkeler, şehirler ve hatta nüfusu 5000 veya daha fazla olan kasabalar için istatistikler içerir.

Aynı şekilde, Amerikan Gerçek Bulucu, nüfus, gelir vb. Popüler olayları keşfetmenize yardımcı olabilir. Sıkça istenen bilgileri sağlar.

İşin iyi yanı, arama yapabilmeniz, verilerle etkileşime girebilmeniz, popüler istatistikler hakkında bilgi edinebilmeniz ve Census Data Explorer ile ilgili çizelgeleri görebilmenizdir. Ayrıca, etkileşimli bir harita deneyimindeki verileri özelleştirmek için görsel aracı da kullanabilirsiniz.

8. Data.gov

Data.gov, ABD hükümetinin açık verilerinin hazine evidir. Ancak son zamanlarda, tüm devlet verilerinin ücretsiz olarak kullanılabilmesi kararı verildi.

Piyasaya sunulduğunda sadece 47 tane vardı. Şimdi 180.000 veri seti var.

Neden Data.gov harika bir kaynaktır çünkü çeşitli amaçlarla dağıtabileceğiniz veri, araç ve kaynakları bulabilmenizdir. Araştırmanızı yürütebilir, web ve mobil uygulamalarınızı geliştirebilir ve hatta veri görselleştirmeleri tasarlayabilirsiniz.

Tek yapmanız gereken, arama kutusuna anahtar kelimeler girerek türleri, etiketleri, biçimleri, grupları, organizasyon türlerini, organizasyonları ve kategorileri taramaktır. Bu, ihtiyaç duyduğunuz veri veya veri kümelerine kolay erişmeyi kolaylaştıracaktır.

Data.gov, Data.gov'da görüntülenen her veri kümesi için bir zorunlu alan kümesi (Başlık, Açıklama, Etiketler, Son Güncelleme, Yayımcı, İletişim Adı, vb.) Olan Proje Açık Veri Şemasını izler.

9. DBpedia

Bildiğiniz gibi, Wikipedia harika bir bilgi kaynağı. DBpedia, Wikipedia'nın oluşturduğu değerli bilgilerden yapılandırılmış içerik almayı amaçlamaktadır.

DBpedia ile, Wikipedia kaynağının ilişkilerini ve özelliklerini semantik olarak arayabilir ve keşfedebilirsiniz. Bu, diğer ilgili veri kümelerine de bağlantılar içerir.

DBpedia veri kümesinde yaklaşık 4,58 milyon varlık var. 4,22 milyon, 1.445.000 kişi, 735.000 yer, 123.000 müzik albümü, 87.000 film, 19.000 video oyunu, 241.000 kuruluş, 251.000 tür ve 6.000 hastalık dahil olmak üzere ontolojide sınıflandırılmaktadır.

Bu varlıklar için yaklaşık 125 dilde etiket ve özetler bulunmaktadır. Resimlere 25,2 milyon bağlantı var. Dış web sayfalarına 29,8 milyon bağlantı var.

DBpedia kullanmak için yapmanız gereken tek şey son noktaya karşı SPARQL sorguları yazmak veya dökümü indirerek.

DBpedia, Apple (Siri yoluyla), Google (Freebase ve Google Bilgi Grafiği yoluyla) ve IBM (Watson yoluyla) ve özellikle yapay zeka ile ilgili kendi prestijli projeleri gibi çeşitli işletmelere fayda sağlamıştır.

10. freeCodeCamp Açık Veri

Bu açık kaynak kodlu bir topluluktur. Önemli olan, kar amacı gütmeyen kuruluşlardan sonra pro bono projeleri kodlamanızı, geliştirmenizi ve bir iş sahibi olmanızı sağlar.

Bunun gerçekleşmesi için, freeCodeCamp.org topluluğu her ay çok fazla miktarda veri sunar. Açık verilere dönüştürdüler.

Bu depoda çeşitli şeyler bulacaksınız. FreeCodeCamp verilerine dayanarak veri kümelerini, aynı ve hatta projelerin demolarını analiz edebilirsiniz. Ayrıca freeCodeCamp verilerini içeren harici projelere bağlantılar bulabilirsiniz.

Aklınızdaki çeşitli proje ve görevlerde size yardımcı olabilir. İster web analitiği, ister sosyal medya analitiği, sosyal ağ analizi, eğitim analizi, veri görselleştirme, veri odaklı web geliştirme veya botlar olsun, bu topluluğun sunduğu veriler son derece yararlı ve etkili olabilir.

11. Yelp Açık Veri Kümeleri

Yelp veri seti, kişisel, eğitimsel ve akademik araştırmalarda kullanılmak üzere kendi işletmelerimizden, incelemelerden ve kullanıcı verilerinden başka hiçbir şeyin alt kümesi değildir.

Yelp Açık Veri Raporlarında 5.996.996 yorum, 188.593 işletme, 280.991 resim ve 10 büyükşehir alanı bulunmaktadır.

Bunları farklı amaçlar için kullanabilirsiniz. JSON dosyaları olarak mevcut olduklarından, onları öğrencilere veritabanları hakkında öğretmek için kullanabilirsiniz. Mobil uygulamaların nasıl tasarlandığını anlarken, NLP öğrenmek veya örnek üretim verileri için bunları kullanabilirsiniz.

Bu veri kümesinde, tek bir nesne türünden, her satırda bir JSON-nesne içeren her bir dosya bulacaksınız.

12. UNICEF Veri Kümesi

UNICEF çok çeşitli kritik konularla ilgilendiğinden, eğitim, çocuk işçiliği, çocuk sakatlığı, çocuk ölümleri, anne ölümleri, su ve sanitasyon, düşük doğum ağırlığı, doğum öncesi bakım, zatürree, sıtma, iyot eksikliği ile ilgili verileri derlemiştir. bozukluğu, kadın sünneti yaralanması / kesilmesi ve ergenler.

UNICEF’in IATI Sicilinde yayınlanan açık veri setleri: http://www.iatiregistry.org/publisher/unicef, doğrudan UNICEF’in işletim sisteminden (VISION) ve diğer veri sistemlerinden elde edildi ve bireysel UNICEF ofisleri tarafından yapılan girdileri yansıtıyor.

İşin iyi yanı, bu veri setleri söz konusu olduğunda düzenli bir güncelleme yapılması. Her ay, veriler daha kapsamlı, güvenilir ve doğru olması için güncellenmektedir.

Bu verilere özgürce ve kolayca erişebilirsiniz. Bunu yapmak için, bu verileri CSV formatında indirebilirsiniz. Örnek verileri indirmeden önce önizlemesini de yapabilirsiniz.

Herhangi biri UNICEF’in veri kümelerini keşfedebilir ve görselleştirebilirken, üç ana yayıncı vardır:

UNICEF’İN YARDIM ŞEFFAFLIĞI PORTAL: Bu portalı kullanıyorsanız veri setlerine daha kolay erişebilirsiniz. Ayrıca UNICEF'in içinde çalıştığı her ülke için detayları içerir.

Yayıncı d-portalı: Şu anda BETA’da. Bu portalla, IATI verilerini keşfedebilirsiniz.

Geliştirme faaliyetleri, bütçeler vb. İle ilgili bilgileri arayabilirsiniz. Bu bilgiyi ülke bazında keşfedebilirsiniz.

Yayıncının veri platformu: Bu platformda, IATI Kayıt Defteri aracılığıyla erişilen verilerdeki istatistiklere, grafiklere ve metriklere kolayca erişebilirsiniz. Başlıklara tıklarsanız, platformda gördüğünüz tabloların çoğunu da sıralayabilirsiniz. Ayrıca platformlardaki veri setlerinin çoğunu makinede okunabilir JSON formatında bulabilirsiniz.

13. Kaggle

Kaggle harika çünkü farklı veri seti yayın formatlarının kullanımını destekliyor. Ancak, daha iyi bölüm, veri kümesi yayıncılarının verilerini erişilebilir, tescilli olmayan bir biçimde paylaşmalarını şiddetle tavsiye etmesidir.

Platform açık ve erişilebilir veri formatlarını destekler. Sadece erişim için değil, aynı zamanda bu verilerle ne yapmak istediğinizi de önemlidir. Bu nedenle, Kaggle Dataset, verileri paylaşırken önerilen dosya biçimlerini açıkça tanımlar.

Kaggle veri setleri hakkındaki benzersiz şey, yalnızca bir veri deposu olmamasıdır. Her veri kümesi, verileri tartışmanıza, kamu kodlarını ve tekniklerini öğrenmenize ve kendi projelerinizi Çekirdekler'de kavramsallaştırmanıza olanak tanıyan bir topluluk anlamına gelir.

CSV, JSON, SQLite, Arşiv, Büyük Sorgu vb. Kaggle'ın desteklediği dosya türleridir. Açık veri projeniz üzerinde çalışmaya başlamak için çeşitli kaynaklar bulabilirsiniz.

En iyi bölüm, Kaggle'ın veri kümelerini özel veya genel olarak yayınlamanıza ve paylaşmanıza izin vermesidir.

14. LODUM

Münster Üniversitesi'nin Açık Veri girişimidir. Bu inisiyatif altında, herkesin üniversite hakkında kamuya açık tüm bilgilere makinede okunabilir formatlarda erişmesi mümkün olmaktadır. İhtiyaçlarınıza göre kolayca erişebilir ve yeniden kullanabilirsiniz.

Bilimsel eserler hakkındaki açık veri ve bağlantılı veri olarak kodlanan bu proje kapsamında sunulmaktadır.

Linked Data'nın yardımıyla verileri, ontolojileri ve çeşitli meta veri standartlarını paylaşmak ve kullanmak mümkündür. Aslında, meta veri sağlamak için kabul edilmiş bir standart olması ve verilerin Web üzerinde olması öngörülmektedir.

LODUM ekibi LinkedUniversities.org ve LinkedScience.org’u ortak olarak başlattı.

Verileri analiz etmek için SPARQL editörünü veya R SPARQL paketini kullanabilirsiniz.

SPARQL Paketi, HTTP üzerinden bir SPARQL uç noktasına bağlanmayı, SELECT sorgusu veya güncelleme sorgusu (LOAD, INSERT, DELETE) oluşturmayı sağlar.

15. UCI Makine Öğrenimi Deposu

Makine öğrenmesi topluluğu tarafından makine öğrenimi algoritmalarının ampirik analizi için kullanılan kapsamlı bir veri tabanı, etki alanı teorisi ve veri üreticisi deposu olarak hizmet vermektedir.

Bu depoda, şu anda, makine öğrenme topluluğuna bir hizmet olarak 463 veri kümesi bulunmaktadır.

Kaliforniya Üniversitesi Makine Öğrenimi ve Akıllı Sistemler Merkezi olan Irvine, bunu barındırıyor ve sürdürüyor. David Aha başlangıçta UC Irvine'de yüksek lisans öğrencisi olarak yaratmıştı.

O zamandan beri, dünyanın her yerindeki öğrenciler, eğitimciler ve araştırmacılar, onu makine öğrenme veri setlerinin güvenilir bir kaynağı olarak kullanmaktadır.

Nasıl çalışır, her veri kümesinin, onu araştıran ilgili yayınlar da dahil olmak üzere tüm bilinen ayrıntıları içeren ayrı bir web sayfasına sahip olmasıdır. Bu veri kümelerini, genellikle yararlı CSV formatı olan ASCII dosyaları olarak indirebilirsiniz.

Veri setlerinin detayları, özellik türleri, örnek sayısı, özellik sayısı ve sıralanıp aranabilen yayınlanan yıl gibi özelliklerle özetlenir.

Veri Portallarını ve Arama Motorlarını Açın:

Her yıl çok sayıda kurum tarafından yayınlanan çok sayıda veri kümesi bulunmakla birlikte, çok az veri kümesi tanınmakta ve oluşturulmaktadır.

Bu tür veri kümelerinin çok azının yararlı bir kaynak olarak sürdürülmesinin sebebi, verileri insanların ve kuruluşların faydalı ve kullanımı kolay bulabilecek şekilde geliştirmenin, yönetmenin ve sağlamanın zor olmasıdır.

Ancak, kullanıcıların açık verilere kolayca erişebilmelerini, etkilerini ve değerli değerli bilgileri incelemelerini sağlayan birkaç önemli açık veri portalı ve platformunun bir listesini aşağıda bulabilirsiniz.

  1. Google veri kümesi araması
  2. Dataverse
  3. Veri Kitini Aç
  4. Ckan
  5. Veri İzleyiciyi Aç
  6. Plenar.io
  7. Veri Etkisi Haritasını Aç

Sonuç

Açık veri günün sırasıdır. Dünya yavaş yavaş açık sistemlere doğru ilerlemeye başladı ve açık veri bununla tam olarak eşleşiyor.

Açık veriden yararlanan işletme ve organizasyonlar rekabet üstünlüğü kazanacak ve geleceğe hakim olacaklar.