Bir Bubble Plotu ABD'de Yaşamak İçin En İyi Şehirleri Nasıl Ortaya Çıkarır?

Bu makalede, size Amerikan şehirleri, hangi şehirde yaşayacağınıza karar vermedeki kabarcık parsellerinin değeri ve bu parsellerin nasıl oluşturulacağına ilişkin heyecan verici gerçekleri göstereceğim.

2018'de emlak yatırımını mı düşünüyorsunuz? Yeni bir şehre mi taşınıyorsunuz? Bu kararları göz önüne alırken, işsizlik oranı, konut fiyatı, kentin büyüklüğü, güvenlik vb. Gibi farklı faktörleri tartmanız gerekir. Tüm bu veriler ve buna karşılık gelen dört çubuk grafikte bile, o masaya bakarken hala ipucunuz kalmayacak. En iyi adayları bulmaya çalışacaksınız, ancak bu faktörler farklı hikayeler anlatıyor… Kulağa karmaşık bir sorun gibi geliyor.

Öyleyse, tüm bu faktörleri 1 grafikte görselleştirmenin ve TÜM'ü karşılaştırmanın bir yolu var mı? Evet, bir kabarcık grafiği kullanabiliriz!

Balon komplo nedir?

Kabarcık grafiği, ikiden fazla veri boyutunu (geleneksel dağılım grafikleriyle karşılaştırıldığında) görüntüleyen bir grafik türüdür. Bir X-Y düzlemi üzerine bir nokta çizmenin yanı sıra, daha fazla boyut görüntülemek için noktanın boyutunu, rengini veya şeklini kullanır.

İşsizlik oranını X ekseni, medyan konut fiyatı Y ekseni, şehir nüfusu ise noktaların büyüklüğü olarak kullanıyoruz. Bu iyi bir üçüncü boyut yaratır. Renk her şehre rastgele atanır.

ABD'de yaşanacak en iyi şehir… (bekleyin)

Kazanan: Nashville!

Diğer öneriler: Austin, Omaha, Milwaukee, Dallas, Minneapolis, Denver ve Aurora.

İşsizlik oranları düşük (ve bu nedenle iş bulma şansı daha yüksek) ve ev fiyatları düşük çünkü komploun sol alt tarafındalar. Bu ne anlama geliyor?

Seçimlerinizi bu arsaya göre yapabileceğiniz anlamına gelir.

Örneğin, işsizlik oranının daha önemli olduğunu düşünüyorsanız ve daha yüksek konut fiyatlarına aldırış etmiyorsanız, Honolulu, Oakland, Boston ve San Diego güçlü adaylardır.

Güvenliği başka bir faktör olarak eklemek ister misiniz?

Elbette. Güvenliği dördüncü bir faktör olarak ekleyelim (diğer üç faktör hala ev fiyatı, işsizlik oranı ve nüfus). Bir şehre rastgele renk vermek yerine, suç için renk ölçeğini kullanıyoruz (100.000 kişi başına suç oranı). Kırmızı, daha fazla suç demektir ve mavi daha az demektir.

Sonuç değişiyor mu?

O yaptı! Güvenlik sizin için çok önemliyse, Milwaukee önceki öneriler arasında çok iyi bir seçim olmayabilir (grafiğin sol alt tarafında olsa bile).

Şimdi bir kabarcık grafiğinin gücünü görüyorsunuz: bir 2-B grafiğinde çoklu faktörleri gösterme yeteneği. Yalnızca bu faktörler için çubuk grafikleriniz varsa, şehirleri ideal bir faktör kombinasyonu ile tanımlamanız zordur. Kabarcık grafiği temel olarak çok değişkenli bir karar verme problemini optimize etmeniz için “görsel bir amaç işlevi” yarattı.

İşsizlik oranı ve konut fiyatı zaman içinde nasıl değişiyor?

Bu şehirler için faktörlerin zaman içinde nasıl değiştiğini görmek için bir boyut olarak zaman eklemek üzere (2013-2017) etkileşimli bir hareket tablosu oluşturabiliriz.

Çok fazla görsel bilgiden kaçınmak için, suç verilerini kullanmadım ve seçili birkaç şehri temsil etmek için farklı renkler kullandım.

İyi haber şu ki, hemen hemen bütün şehirlerde işsizlik oranı önemli ölçüde azaldı (sağdan sola doğru hareket ediyor). Ancak kötü haber şu ki, konut fiyatları oldukça hızlı bir şekilde artıyor (özellikle San Francisco, San Jose, Los Angles, New York ve Seattle için).

Grafikleri kendiniz oluşturmak ister misiniz? İşte benim kabarcık grafikleri ve R'deki hareket tablosu için kodum. Çizgilerle oynarken iyi eğlenceler :)

###############
# Kabarcık Grafiği #
###############
kitaplığı (data.table)
kitaplığı (ggplot2)
kitaplığı (ggrepel)
bubble_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_data.csv", sep = ","))
bubble_plot <- ggplot (bubble_data,
               aes (x = İşsizlik_Rate, y = Ev_Price / 1000)) +
geom_point (aes (boyut = Nüfus, doldurma = Toplam_Krım), şekil = 21) +
# Size bir değişken atayarak 'Bubble' yaratın #
scale_fill_continuous (low = "# 33FFFF", yüksek = "# FF6699") +
scale_size_area (max_size = 20) +
# Kabarcık renk ölçeğini ve kabarcığın maksimum boyutunu seçin #
geom_text_repel (
          aes (label = Şehir), nudge_x = 0, nudge_y = 0.75, boyut = 6) +
# Etiketleri birbirlerinden uzaklaştırmak için geom_text_repel kullanın #
theme_bw () +
# Varsayılan gri olanın yerine beyaz arka plan kullan #
ggtitle ("ABD'de Yaşanacak En İyi Şehirler") + laboratuarlar (x = "İşsizlik Oranı%", y = "Ev Fiyatı",
       size = "Nüfus", dolgu = "Suç") + teması (plot.title = element_text (boyut = 25, hjust = 0.5),
        axis.title = element_text (boyut = 20, yüz = "kalın"),
        axis.text = element_text (boyut = 15)) +
# Stil başlığı ve eksen #
scale_y_continuous (name = "Ev Fiyatı", sonları = seq (0, 1500, = 250),
                      etiketler = c ("0", "250K", "500K", "750K", "1000k", "1250k", "1500K"))
# Bilimsel sayıyı "K" ile değiştirerek y eksenini daha okunaklı hale getirin #
Baskı (bubble_plot)
################
Hareket Tablosu
################
kitaplığı (data.table)
kitaplığı (googleVis)
motion_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/motion_chart_merged_city_data.csv", sep = ",")
motion_chart <- gvisMotionChart (motion_data,
idvar = "Şehir",
timevar = "Yıl",
xvar = "İşsizlik Oranı",
yvar = "Ev Fiyatı",
sizevar = "Nüfus")
arsa (motion_chart)
# R, tarayıcıda sizin için otomatik olarak bir sekme açar
# Flash player tarayıcıda etkinleştirilmiş olmalı
Flash'ı etkinleştirmek için “⌽” simgesini tıklayın
########
# Veri #
########
"""
Kullandığım veri setleri Zillow (orta konut), FBI’ın UCR programı, census.gov (nüfus), Çalışma Bürosu (işsizlik).
Bu yazıda ihtiyaç duyduğum format için temizlik ve katılım konusunda bazı veriler yaptım ve indirmek için aşağıdaki linklere tıklayabilirsiniz.
"""
bubble_plot_merged_city_data.csv, motion_chart_merged_city_data.csv

Beni takip et ve bunu yararlı bulduysan birkaç alkış ver!

Ayrıca veri bilimi, emlak ve karar verme ile ilgili önceki makalelerimi okuyabilirsiniz: