Hayattaki En İyi Şeyler Ölçeklendirilmiyor

Teknolojideki en büyük terimler başarısız olacak çünkü sadece ölçeklenemiyorlar.

Yeni teknolojiyle hızla inovasyon yaptığımız için, yeniliklerimizin pratik ve uygulanabilir olup olmadığını aklımızda tutmamız gerekir. Kullanıcıları binlerce, çalışma zamanını milisaniye olarak saydığımız bir dünyada, yeni teknoloji ölçekleri sağlamak her zamankinden daha önemli.

Bu yüzden, teknolojideki en büyük üç kelimenin ölçeklendirilmemesi şok edici.

Tabii ki, bugünlerde her teknoloji haberinin göründüğü üç kategoriden bahsediyorum:

  1. Yapay zeka
  2. Blockchain
  3. Karışık Gerçeklik (XR, AR / VR)

Neredeyse her şey bunları kullanıyor veya ekliyor gibi görünüyor, ancak bu hizmetleri ölçeklendirmenin ne kadar acı verici (ve tamamen imkansız) olması delice.

Daha fazla donanıma ihtiyacımız var

İlk ve en önemli eksiklik donanım olarak kalır. Teknolojinin donanım gereksinimlerinin hem fiyat hem de spesifikasyon açısından her yıl katlanarak artmakta olduğu bir sır değil. Bu, yaygın olarak benimsemede engelleyici bir faktör haline geliyor ve blockchain söz konusu olduğunda bu bir katil.

Blockchain genellikle “madenin” bloke ettiği ve ağın en temel görevleri yerine getirmesine izin verdiği “madencilere” (yani işlemleri doğrulama) dayanır. “Madencilik” süreci, derinlemesine girmeyeceğim bir şey, ancak “karma” olarak bilinen büyük şifreleme işlevlerini yürütmeyi içeriyor.

Sıkıştırma ile ilgili sorun, önemli miktarda hesaplama gücü gerektirmesidir; Aslında, blok zinciri üzerinde verimli bir şekilde madencilik yapan bu kadar büyük bir miktar, bir GPU veya bir ASIC gibi özel bir donanım gerektirir. En küçük madenci olmak için, yüksek özellikli bir GPU'ya ihtiyacınız olacak (gerçek olalım, Intel HD Graphics şu anda tüketici standardıdır, yani temelde yukarıda belirtilen her GPU) veya özel bir ASIC. Bu, oldukça fazla bir fatura yaratır; çoğu cihaz, işletme maliyeti olarak kabul edilen yüksek elektrik kullanımını saymaz, birim başına yüzlerce ila binlerce dolar fiyatlandırır.

2018’in büyük GPU sıkıntısı

Bu, blockchain’in benimsenmesinde önemli, engelleyici bir faktör olduğu ortaya çıktı. Aslında, bu nedenden ötürü, GPU fiyatları fırladı ve hisse senetleri yok oldu, madencilerin maddi araçları yok oldu, PC oyun endüstrisini çökertdi ve araştırmacıların ileri teknoloji donanımlara erişimini engelledi. Nvidia gibi yükselişe kar eden GPU üreticileri bile sonuçta ciddi bir kıtlıktan dolayı doğrudan bir zincir zincirinin nedeni olarak konuştu.

Bir yıl sonra, bu blok zinciri teknolojilerinin çoğu ortadan kalktı ve büyük kripto para birimleri fiyatları değerlemelerinin dörtte birine düştü. Blockchain ile ilgili en yaygın olarak belirtilen endişe, ölçeklenememesidir ve donanım, blockchain teknolojisinin ölçeklenmesinde engelleyici bir faktör olmaya devam etmektedir (ve olmaya devam edecektir).

Bununla birlikte, bu sorun blok zinciri ile sınırlı değildir. Yapay Zeka aynı donanıma (GPU'lara) dayanıyor ve bu da bu alanda engelleyici bir faktör haline geliyor; Yaklaşan girişimlerin çoğu, Google’lar gibi muazzam bir GPU grubu kurmayı göze alamaz ve AWS gibi bulut sağlayıcılarından bilgi işlem gücü satın almak, muazzam bir sunucu faturasını artıran 4x fiyatına geliyor.

XR ile konu daha da fazla yoruldu. Bu deneyimleri sürdürmek için tüketiciler görseller oluşturmalı ve tüketicinin cihazı duyusal girdiyi işlemelidir. Bu, yükü çoğunlukla tüketiciye yüklüyor; bu da XR alanına girmek isteyen işletmeler için harika geliyor ancak ölçeklendirmede büyük bir soruna neden oluyor.

Örneğin, Oculus VR'yi alalım. Oculus, Facebook tarafından edinilen ve pazardaki yerlerini pekiştiren ilk VR kulaklıklarından biriydi ve bu alanda popüler bir isim olmaya devam ediyor.

Oculus için gülünç derecede yüksek “minimum spec”; USB 3.0, iyi bir Nvidia GPU, 8GB RAM…

Ne yazık ki, Oculus neredeyse sadece masaüstü bilgisayarlarda çalışmakta ve ayrıca yüksek GPU özellikleri gerektirmektedir. Blockchain ve AI ile aynı tuzaklarla karşı karşıyadır, ancak çok daha büyük endişeleri vardır: AI ile bir işletme sorunu geçici olarak çözmek için altyapılarına para atabilirken, XR ile yük tüketicilerin üzerine düşer. AR / VR'nin benimsenme döngüsü, tüketici GPU'larının daha yaygın ve daha yüksek spesifikasyon haline gelmesinin yanı sıra, fiyatların ortalama kullanıcı için uygun seviyelere düşmesini beklemesine dayanmaktadır. Potansiyel olarak onlarca yıl alabilecek bir süreç - Nvidia CEO'su Jensen Huang, Moore’un yasalarının GPU’ları desteklediğini söylerken, fiyatların düşürülmesine rağmen ihtiyaç duyulan gelişme için gereken süre hala birkaç yıl kadar sürüyor.

Teknolojideki en büyük üç buzzwords için bu lanet olası bir cümle.

Süre

Hesaplamadaki yürütme süresi hakkında konuştuğumuzda, kullanıcılar anında etkileşimler bekledikçe büyüdükçe genellikle milisaniye cinsinden bahsediyoruz.

Ne yazık ki, yukarıdaki teknolojilerin üçünde de durum böyle değil.

Blockchain ile, zaman geçtikçe tek bir bloğun madenciliği daha uzun ve daha uzun sürer. Artık bireylerin büyük kripto para birimleri kullanmaları için karlı olmadıkları bir noktaya geldi ve madencilik havuzları ağdaki çekimleri aramaya başladı. “Merkezi olmayan” bir teknoloji için, çok fazla merkezileşmeyi destekliyor.

Aynı zamanda blockchain’in (tartışmalı) en büyük kullanım durumu için mahkumiyet heceleri: cryptocurrency. Cryptocurrency, merkezi otoriteler olmadan, sınırlar ötesinde ve büyük ücretler olmadan hızlı işlemlerden geçer.

Bununla birlikte, blok zincirinin ölçeklenememesi ve bir bloğun açılması için gereken zaman miktarı (zaman = elektrik) nedeniyle, işlemlerle ilgili ücretler rekor seviyelere çıkarıldı; Bitcoin, en küçük işlemlerle ilgili ücretlerin fiili işlem maliyetinden daha büyük olduğu bir noktaya ulaştı, bu durum tamamen yararsız hale geldi ve günlük tüketiciler için toplam bir başarısızlık oldu. İşlemler saatler almaya başladı ve kaçak nedeniyle yapılan düzenleme, Bitcoin’in yükselen fiyatı, Bitcoin’in sınırlar arasında taşınmasını zorlaştırdı.

Cryptocurrency, yok etmeye söz verdiği her şey oldu.

Yapay zeka ile ortaya çıkan çok farklı bir sorun var. Birçok büyük ölçekli modelin çıkarım süresi birkaç saniye sürmektedir; bu, küçük bir zaman süresine benzeyen ancak rafa çıkmaya başlayan ve binlerce miktarda kullanıcı tabanını tartışırken engelleyici bir rakam haline gelen bir durumdur.

Dahası, çoğu modelden çıkarım süresi için alıntılanan rakamlar zordur - satırlar arasında ya da “XYZ GPU yığınında” bulunan “XYZ GPU yığınımızda bulunduğu gibi” yazan bir sonraki satıra yazmanız gerekir. birkaç bin dolara mal oluyor ve bu tek çıkarım görevine tamamen adanmış olmalı.

Google’ın, modellerini eğitmek için sıkça kullanılan TPU yığını

Tabii ki, burada araştırma yapılıyor, ancak yürütülen araştırma neredeyse tamamen tartışmalı olduğum eğitim süresine odaklanıyor. Eğitim için, bir hafta önemli bir şey değil - herhangi bir girişim işlerinin temel taşı olacak bir model yetiştirmek için bir hafta ayırabilir.

Daha büyük sorun çıkarımda yatıyor. Kök seviyesinde, eğitim çıkarım gerektirir - çıkarım genellikle bir ağın “ileri” aşaması olarak alıntılanır ve bu, zemin yapılmadan önce eğitimde gerçekleşmelidir. Bununla birlikte, eğitimde, çıkarılması gereken tüm veriler başlangıçta mevcuttur.

Başka bir deyişle, tüm toplu işlem bir seferde (yani aynı anda 100 görüntü) matematiksel ölçeklendirme nedeniyle işlenebilir - birkaç matrisin daha büyük bir matrisini çarpmak 1 matrisin birkaç matrisini çarpmaktan daha verimlidir (diğer bir deyişle , bir kerede daha fazla yapmak için daha verimli). Bu, ekonomideki azalan verim fikrine benzer şekilde belirli bir noktaya kadar gider, ancak toplu eğitimin büyük miktarlarda verilere ilişkin çıkarımı ölçeklendirmemize izin verdiği görülmektedir.

Ne yazık ki, pratik anlamda parti işleme nadiren söz konusudur.

Bir modelin aynı anda 200 görüntüde çıkarım yapması nadirdir; 200 görüntünün bir dakika içinde çıkarım için gönderilmesi daha olasıdır. Görüntü başına çıkarım zamanında sert bir darboğaz olacaktır; Bir çıkarım zamanı bile, saniyenin üçte biri (ki bu delicesine hızlıdır - bunlar Gmail’in süper optimize edilmiş cümle tahmin modeli gibi en hızlı modellerin getirdiği zamanlardır) dakika. 200 / dak'lık küçük yüklerde bile, model ölçeklendirilemiyor ve büyüyen backlogu değerlendirmek için ikinci bir örnek dengelemek için üretilmeli.

Büyük yüklerin verildiği bir dünyada yutulması zor bir haptır; Aslında, Node’nin Ekspresi daha önce yalnızca birkaç bin bağlantıyı / saniyeyi desteklemek için ateş altında kaldı, popüler NoSQL veritabanlarına benzer şekilde, birkaç bin işlemde / saniyede bir darboğaz olması nedeniyle eleştirildi.

patlaması garantili olan bir baraj

Yapabileceğiniz en gelişmiş optimizasyonlarla bile, bir modelin tek bir örneğinde ayrı çıkarımlar olarak saniyede birkaç yüz saniyede sert bir tıkanıklıkla karşılaşan AI dünyasında duyulmamış bir rakam.

XR'de, elinizde çok, çok farklı bir sorun var. Mesele daldırmayla ilgili - daldırma ve esrarengiz vadiden kaçınmak için etkileşimler gerçekleşmeli ve render insanların algıladığından daha hızlı bir şekilde uyum sağlamalıdır. Başka bir deyişle, birkaç yüz milisaniye yeterince hızlı değil.

XR ile şeyleri küçük milisaniye cinsinden ölçeriz. Kabul edilebilir gecikmeyi ~ 20 ms'nin altında ölçüyoruz (çoğu oyuncu için 100+ fps ve on ping'in altında normal kabul edildiği için birçok oyuncunun aynı fikirde olmadığı bir rakam).

Bu bir darboğaz olmaya devam eden ve bizim yakınlarda olmadığımız bir figür; XR teknolojisi yoğun bir şekilde bu konuya odaklanırken ve bu alanda düzenli olarak duyusal girdi ve görüntü oluşturma konularında birçok atılım gerçekleştirilmiş olsa da, etkileşim konusunda hala sorun yaşıyoruz; Kesin olarak, XR çoğu motor tarafından çok hızlı bir şekilde işlenemeyen etkileşim için yepyeni, sonsuz bir olasılık yelpazesi açar.

ARCore’un Google I / O 2018’de gösterildiği gibi Artırılmış Görüntü motoru

Dahası, homografiden daha karmaşık bir şeyle görüntü büyütmeyi çalıştırmak için, gecikme çoğu deneyimler tarafından “kabul edilebilir” olarak kabul edilemeyecek kadar yüksektir. Şimdiye kadar test edilen en hızlı Google’ın homografileri kullanan ARCore Artırılmış Görüntüleri (biraz daha yavaş ve biraz gözle görülür gecikme / gecikme olan bir Artırılmış Yüzler demosu da var).

ARCore Artırılmış Yüzler demosu

Bu büyük bir problem

Sadece son iki yılda, bu üç alandaki ilerleme sayısı aşılmaz.

AI'da, doğal dil neslinin, NLP'nin Imagenet'i olarak ün kazandığı GPT-2 ile atıldığını gördük. Metin işleme ile yeni bir olasılıklar dünyası açıyor. Ayrıca evrimsel ağların ve GAN'ların 4k görüntüleri benimsemek için büyüdüklerini gördük ve AI'nın HD görüntüleri taklit edebileceği ve insan gözüne inandırıcı görünen içerikler üretebileceği bir döneme giriyoruz.

Blockchain ile tarla daha az çamurlu hale geldi, birkaç nakit para kazanıyor ve mevcut platformlara maruz kalmak için daha fazla yer açıyor. Buhar, Stellar ve normal teknolojide blockchain kullanımı ile birlikte geçen yıl önemli ölçüde arttı. JPMorgan, BofA ve Facebook, blok zincirlerinin hepsinin açıklandığını ve uygulanan blok zincirinin DLive gibi platformlarda yaygınlaşmaya başlayan bir yükseliş gördüğünü duyurdu (DLive, kısa süre önce Youtube'un en büyük kişiliği ile ilk kez yaratıcısı olan platformuyla ortaklık kurdu).

XR'de, telefon seviyesindeki XR ve AR'nin, ARCore'daki birçok iyileştirme ile gerçek olduğunu gördük. AI'yı XR'ye entegre etmek ve bir miktar insan etkileşimi için deneyimler geliştirmek mümkün hale geldi (henüz fiziksel bir temasta değiliz, ancak Fiddler AR gibi diğer etkileşime izin veren projeler var).

Bunların hepsi, teknolojinin geleceği ve insan uygarlığının bir bütün olarak gittiği yerlerde büyük ve önemli bir etkiye sahip olan alanlardır. Bunlar ekonomiyi etkilemeyen teknolojilerdir; yeniden tanımladılar; toplumu ve etkileşimi etkilemezler; yeniden canlandırıyorlar. Tüm kültürümüzün elden geçirilmesini mümkün kılar ve kök düzeyinde başka bir Endüstri Devrimi olarak adlandırılır.

Yaygın halk üzerinde bu kadar büyük bir etkiye sahip olan bir hareket için, halkı kolaylıkla desteklemek için ölçeklenebilmesi hayati önem taşımaktadır. Bu uygulanıncaya kadar, evlat edinmeyi engelliyor ve büyük şirketler dışındaki inovasyon açısından girişe engel teşkil ediyor.

Bu teknolojilerin ölçeklendirilmesinde daha fazla yenilik görmeyi umuyorum. Epic.ai'de, ağırlıklı olarak AI ve blockchain'e dayanan uygulamalar geliştirmeye odaklanıyoruz - hepimiz ölçeklendirme sınırlamalarına aşinayız; önümüzdeki birkaç yıl içinde yoğun olarak üzerinde çalışacağımız bir sorun ve endüstrinin çözmek için bir araya geleceğini umduğumuz bir sorun.

Hey! Ben Tomer, girişimci ve yapımcıyım. Beni Mevee, Crane ve Shots, Slide'lardan ve şimdi başlattığım ürünler arasında yatırımcı bilgi işleminden tanıyor olabilirsiniz! Bu makale, çoğunlukla deneyimlerime dayanarak yazdığım ve daha çok benden ve ekibimin görüşlerinden oluşan daha kapsamlı bir dizinin parçası.

Umarım bu aynı hataları yapmaktan kaçınmanıza yardımcı olur ve nakliyeye devam etmeyi unutmayın!

Lütfen bu değerli bulursanız cla alkışlayın ve beni takip edin development yazılım geliştirme ve girişimciliğin gerçek hayatta nasıl göründüğü hakkında hikayeler paylaşırken bunun gibi daha fazla yazı için.

Bu hikaye, Orta’nın en büyük girişimcilik yayını olan Startup’ta ve ardından +442.678 kişi tarafından yayınlandı.

En iyi hikayelerimizi buradan almak için abone olun.