Press "Enter" to skip to content

Tag: big data

İstanbul Balık Pazarı – Veri ile bakış

Ülkemizde kışın bereketlerinden biri de onlarca farklı türde balığı hem afiyetle yeme hem de uygun fiyata alma imkanıdır. İstanbul belediyesini balık halinden aldığım bilgileri paylaşmak istiyorum. En üstteki grafik 1 Ağustos – 17 Ekim arası en çok satılan 5 balığı gösteriyor.

Av yasağı bitiyor

Av yasağının kalkmasıyla beraber aşağıda görüldüğü gibi halde satılan balık kilolarında muazzam bir artış oluyor. 20,000 kilo civarında geçen haldaki balık satış hızlıca 300,000 civarına geliyor.  İkinci durum ise 6 Ekim’de hal açık olmasına rağmen insanlar hala bayramlarını kutlamaya devam ediyorlar, onun için o gün çok az ticaret oluyor.

toplam_kilo

Av yasağı önce hangi balıklar çok satılıyor?

Av yasağı bitince biraz sonra göreceğimiz gibi hamsi, palamut ve istavrit ortaya çıkacak ama yasaktan önceki balık satışlarına bir bakalım. Ağustos ayı boyunca 60 çeşit balık el değiştirmiş ve bunun çoğunluğu ithal uskumru ve ondan sonra karides, çipura, sardalya ve levrek geliyor.

av_yasagi_oncesi

Av mevsimi başlıyor

Av mevsimi başlar başlamaz, hamsi, palamut satışları muazzam şekilde artıyor. Hamsi o kadar çok satılıyor ki av yasağı öncesi en çok satılan Uskumru’nu 300 katı kadar satılıyor. İkinci sırada ise Palamut geliyor. Onları da İstavrit, Lüfer ve mezgit takip ediyor.

eylül_ekim arası

En nadir satılanlar

Halde en nadir satılan balıkları da merak ediyorsanız da ispari, öksüz, pisi, eşkina, yılan, orfoz, pavurya, uskumru, minekop, mazak, karagöz, yaban dili ve sinarit bunların arasında yer alıyor.

Çalışma notları

Sağolsun, belediye günlük satış miktarlarını gün gün olarak sitesine koymuş, aslında bir API hazırlasalar daha hızlı bilgileri toparlayabilirdim ama olmadığı için gün gün bütün balık satışlarının excellerini indirdim, ondan sonra da bunları birleştirdim.

Veri Ağustos’un 1’inden başlıyor ve 17 Ekim’e kadar devam ediyor. Veri devamlılık gösteriyor ama Ağustos ayı içinde pazar günleri ve kurban bayramında aslında hal kapalı ama ben bunu veri de göstermedim.

Veri

Bunlar dışında başka analiz yapmak isterim diyen olursa onlar da buraya tıklayarak veriler ve benim analiz yaptığım excel dosyasına ulaşabilirler. Rastgele!

Twitter’den ilişki analizi

breakupHer tarafımız veri ile dolu ve bu verileri manalaştırma işe ile uğraşan bir çok kişi var. Onlardan bir üçlü de (Garimella, Weber ve Cin) twitter’daki halka açık veriyi ilişkileri anlamak için şu makalede incelemişler.  İnsanoğlu ilginç olduğu için de ilginç sonuçlar çıkıyor (bu arada bu sonuçlar sadece Kanada, ABD ve İngiltere ile ilgili sonuçlar)

Mesela üstteki görsellerden sol taraftaki kelimeler insanlar ilişki halindeyken kullandıkları kelimeler. Bunlar twitter’da açık olduğu için bir nebze insanlar ilanı aşk ediyorlar ve kapıldıklarını (taken) belirtiyorlar.

Maalesef ayrılık olunca sağ taraftaki kelimeler ortaya çıkıyor ve insanlar kendilerini öne çıkarırken ya dinsel ya da tinsel manada bir sığınak arıyorlar ya da hayata küfrediyorlar.

Bunun dışında veriden ayrılığın gelip gelmediğini anlamak mümkün.  Aşağıda üç tane grafik var, kırmızılar ilişkilerin devam ettiği mesajlar ve maviler ilişkilerin sona erdiği mesajlar. 0 noktasında ayrılığın gerçekleştiği zaman. Ayrılığın bir işareti ilişkideki kişilerin arasındaki mesajlaşmanın azalması ve başkaları ile mesajlaşmanın fazlalaşması. Ama bir de toplamdaki mesaj sayısın (en sağdaki grafik) azalması bir belirtibreaking

Daha fazla böyle analizleri nerde bulurum derseniz @Ognyanova yi takip etmenizde fayda var.

 

Agilone – Müşteri Davranışı Tahmin Sistemi

E-ticarette oyunun bir çok adı var ama en önemlilerden biri de ek gelir ve gider olayı (ekonomi’de marjinal return veya attığımız taş ürküttüğümüz kurbağa olayı).

Bunun içinde doğru müşteriye doğru mesajı doğru zamanda göstermek lazım ve Agilone buna yardımcı oluyor. Sitenizde gezen müşterileri davranışlarına göre kümelere ayırıyor (mesela alma olasılığı yüksek veya düşük gibi) ve onlarla iletişiminizi farklı kanallar (facebook, kendi siteniz, e-mail) aracılığı ile yapmanıza yardımcı oluyor. Aşağıdaki 2 dakikalık video aslında epeyce bir fikir verecektir.

Şimdi birileri diyebilir, ya biraz reklam gibi olmuş bu. Evet reklam kısmı var çünkü başında bir Türk var (Ömer Artun) ve bu şirket başarılıya benzediği için (25 Milyon dolar daha yatırım aldılar Nisan 2014 yılında) birazcık reklamını yapmakta zarar olmaz dedik!

Filmlerde metin arama

bookworm

Filmlerde acaba yıllar boyunca kullanılan kelimeler değişiyor mu veya herhangi bir yönetmenin filminde değişiyor mu diye sorularınız varsa http://movies.benschmidt.org/ adresinden bu soruların cevaplarını bulabilirsiniz.

Site Opensubtitles sitesindeki filmlerin altyazılarını taramış, kaydetmiş ve bunları da üstteki gibi bir arayüzü ile arama imkanı sunmuş. Bu arada taranan film sayısı 87,000. Türkçe filmler içinde de arayabiliyorsunuz ama onların sayısı biraz daha az tabiki diğerlerine nazaran.

NYC Taksi Verisi

ABD’de bazı kuruluşlar istek üzerine (NYC gibi) ve bazı kuruluşlarda herhangi bir istek olmadan (data.gov gibi) inanılmaz miktarda veriyi isteyenlerin hizmetine sunuyorlar. Bunu sunmanın en büyük amacı bu kadar verinin zaman olarak işlenmesinin kurum tarafından hem imkansız olması hem de topluluğun içinden çıkacak değişik görüş ve analizleri bir kurum içinde oluşturmanın mümkün olmaması.

New York Şehri taksicilerinin New York şehrine bildirimleri istenilmiş ve alınmış.  Bunlar alınınca da bir arkadaş bunları incelemiş ve şu sonuçları çıkartmış. 

1 yıl içinde 160 milyon dolarlık taksi ücreti ödeniyor ve bunların çoğunluğu (94 milyon doları kredi kartı ve 80 milyon doları nakit ödeniyor)

Ortalama 13 dolar ödeniyor her taksi tutulduğunda ve en çok Cuma günleri taksi kullanılıyor.

Yaz aylarında daha az kullanım var

ve tatil zamanları iniş ve çıkışları görebiliyorsunuz.

Siz 18 GB’ye indirmeye razıysanız, buradan indirip kendi analizinizi de yapabilirsiniz tabiki.

 

NY Times API

The New York Times gazetesi bilgilerini artık bir API üzerinden kullanıcılara ve geliştiricilere sunuyor.

Peki bu ne manaya geliyor derseniz ne tür verileri hazır olarak verdiklerine bir bakalım.
– Makale arama: 1851’den bu yana yayınlanan makalelerin başlıklarını, özetlerini ve foto ve videolarını arayabiliyorsunuz
– En çok satanlar: en çok satanlar listesi ve herhangi bir en çok satan kitabın sıralama tarihçesi
– Yorum: NYTimes.com’a yapılan yorumlar

Yani köklü bir yayın kuruluşunun tarihinde bulunan bir çok veri ve bilgiye ulaşma imkanı ve bu veri ve bilgileri yeni veri ve bilgilere ulaştırma imkanı