Photo by Samuel Zeller on Unsplash

Merhaba! Bu yazımızda Python ile Türkiye’nin iktisadi kalkınma göstergelerine Dünya Bankası’nın sitesinden nasıl erişildiğini öğreneceğiz. Bunun yanında eriştiğimiz verileri düzenleyip, bazılarını görselleştireceğiz. Keyifli Okumalar..

1. Verilerin Düzenlenmesi

Kullanacağımız kütüphaneleri yükleyerek işlemlere başlıyoruz.

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

Dünya Bankası’nın sitesinden Türkiye’ye ait göstergelerin yer aldığı linki alıyorum ve df değişkenine atıyorum. Burada başlıkları daha anlamlı görebilmek için header=2 olarak alınmıştır. İstenilen başlık türüne göre değiştirilebilinir.

Veri kümemizin baştan İlk 2 değerini çağırarak,sütunlarına ve satırlarına bakıyoruz.

Veri analizi aşamalarının önemli noktalardan bir tanesi, verilerin satır ve sütundan nasıl oluştuğunun kontrolü, istenilen verinin çağrılmasının ve görselleştirilmesinin kolay olmasıdır. Verilere baktığımızda gösterge isimlerinin ve kodlarının iki ayrı sütunda oluştuğunu görmekteyiz. Bu görselleştirme ve verilerin çağrılması açısından istediğimiz formata uygundur. Fakat yılların her biri ayrı sütunlarda yer almaktadır. Görselleştirmeyi kolaylaştırmak ve göstergeleri daha kolay anlamak için veri üzerinde bir takım oynamalar yapmamız gerekmektedir.

Bunun için ilk olarak yeni bir boş DataFrame oluşturuyorum. Oluşturduğum for döngüsü ile df datasetimdeki satırların hepsini, sütunlar da ise tüm yılların yer aldığı sütunları seçiyorum. Daha sonra bu satır ve sütunları yeni oluşturduğum df_baz değişkenine atıyorum. df_baz içindeki yılların “Year” lardan ve “Values” lerden oluştuğunu belirttikten sonra .concat() metodu ile birleştiriyorum. Bu işlemi daha iyi bir şekilde anlamak için bu linkteki yazıyı inceleyebilirsiniz.

df_yeni=pd.DataFrame()

for col in df.iloc[:,4:]:

df_baz = df.iloc[:,:4]

df_baz["Year"]=col

df_baz["Values"] = df[col]

df_yeni = pd.concat([df_yeni,df_baz],ignore_index=True)

Elde ettiğim yeni datasetim ise aşağıdaki gibidir. Burada yılların ve değerlerin tek bir sütun olduğunu görmekteyiz.Bu verilerin okunaklılığı ve görselleştirilmesi açısından işimizi kolaylaştıracaktır.

Yeni oluşan Dataset içerisinde NaN değerler mevcuttur.Bu değerlerin temizlenmesi ya da yerine değerler atanması gerekmektedir.Burada değer atamak doğru olmadığından NaN değerleri silmemiz gerekmektedir. Tüm NaN değerleri silerek turkiye değişkenine atıyoruz.

turkiye=df_yeni.dropna()

NaN değerleri sildikten sonra data hakkında özet bilgiler elde etmek istiyorum. Bu özet bilgiler veriyle işlem yaparken işimizi kolaylaştıracaktır. Datasetin özet bilgilerine baktığımızda toplamda 6 sütun ve 2417 satırdan oluştuğunu görmekteyiz. Bunun yanında Country Name, Country Code, Indicator Name, Indicator Code, Year değişkenlerinin object yani strig değerler, Values değişkeninin ise float64 olduğunu görmekteyiz. Fakat "Year" değişkeninin de integer olması gerektiğini biliyoruz.

Year değişkenini integere dönüştürmek için .astype() metodunu kullanıyoruz.

turkiye["Year"] = turkiye["Year"].astype("int")

Özet bilgiye tekrar baktığımızda Year değişkeninin integer olduğunu görmekteyiz.

Yapacağımız bir başka veri düzenlemesi ise göstergelerin kodu ve isimlerinin net bir şekilde gözükmesini sağlamaya yöneliktir. Verikümemizde hangi kodun hangi göstergeye ait olduğunu bulabilmek için ikisini ayrı bir liste yapıp daha sonra .concat() metodu ile birleştiriyorum.

!!!Eğer gösterge ismi ve kodunu karıştırmıyorsanız bu adımı uygulamayabilirsiniz.

liste=[]

for names_item in turkiye["Indicator Name"]:

liste.append(names_item)



liste1=[]

for names_item in turkiye["Indicator Code"]:

liste1.append(names_item) newindicator=pd.DataFrame(liste)

newcode=pd.DataFrame(liste1)

birlesik=pd.concat([newindicator,newcode],axis=1)

Toplamda 22 değişik gösterge olduğu gözükmektedir. O yüzden ilk 22 gösterge ve koduna bakmam işimi kolaylaştıracaktır.

2. Görselleştirme

Bu başlık altında grafiklerdeki karmaşıklığı engellemek için bazı filtrelemeler yapacağız, her bir göstergeyi alanlarına göre ayırıp başlıklandıracağız ve 2000 yılı sonrası kalkınma göstergelerini görselleştireceğiz.

2.1. Demografik Göstergeler

Demografi ile ilgili olduğunu düşündüğümüz tüm göstergeleri kısa ve anlaşılır bir başlığa tanımlıyoruz. Bunun yanında 2000 yılı sonrası için filtreleme yapıyoruz.

Tüm demografik göstergeleri bir arada görmek istediğimden .subplot() metodunu kullanıyoruz. Siz her bir değişkeni ayrı grafiklerde gösterebilirsiniz. Python'da görselleştirme için ayrı bir yazı ele alacağız.

Grafiklere bakılarak kısaca şu yorumlar yapılabilinir; Türkiye’nin 2002 yılından 2018 yılına kadar nüfusu sürekli olarak artış göstermiştir. Fakat nüfus artış oranı 2013 yılından itibaren azalmaya başlamıştır. Bunun yanında doğurganlık oranı ise 2002 yılından 2018 yılına kadar sürekli olarak azalmıştır. Sağlık alanında yaşanan gelişmelerle birlikte doğumda beklenen yaşam süresi artmış, ölüm oranları ise azalmıştır.

2.2. Enerji Göstergeleri

Enerji göstergelerinden farklı örnek olması açısından sadece elektrik tüketimi görselleştirilmiştir. Diğer değişkenleri bu örnekten yola çıkarak istediğiniz şekilde görselleştirebilirsiniz.

Türkiye’nin elektrik tüketimi 2001 yılından 2008 küresel kriz yılına kadar artmaktayken, 2009 yılda azalmıştır. 2009 yılından 2014 yılına kadar ise 2013 yılı hariç sürekli olarak artmıştır.

2.3.Makro Ekonomik Göstergeler

Bu veri kümesinde makro ekonomik göstergeler arasında enflasyon, kişi başına düşen milli gelir ve toplam gayrisafi yurtiçi hasıla yer almaktadır.

Grafiğe bakıldığında kabaca şu yorum yapılabilinir.Enflasyon oranı arttıkça kbdgsyh azalmaktadır.Ya da kişi başına düşen gelir arttıkça, enflasyon oranı azalmaktadır.Burada grafiğe göre yorumlama yapmamız gerekmektedir.Yorumun isabetli olması için teoriye bakılması isabetli olacaktır.

2.4. Dış Ticaret Göstergeleri

Bu bölümde ise dış ticaret göstergeleri olan ithalat ve ihracatın GSYH’a oranını görselleştireceğiz.

2001 yılından sonra Türkiye’nin ihtalat oranı, ihracat oranından fazla olmuştur. Yani Türkiye ithalata bağlı hale gelmiş ve cari açık vermiştir.

Diğer göstergeleri istediğiniz grafik türüyle,yukarıdaki örneklere bakarak kolay bir şekilde görselleştirebilirsiniz.

#KALKINMA

kalkınmayardım=turkiye[(turkiye["Indicator Code"]=='DT.ODA.ODAT.CD') & (turkiye["Year"]>2000)] #TARIM

tarım=turkiye[(turkiye["Indicator Code"]=='NV.AGR.TOTL.ZS') & (turkiye["Year"]>2000)] #SANAYİ

endüstri=turkiye[(turkiye["Indicator Code"]=='NV.IND.TOTL.ZS') & (turkiye["Year"]>2000)] #ASKERİ

askeriharcamalar=turkiye[(turkiye["Indicator Code"]=='MS.MIL.XPND.GD.ZS') & (turkiye["Year"]>2000)] #TEKNOLOJİK

mobil=turkiye[(turkiye["Indicator Code"]=='IT.CEL.SETS.P2') & (turkiye["Year"]>2000)]

Vakit ayırdığınız için teşekkür ederim. Yazının uygulamasına colab hesabımdan direkt olarak ulaşabilirsiniz.

Github & Linkedin : Mert Alabaş

Facebook | Twitter | Instagram | Slack | Kodcular | Editör | Sponsor