Grafikler

Veri bilimi, karmaşık veri setlerinden anlamlı bilgiler çıkarmak için çeşitli teknikler ve araçlar kullanır. Bu tekniklerden biri de grafiklerdir. Grafikler, verileri görsel olarak temsil ederek, desenleri ortaya çıkarır, ilişkileri gösterir ve bilgileri daha anlaşılır hale getirir.

Alluvial Diagram

Zamanla değişen kategorik değişkenler arasındaki ilişkileri göstermek için tercih edilirler. Değişkenler paralel olarak dikey eksene atanır. Değerler her eksende bloklarla gösterilir. Blok yüksekliği küme boyutunu, aradaki bağlantı yolu ise her iki blokta yer alan bileşenlerin boyutunu gösterir.

Sankey Diagram

Akışları, ilişkileri ve kitleleri göstermek için kullanılır. Örneğin enerji akışları, bütçe dağılımları, materyal akışları, proses ilişkileri, kaynak dağılımı, bir sistemdeki akışlar vb. Okların kalınlığı akış miktarın, işlemler arasındaki ilişkiyi veya kaynakların dağılımı gösterir. Okların yönü, akışın hangi yönde olduğunu gösterir.

Donut Chart

Pie chart’a benzer fakat ortası boştur. Kategorik bir bütünün parçalarının oransal dağılımını gösterir. Dilimi büyük olanın oransal dağılımı fazladır.

Line Graph

Sürekli bir değişkenin belirli aralıklarla ölçülen veya zamanla değişen değerlerini göstermek için kullanılır.

Radial Bar Chart

Birbirine bağlı veya ilişkili kategorik verileri karşılaştırmak için kullanılır.

Polar Area Chart

Verilerin oransal dağılımını göstermek için kullanılır.

Bar Chart

Kategorik verilerin sayısal değerlerini göstermek için kullanılır.

Radial Histogram

Özellikle dairesel veya halka şeklindeki veri yapısını vurgulamak ve veri setinin yoğunluk veya dağılımını görsel olarak göstermek için kullanılır.

Sunburst Diagram

Bir bütün parçalarını ve parçaların hiyerarşik yapılarını göstermek için kullanılır. Kategorik verilerin alt kategorilerle ilişkisini ve her bir kategorinin toplam içindeki oransal büyüklüğünü vurgulamak için tercih edilir.

Treemap

Hiyerarşik verileri dikdörtgen kutuların alanları olarak görselleştiren bir grafik türüdür. Bir bütünün parçalarını ve parçaların hiyerarşik yapılarını göstermek için kullanılır.

Heatmap

Sayısal verilerin yoğunluğu veya ilişkilerini renklerle göstermek için kullanılır. Her bir hücre, veri setindeki bir iki değişken arasındaki ilişki değerini temsil eder.

Stacked Bar Chart

Kategorik verilerin karşılaştırılması için kullanılır. Farklı kategoriler içindeki alt kategorilerin değerlerini karşılaştırmak için kullanılır.

Chord Diagram

İlişkisel verileri ve bu veriler arasındaki bağlantıları daire içindeki yaylarla gösterir.

Choropleth Map

Belirli bir coğrafi alandaki veri desenlerini, dağılımları veya farklılıkları görsel olarak anlamak için kullanılır.

Radial Line Graph

Genellikle zaman içinde değişen veya belirli bir dönemde farklı bir kategoriler arasındaki ilişkiyi göstermek için kullanılır. Her bir çizgi, bir kategori veya değişkeni, çizgilerin uzunlukları veri değerlerini temsil eder.

Bubble Map

Coğrafi bölgelerin veya noktaların harita üzerinde farklı büyüklükte veya renklerde dairelerle temsil edildiği bir harita türüdür.

Bubble Chart

İki değişken arasındaki ilişkiyi gösteren bir scatter plot ile birlikte üçüncü bir değişkenin büyüklüğünü veya yoğunluğunu da gösterir. Her bir nokta bir veri noktasını temsil ederken, noktanın büyüklüğü veya renk tonu üçünü değişkeni gösterir.

Violin Plot

Box plot dağılım özelliklerini daha ayrıntılı bir şekilde gösterir. Her bir violin plot, verinin yoğunluk dağılımını gösteren bir çizgi plot ile birlikte simetriği bozulmuş bir kutu grafikten oluşur. Genellikle sayısal veri setlerindeki dağılımları veya gruplar arasındaki farklılıkları görselleştirmek için kullanılır. Özellikle veri dağılımının genel yapısal özellikleri, merkezi eğilim, değişkenlik ve simetriği hakkında bilgi verir. Daha geniş bölgelerde daha fazla veri bulunur. İçindeki kutu grafik, verinin dört çeyreği ve medyanı temsil eder. Gruplar arasındaki veri dağılımını ve merkezi eğilim farklarını hızlıca karşılaştırmak için kullanılır.

Box Plot

Sayısal veri setlerinin dağılımını, merkezi eğilimini ve değişkenliğini görselleştirmek için kullanılan bir grafik türüdür. Veri setinin beş numaralı özeti (five number summary: minimum, birinci çeyrek, medyan, üçüncü çeyrek, maksimum) üzerine odaklanır. Gruplar arasındaki farklılıkları karşılaştırmak veya aykırı değerleri belirlemek için kullanılır. Kutunun alt sınırı birinci çeyrek (Q1), üst sınırı üçüncü çeyrek (Q3), ortadaki çizgi medyanı temsil eder. Kutunun uzunluğu verinin çeyrekler arası genişliğini (verinin yayılımını) gösterir. Aykırı değerler, alt veya üst sınırın dışında yer alan noktalar olarak gösterilir.

Stacked Area Chart

Zamanla değişen kategorik verilerin toplamını veya oransal dağılımını görselleştirmek için kullanılır. Grafiğin üst kısmındaki toplam alan, tüm kategorilerin toplam değerini gösterir.

Gantt Chart

İş akışı sürecindeki görevlerin, aktivitelerin veya işlerin zaman içindeki ilerleyişini ve zamanlamasını temsil eder. Her bir çubuğun uzunluğu görevin ne kadar sürede tamamlanacağını gösterir. Çubukların başlangıç ve bitiş zamanları, ilgili görevlerin zamanlamasını gösterir.

Dot Plot

Her bir veri noktasını temsil etmek için noktalar kullanılır. Kategorik veya sayısal verilerin frekanslarını veya değerlerini görselleştirmek için kullanılır. Noktaların yoğun olduğu bölgeler, o değerin veri setinde daha sık veya yoğun olduğunu gösterir. Veri setinin dağılımını anlamak için kullanılır.

Scatter Plot

İki sayısal değişken arasındaki ilişkiyi görselleştirmek için kullanılır. Veri noktalarının dağılımını, korelasyonu veya ilişkiyi görsel olarak göstermek için kullanılır. Eğer noktalar bir doğru veya belirli bir modele yakınsa, bu iki değişken arasında pozitif veya negatif bir korelasyon olduğunu gösterebilir. Eğer noktalar rastgele ve yayılmışsa, iki değişken arasında belirgin bir ilişki olmayabilir.

Histogram

Bir veri setinin dağılımını göstermek için kullanılır. Özellikle sayısal verilerin frekans dağılımını incelemek için kullanılır. Veri setinin değerlerini belirli aralıklara böler ve her aralıktaki gözlem sayısını gösterir. Her bir sütun, belirli bir değer aralığındaki gözlem sayısını ifade eder.

Waterfall Chart

Bir başlangıç noktasından başlayarak ardışık artışları veya azalışları görsel olarak temsil etmek için kullanılır. Her bir çubuk önceki değerin üzerine eklenir veya azalır ve toplam sonuca ulaşır. Pozitif değerler artışları, negatif değerler ise azalışları gösterir.

Convex Treemap

Verileri hiyerarşik bir yapıda görselleştirmek için kullanılır.

Bullet Graph

Genellikle karşılaştırmalar yapmak için kullanılır. Özellikle hedeflerle gerçekleşen değerler arasındaki ilişkiyi göstermek için tercih edilir. İlgili değeri, hedefi ve gereken minimum-maksimum değer aralığını gösteren bir çizgi grafiği ve bir bar grafiğinden oluşur.

Pareto Chart

Veri setindeki farklı kategorilerin katkısını ve önemini belirlemek için kullanılır. Pareto prensibi, belirli bir grubun toplamda katkısının genellikle tüm sonucun büyük bir kısmını oluşturduğunu öne sürer. Pareto chart, bu prensibi görselleştirir.

Candlestick Chart

Finansal piyasalardaki fiyat hareketlerini görselleştirmek için kullanılır. Her bir mum, belirli bir zaman aralığındaki açılış, kapanış, en yüksek ve en düşük fiyatları gösterir. Her bir mumum gövdesi, açılış ve kapanış fiyatlarını, üst ve alt fitiller ise en yüksek ve en düşük fiyatları temsil eder. Mumların rengi kapanış fiyatlarının açılış fiyatından yüksek veya düşük olmasına göre değişir

Contour Plot

Üçüncü bir boyuttaki veri setlerini görselleştirmek için kullanılır. x ve y eksenlerindeki değerlerle ilişkilendirilmiş bir z-değeri ile temsil edilir. Bu grafik, eşit z değerlerinin eşit yükseklikte olduğu hatları gösterir. Böylece bir yüzeyin eşit yükseklikteki noktalarının bir haritasını sunar. Kontur çizgileri aynı z değerine sahip noktaları birleştirir. Çizgilerin yoğunlaştığı bölgelerde, yüzeyin o noktasında z değerlerinin daha yüksek veya düşük olduğu anlaşılır.

Kagi Chart

Finansal piyasalarda fiyat hareketlerini temsil etmek için kullanılır. Zaman aralıklarındaki fiyat değişimlerini gösterirken, trendleri vurgulamak için kullanılır. Diğer finansal grafik türlerinden farklı olarak, zaman yerine fiyat değişimlerine dayalı olarak oluşturulur. Yüksek ve düşük fiyatlar arasındaki değişimler, trendin yönünü ve gücünü göstermek için belirli kurallara göre çizgi grafiklerle temsil edilir.

RainCloud Plot

Box Plot, Strip Plot ve KDE Plot’u tek bir grafikte gösterir.

Span Chart

Verilerin zaman göre değişimini gösterme için kullanılır. Bir zaman aralığındaki değerlerin üst ve alt sınırlarını belirtirken, ortalamasını da gösterir.

Spline Graph

Eğri veya kavisli hatlarla verileri görselleştirir. Veri noktaları arasında yumuşak bir geçiş oluşturarak veri setindeki genel trendi gösterir.

Slope Chart

İki farklı zaman veya kategori noktası arasındaki bağlantıları ve değişiklikleri göstermek için kullanılır.

Butterfly Chart

Bir ana kategorinin alt kategorilerinin performansını gösterirken her alt kategorinin iki yönlü (olumlu ve olumsuz) etkilerini vurgular.

Renko Chart

Fiyat hareketlerini görselleştirmek için kullanılır. Zamanı dikkate almaz ve sadece fiyat hareketlerine dayanarak bloklar oluşturur. Her bir blok, fiyatın belirli bir miktar veya eşik değerinde değiştiği durumları temsil eder.

Marimekko Chart

Kategorik verilerin hem yüzde dağılımlarını hem de toplam büyüklüklerini göstermek için kullanılır. Blokların genişliği temsil edilen kategorilerin yüzde dağılımlarını, blokların yüksekliği toplam büyüklükleri gösterir.

3D Scatter Plot

Üç boyutlu uzayda verilerin dağılımlarını görselleştirir. Üç farklı değişkenin birbirine göre ilişkisini göstermek için kullanılır. Her bir nokta, üç farklı değişkenin belirli bir kombinasyonunu temsil eder.

Fan Chart

Gelecekteki belirsizliği ve değişkenliği göstermek için kullanılır. Tahminlerin olası farklı senaryolarını göstermek için kullanılır. Zaman serileri üzerinde kullanılır ve belirli bir zaman aralığındaki muhtemel değerlerin aralığını vurgular. Çizgi grafiği ile gösterilen belirsizlik aralığı, gelecekteki muhtemel değerlerin aralığını vurgular.

Dendrogam

Hiyerarşik kümeleme analizlerinde kullanılır. Benzer özelliklere sahip veri noktalarını veya gözlemleri gruplar. Yatay çizgi ne kadar uzunsa, o gözlemler arasındaki benzerlik o kadar düşüktür. Veri setindeki farklı düzeylerdeki grupların birbiriyle nasıl ilişkilendiğini veya nasıl birbirinden ayrıldığını gösterir.

Jitter Plot

Veri noktalarının yoğun olduğu alanlarda, özellikle kategorik verilerle çalışırken noktaların üst üste gelmesini önlemek ve dağılımı daha iyi görselleştirmek için kullanılır. Her bir nokta, kategorik bir değişkenin değeriyle ilişkilendirilen sürekli bir değişkenin değerini temsil eder.

Strip Plot

Kategorik bir değerle ilişkilendirilmiş sürekli bir değişkenin dağılımını göstermek için kullanılır. Her bir veri noktasını yatay bir eksen boyunca düzenler ve kategorik değişkenin değerlerine göre dağılımı görselleştirir.