Principal Component Analysis (PCA), Temel Bileşen Analizi

Yazan : Şadi Evren ŞEKER

Bilgisayar bilimlerinde boyut indirmeye yarayan bir yöntemdir. Kısaca iki bilgi arasında bir bağlantı varsa bu bağlantı sayesinde iki veriden birisini tutmak ve bağlantıyı tutmak iki bilginin de geri bulunabilmesini sağlar. Kısaca PCA olarak da ifade edilen bu terime göre bir veri kümesinin (veri matrisinin , data matrix) kovaryans matrisinin (covariance matrix) veya tekil değer çıkarımının (singular value decomposition) yöntemi ile elde edilen basitleştirilmiş halidir.

Kullanımı

Birden fazla boyutun birbiri ile ilişkisi olup olmadığını anlamak için kullanılabilir. Örneğin bir ülkedeki gelir seviyesi, ortalama maaşlar, ev kiraları gibi çok sayıda verinin toplanarak veri madenciliğinde kullanılması mümkündür. Bu veriler üzerinden ülke ile ilgili sonuçlara da ulaşılabilir ancak bütün bu verileri etkileyen daha derinde bazı parametreler bulunabilir. Örneğin eğitim seviyesi, ülkenin ticaret hacmi vs. gibi ve bu temel bileşenlere (principle components) bakılması sayesinde bu temel bileşenlerin etkilediği daha yüzeysel parametrelere bakılması gereksiz hale getirilmiş, veri analizi basitleştirilmiş ve sonuç ile etkiler arasındaki ilişki daha net anlaşılmış olur.

PCA veri kümelerini sadeleştirmenin yanında verilerin birbiri ile olan ilişkisini de ortaya koyabileceği için verilerin sonuca etkilerinin ağırlıklarının hesaplanması için de kullanılabilir.

Örnek

Örneğin bir ülkenin yaşam kalitesini belirleyen bir endeks oluşturmak istiyor olalım. Elimizde yüzlerce farklı veri olabilir. Örneğin ülkedeki petrol fiyatları, döviz rezervi, enflasyon oranı, eğitim seviyesi gibi ülkenin gelişmişliğini veya ülkedeki yaşam kalitesini belirleyen veri bulunabilir. Burada bağlı değişken (dependent variable) ve bağımsız değişken (independent variable) kavramlarını anlamakta yarar vardır. Araştırma sonucunda aslında çoğu verinin diğer verilere bağlı olduğu bulunacak ve nihayetinde bağımsız değişken olarak kişi başı milli gelir, politik istikrar veya cinsiyet eşitliği gibi kavramlara kadar veriler sadeleştirilebilecektir.

 

Yorumlar

  1. mehdi jr.

    aslında şunları bir sıraya koysanız çok güzel olur. mesela prequisite tarzı gibi bunu anlamak için okunacak öncelikli yazılar vs..

mehdi jr. için bir cevap yazın Cevabı iptal et

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir