Yazan : Şadi Evren ŞEKER
Lineer Cebir (Linear Algebra) konusunda kullanılan ve reel veya kompleks matrisler üzerinde ayrıştırmaya yarayan önemli bir konudur.
Basitçe bir matrisi 3 parçaya ayırarak tutar ve bu üç parçayı kullanarak aynı matrisin yeniden elde edilmesini sağlar.
M = UΣV
U, vahid masfuf (üniter matris, unitary matrix) olmaktadır
V matrisi, M matrisinin birimdik (orthonormal) özelliklerini tutan matristir.
Σ matrisi ise bir köşegen matrisi olup (diagonal matrix) tekil değerleri (singular values) tutmaktadır.
Örnek (Selmirsel’in talebi üzerine ekliyorum)
Örneğin M matrisi olarak aşağıdaki matris verilmiş olsun.
M =
1.0000 | 2.0000 | 3.0000 |
4.0000 | 5.0000 | 6.0000 |
7.0000 | 8.0000 | 9.0000 |
Yukarıdaki bu matrisi, M = UΣV şeklinde çarpanlarına ayıracak ve buradan SVD değeri olan Σ matrisini bulacağız.
U =
-0.2148 | 0.8872 | 0.4082 |
-0.5206 | 0.2496 | -0.8165 |
-0.8263 | -0.3879 | 0.4082 |
Σ =
16.8481 | 0.0000 | 0.0000 |
0.0000 | 1.0684 | 0.0000 |
0.0000 | 0.0000 | 0.0000 |
V =
-0.4797 | -0.7767 | -0.4082 |
-0.5724 | -0.0757 | 0.8165 |
-0.6651 | 0.6253 | -0.4082 |
Yukarıda bulduğumuz bu 3 matrisi çarparsak M matrisi aşağıdaki şekilde , ilk beklediğimiz matris olarak geri bulunur:
U* Σ *VT =
1.0000 | 2.0000 | 3.0000 |
4.0000 | 5.0000 | 6.0000 |
7.0000 | 8.0000 | 9.0000 |
Kodlama
Yukarıda verilen bu matrislerin bulunmasını algoritmik olarak ele alacak olursak, program yazılacak kadar basit bir halde düşünebilmemiz gerekir. SVD hesaplanırken aslında bulunan değer basitçe
M = UΣV değeridir . Bu değeri aşağıdaki şekilde parçalara ayırabiliriz:
M[i][j] şeklindeki iki boyutlu matri için :
= Σi < k U[i][k] * S[k][k] * V[j][k] // M = UΣV ayrımındaki 3 ayrı matris
Yukarıdaki bu eşitlikte S matrisini karekökünün karesi şeklinde yazabiliriz:
S[k][k] = sqrt(S[k][k]) * sqrt(S[k][k]) // bir matrisin karekökünün karesi kendisi olduğuna göre
= Σi < k U[i][k] * sqrt(S[k][k]) * sqrt(S[k][k]) * V[j][k]
Çarpma işlemlerinin öncelikleri eşit olduğu için sondaki ve baştaki çarpmalara öncelik verebiliriz:
= Σi < k (U[i][k] * sqrt(S[k][k])) * (sqrt(S[k][k]) * V[j][k])
S matrisimizin köşegensel (diagonal) bir matris olduğunu yani sadece köşegenindeki değerlerin bulunduğunu bunun dışındaki değerlerin 0 olduğunu hatırlarsak, çarpım işlemini aşağıdaki şekilde basitleştirebiliriz.
= (U[i] * sqrt(Sdiag)T) * (V[j] * sqrt(Sdiag)T)T
Yukarıdaki denklemden faydalanarak tekil değer ayrışımını veren elemanlar aşağıdaki şekilde hesaplanabilir:
U[i] * sqrt(Sdiag)T
= { U[i][0] * sqrt(S[0][0]),
U[i][1] * sqrt(S[1][1]),
…,
U[i][k] * sqrt(S[k][k]) }
Görüldüğü üzere S matrisindeki köşegen değerleri (S[n][n] gibi) U matrisindeki i. satırdaki değerler ile çarpılmıştır.
Burada sqrt fonksiyonu karekök belirtir ve bir matrisin karakökü ile kastedilen aslında matrisin elemanlarının teker teker karekökünün alınmış halidir. S matrisi diyagonal bir matris olduğu için bu elemanların kareköklerinin alınması yeterlidir.
Yukarıdaki son denklemi bulduktan sonra koda geçirmek için yapılması gereken yukarıdaki matrisi hesaplayan bir döngü yazmaktır.
kısa ve net bir açıklama. saat sabahın 3:00 sayenizde rahat uyuyacağım. ama açıklamalı bir örnek süper giderdi.
İyi günler svd yöntemiyle bir matrisin tersi alınabilir mi alınabilirse bu nasıl oluyor.