Проблема Matlab NaN и Inf

Итак, я реализую алгоритм EM в Matlab, но мои матрицы быстро загрязняются значениями NaN и Inf. Я думаю, что это может быть вызвано инверсией матрицы, но я не уверен, что это единственная причина.

Вот код:

function [F, Q, R, x_T, P_T] = em_algo(y, G)
    % y_t = G_t'*x_t + v_t    1*1 = 1*p p*1
    % x_t = F*x_t-1 + w_t     p*1 = p*p p*1
    % G is T*p
    p = size(G,2); % p = nb assets ; G = T*p
    q = size(y,2); % q = nb observations ; y = T*q
    T = size(y,1); % y is T*1
    F = eye(p); % = Transition matrix  p*p 
    Q = eye(p); % innovation (v) covariance matrix p*p
    R = eye(q); % noise (w) covariance matrix q x q
    x_T_old = zeros(p,T);
    mu0 = zeros(p,1);
    Sigma = eye(p); % Initial state covariance matrix p*p
    converged = 0;
    i = 0;
    max_iter = 60; % only for testing purposes
    while ~converged
        if i > max_iter
            break;
        end
        % E step = smoothing
        fprintf('Iteration %d\n',i);
        [x_T,P_T,P_Tm2] = smoother(G,F,Q,R,mu0,Sigma,y);
        %x_T

        % M step 
        A = zeros(p,p);
        B = zeros(p,p);
        C = zeros(p,p);
        R = eye(q);

        for t = 2:T % eq (9) in EM paper
            A = A + (P_T(:,:,t-1) + (x_T(:,t-1)*x_T(:,t-1)'));
        end

        for t = 2:T % eq (10)
            %B = B + (P_Tm2(:,:,t-1) + (x_T(:,t)*x_T(:,t-1)'));
            B = B + (P_Tm2(:,:,t) + (x_T(:,t)*x_T(:,t-1)'));
        end

        for t = 1:T %eq (11)
            C = C + (P_T(:,:,t) + (x_T(:,t)*x_T(:,t)'));
        end    

        F = B*inv(A); %eq (12)
        Q = (1/T)*(C - (B*inv(A)*B')); % eq (13)  pxp 

        for t = 1:T
            bias = y(t) - (G(t,:)*x_T(:,t));
            R = R + ((bias*bias') + (G(t,:)*P_T(:,:,t)*G(t,:)'));
        end
        R = (1/T)*R;

        if i>1            
            err = norm(x_T-x_T_old)/norm(x_T_old);
            if err < 1e-4
                converged = 1;
            end            
        end  
        x_T_old = x_T;
        i = i+1;
    end
    fprintf('EM algorithm iterated %d times\n',i);
end

Это повторяется до сходимости (чего никогда не происходит из-за моей проблемы) и вызывает smoother.m на каждой итерации:

function [x_T, P_T, P_Tm2] = smoother(G,F,Q,R,mu0,Sigma,y)
    % G is T*p
    p = size(mu0,1); % mu0 is p*1
    T = size(y,1); % y is T*1
    J = zeros(p,p,T);
    K = zeros(p,T); % gain matrix
    x = zeros(p,T);
    x(:,1) = mu0;
    x_m1 = zeros(p,T);
    x_T = zeros(p,T); % x values when we know all the data
    % Notation : x = xt given t ; x_m1 = xt given t-1 (m1 stands for minus
    % one)
    P = zeros(p,p,T);% array of cov(xt|y1...yt), eq (6) in Shumway & Stoffer 1982
    P(:,:,1) = Sigma;
    P_m1 = zeros(p,p,T); % Same notation ; = cov(xt, xt-1|y1...yt) , eq (7)
    P_T = zeros(p,p,T);
    P_Tm2 = zeros(p,p,T); % cov(xT, xT-1|y1...yT)

    for t = 2:T %starts at t = 2 because at each time t we need info about t-1
        x_m1(:,t) = F*x(:,t-1); % eq A3 ; pxp * px1 = px1
        P_m1(:,:,t) = (F*P(:,:,t-1)*F') + Q; % A4 ; pxp * pxp = pxp

        if nnz(isnan(P_m1(:,:,t)))
            error('NaNs in P_m1 at time t = %d',t);
        end
        if nnz(isinf(P_m1(:,:,t)))
            error('Infs in P_m1 at time t = %d',t);
        end

        K(:,t) = P_m1(:,:,t)*G(t,:)'*pinv((G(t,:)*P_m1(:,:,t)*G(t,:)') + R); %A5 ; pxp * px1 * 1*1 = p*1
        %K(:,t) = P_m1(:,:,t)*G(t,:)'/((G(t,:)*P_m1(:,:,t)*G(t,:)') + R); %A5 ; pxp * px1 * 1*1 = p*1

        % The matrix inversion seems to generate NaN values which quickly
        % contaminate all the other matrices. There is no warning about
        % (close to) singular matrices or whatever. The use of pinv()
        % instead of inv() seems to solve the problem... but I don't think
        % it's the appropriate way to deal with it, there must be something
        % wrong elsewhere

        if nnz(isnan(K(:,t)))
            error('NaNs in K at time t = %d',t);
        end


        x(:,t) = x_m1(:,t) + (K(:,t)*(y(t)-(G(t,:)*x_m1(:,t)))); %A6
        P(:,:,t) = P_m1(:,:,t) - (K(:,t)*G(t,:)*P_m1(:,:,t)); %A7
    end

    x_T(:,T) = x(:,T);
    P_T(:,:,T) = P(:,:,T);

    for t = T:-1:2 % we stop at 2 since we need to use t-1
        %P_m1 seem to get really huge (x10^22...), might lead to "Inf"
        %values which in turn might screw pinv()

        %% inv() caused NaN value to appear, pinv seems to solve the issue

        J(:,:,t-1) = P(:,:,t-1)*F'*pinv(P_m1(:,:,t)); % A8 pxp * pxp * pxp  
        %J(:,:,t-1) = P(:,:,t-1)*F'/(P_m1(:,:,t)); % A8 pxp * pxp * pxp  
        x_T(:,t-1) = x(:,t-1) + J(:,:,t-1)*(x_T(:,t)-(F*x(:,t-1))); %A9  % Becomes NaN during 8th iteration!
        P_T(:,:,t-1) = P(:,:,t-1) + J(:,:,t-1)*(P_T(:,:,t)-P_m1(:,:,t))*J(:,:,t-1)'; %A10

        nans = [nnz(isnan(J)) nnz(isnan(P_m1)) nnz(isnan(F)) nnz(isnan(x_T)) nnz(isnan(x_m1))];  
        if nnz(nans)
            error('NaN invasion at time t = %d',t);
        end
    end

    P_Tm2(:,:,T) = (eye(p) - K(:,T)*G(T,:))*F*P(:,:,T-1); % %A12

    for t = T:-1:3 % stop at 3 because use of t-2
       P_Tm2(:,:,t-1) = P_m1(:,:,t-1)*J(:,:,t-2)' + J(:,:,t-1)*(P_Tm2(:,:,t)-F*P(:,:,t-1))*J(:,:,t-2)'; % A11
    end
end

NaNs и Infs начинают появляться примерно на ~8й итерации.

Я предполагаю, что где-то там я делаю что-то нечестивое со своими матрицами, но я действительно понятия не имею, что не так. Я доверяю вашему опыту.

Заранее спасибо за помощь.


Роди: Вот как я генерирую данные (это еще не данные «реального мира», просто некоторые тестовые данные, сгенерированные для проверки того, что все идет не так):

T = 500;
nbassets = 3;
G = .1 + randn(T,nbassets); % random walk trajectories
y = (1:T).';
y = 1.01.^y; % 1 * T % Exponential 1% returns curve

Дэн: Ты прав. Мне действительно не хватает математического образования, чтобы понять, как выводятся формулы. Я знаю, что это не помогает, но я не уверен, что смогу исправить это на данный момент. :/


Роди: Да, действительно, я пришел к такому же выводу. Но я действительно понятия не имею, что заставляет это идти не так, как надо.

Вот ссылка на документ: http://www.stat.pitt.edu/stoffer/em.pdf

Формулы для сглаживателя все в самом конце, в приложении. Спасибо за ваше время до сих пор.


person jerorx    schedule 20.11.2012    source источник
comment
Вы можете и должны вставлять код прямо в свой вопрос.   -  person slayton    schedule 20.11.2012
comment
Вы можете запустить его с dbstop if naninf Таким образом, вы сможете быстро увидеть, когда это происходит в первый раз, и отследить, почему это происходит.   -  person Dennis Jaheruddin    schedule 20.11.2012
comment
При редактировании вашего вопроса я несколько раз видел всплывающее окно inv(A). Никогда, никогда, никогда, НИКОГДА никогда не используйте inv() напрямую!! Это медленно, неточно, ненадежно и т. д. и т. д. Используйте декомпозицию LU и/или оператор обратной косой черты.   -  person Rody Oldenhuis    schedule 20.11.2012
comment
Можете ли вы привести примеры входных данных y и G?   -  person Rody Oldenhuis    schedule 20.11.2012
comment
Совет Дениса очень хороший. Но комментарий в вашем коде inv() вызвал появление значения NaN, pinv, кажется, решает проблему, это большой красный флаг, что вы действительно не понимаете, что делает этот код и/или алгоритм (в этом нет ничего плохого, происходит с нас всех!). Поэтому я бы посоветовал сделать шаг назад и подумать о том, что этот алгоритм должен делать и какова цель инверсии матрицы. Некоторые дополнительные размышления могут быть всем, что требуется для решения этой проблемы.   -  person Dan Becker    schedule 20.11.2012


Ответы (1)


Поскольку пользователь, похоже, вставил ответ в свой вопрос, я опубликую его здесь:

Как упоминал @Rody, причина проблемы заключалась в том, что использование inv создавало значения NaN или Inf.

Пользователь «решил» это, используя вместо этого pinv.

person Dennis Jaheruddin    schedule 13.02.2013