ekfmlp.m

来自「.m source file about soft compute.」· M 代码 · 共 97 行

97 行

function [W1, W2, RMSE] = ekfmlp(trn_data, mlp_config, train_opt, disp_opt)
% SEQMLP On-line extended Kalman filter training for MLP with hyperbolic tangent activation. (This is still UNDER CONSTRUCTION!)
%	[W1, W2, RMSE] = ekfmlp(trn_data, mlp_config, train_opt).
%
%	See also MLPDM1 and MLPDM2.

% Roger Jang, Feb 6, 1999

% Set up default input arguments
if nargin < 4, disp_opt = 1; end
if nargin < 3, train_opt = [0.1 0.9 0.1 100]; end
if nargin < 2, mlp_config = [2 2 1]; end
if nargin < 1, trn_data = [-1 -1 -1; -1 1 1; 1 -1 1; 1 1 -1]; end

error_goal = train_opt(1);	% Stop if batch RMSE is below error_goal
eta = train_opt(2);		% Learning rate
alpha = train_opt(3);		% Momentum term
max_epoch = train_opt(4);	% Max. training epochs
in_n = mlp_config(1);		% Number of inputs
hidden_n = mlp_config(2);	% Number of hidden units
out_n = mlp_config(3);		% Number of outputs

weight_range = 0.5;		% Range for initial weights
[data_n, col_n] = size(trn_data);
if in_n + out_n ~= col_n,
	error('Given data mismatches given I/O numbers!');
end
INPUT = trn_data(:, 1:in_n);			% input
TARGET = trn_data(:, in_n+1:in_n+out_n);	% target

% ====== Initialize random weights
W1 = weight_range*2*(randn(in_n+1,hidden_n) - 0.5);	% last row: bias
W2 = weight_range*2*(randn(hidden_n+1,out_n) - 0.5);	% last row: bias
% ====== Initialize zero weights
%W1 = weight_range*2*(zeros(in_n+1,hidden_n) - 0.5);	% last row: bias
%W2 = weight_range*2*(zeros(hidden_n+1,out_n) - 0.5);	% last row: bias
RMSE = -ones(max_epoch, 1);	% Root mean squared error
% ====== Variables for extended Kalman filtering
alpha = 1e6;
W = [W1(:); W2(:)];
param_n = length(W);
P = alpha*eye(param_n, param_n);
lambda = 1;	% Forgetting factor
lambda = 0.999;	% Forgetting factor

for i = 1:max_epoch,
    for j = 1:data_n,
	X0 = INPUT(j,:);
	T = TARGET(j,:);

	% Forward pass
	X1 = tanh([X0 1]*W1);		% Output of layer 1 (hidden layer)
	X2 = tanh([X1 1]*W2);		% Output of layer 2 (output layer)
	F = norm(T-X2);			% Output of a dummy node

	% Backward pass for the output layer
	dF_dX2 = -(T - X2)./F;					% dF/dX1
	dF_dW2 = [X1 1]'*(dF_dX2.*(1+X2).*(1-X2));
	% Backward pass for the hidden layer
	dF_dX1 = dF_dX2.*(1-X2).*(1+X2)*W2(1:hidden_n,:)';	% dF/dX1
	dF_dW1 = [X0 1]'*(dF_dX1.*(1+X1).*(1-X1));

	% ====== Update parameters using online extended Kalman filtering 
	a = [dF_dW1(:); dF_dW2(:)]; 
	y = 0;
	P = (P - P*a*a'*P/(lambda+a'*P*a))/lambda;
	W = W + eta*P*a*(y-a'*W);
	% Reshape the weight vector
	W1 = reshape(W(1:(in_n+1)*(hidden_n)), in_n+1, hidden_n);
	W2 = reshape(W((in_n+1)*(hidden_n)+1:end), hidden_n+1, out_n);
    end
    % Compute the batch RMSE error
    X1 = tanh([INPUT ones(data_n,1)]*W1);% Output of layer 1 (hidden layer)
    X2 = tanh([X1 ones(data_n,1)]*W2);	% Output of layer 2 (output layer)
    diff = TARGET - X2;	% error
    RMSE(i) = sqrt(sum(sum(diff.^2))/length(diff(:)));
    if disp_opt==1, 
	fprintf('epoch %.0f:  RMSE = %.3f\n',i, RMSE(i));
    end
    % Check if finished 
    if RMSE(i)<error_goal, break; end
end

X1
X2
W1
W2

RMSE(find(RMSE==-1)) = [];	% Get rid of extra elements in RMSE.

if disp_opt==1,
	fprintf('\nTotal number of epochs: %g\n', i);
	fprintf('Final RMSE: %g\n', RMSE(i));
	plot(1:length(RMSE), RMSE, '-', 1:length(RMSE), RMSE, 'o');
	xlabel('Epochs'); ylabel('Batch RMSE');
end

ekfmlp.m - 源码说明

本页面展示了「.m source file about soft compute.」中的 ekfmlp.m 源码文件，采用 M 编程语言编写，共 97 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与compute相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?