lrn_pifa.h

来自「这个代码是policy iteration算法关于强化学习的. 请您用winzi」· C头文件 代码 · 共 20 行

H
20
字号


void Initialize_PGRL_PIFA(void);


void PGRL_PIFA(int steps,
			   double **s, double **g, 
			   double **cen, double **var,
			   int *mode, double alpha, double gamma,
			   double *r);


void Update_Function_Coefficients(int nums, double **Q_a);

void Solve_System(double **A, double *b, double *w, 
				  double *S2, double *c, int rows);

void Update_Policy_Parameters_Using_FA(double **cen, double **var);

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?