stateactioninfo.java

来自「Reinforcement Learning」· Java 代码 · 共 61 行

JAVA

61 行

/*
 * Created on Dec 21, 2004
 *
 * TODO To change the template for this generated file go to
 * Window - Preferences - Java - Code Style - Code Templates
 */

/**
 * @author ryk
 *
 * TODO To change the template for this generated type comment go to
 * Window - Preferences - Java - Code Style - Code Templates
 */
import java.util.Vector;

public class StateActionInfo {

	int actionCounter;	//maintains the number of times this action has been taken
	Vector succs;		//maintains successors of this state and numofvisits to each successor	
	double totalReward;
	double qsa;			//q-value associated with this this action 
	
	//constructor for predecessor and successor
	public StateActionInfo()
	{
		actionCounter = 0;
		succs = new Vector();
		qsa = 0;
		totalReward = 0;
	}
	
	public void updateData(State succSt, double reward)
	{
		totalReward += reward;
		actionCounter+=1;
		addSuccessor(succSt);
	}
	
	private void addSuccessor(State succSt)
	{
		StateAndVisits snv = new StateAndVisits(succSt);
		int positionOfNext = succs.indexOf(snv);

		if(-1 == positionOfNext)
			succs.add(snv);
		else
		{
			snv = (StateAndVisits)succs.get(positionOfNext);//snv points to that particular element in the vector
			snv.incrementVisits();
		}
	}

	public double getReward()
	{
		if(totalReward==0)
			return 0;
		
		return totalReward/actionCounter;
	}
}

stateactioninfo.java - 源码说明

本页面展示了「Reinforcement Learning」中的 stateactioninfo.java 源码文件，采用 Java 编程语言编写，共 61 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫开发者社区收录了大量与强化学习相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?