stateinfo.java

来自「Reinforcement Learning」· Java 代码 · 共 71 行

JAVA

71 行

import java.util.Vector;

public class StateInfo {
	private Vector[] preds = new Vector[Action.numActions];

	StateActionInfo[] actionSuccs = new StateActionInfo[Action.numActions];
	
	public StateInfo()
	{
		for(int i=0;i<Action.numActions;i++)
		{
			actionSuccs[i] = new StateActionInfo();
			preds[i] = new Vector();
		}
	}
	
	//while adding successor for a state check whether the state already exists 
	public void addSuccs(int action, State st, double reward)
	{
		actionSuccs[action].updateData(st, reward);
	}

	public double getMinQsa()
	{
		double min = actionSuccs[0].qsa;
		
		for (int i=1;i<actionSuccs.length;i++)
				min = (actionSuccs[i].qsa<min) ? actionSuccs[i].qsa : min;
		
		return min;
	}
	
	public int getBestAction()
	{
		int bestAction = 0;	// 0 means first action
		double min = actionSuccs[0].qsa;
		for (int i=1;i<actionSuccs.length;i++) {
			if (actionSuccs[i].qsa<min)
			{
				min = actionSuccs[i].qsa;
				bestAction = i;
			}
		}
		return bestAction;
	}

	//while adding predecessor for a state check whether the state already exists 
	public void addPreds(State st, int action)
	{
		StateAndVisits snv = new StateAndVisits(st);
		int position = preds[action].indexOf(snv);
		if(-1 == position)
			preds[action].add(snv);
		else
		{
			snv = (StateAndVisits)preds[action].get(position);
			snv.incrementVisits();
		}
	}
	
	public Vector getSuccs(int action)
	{
		return actionSuccs[action].succs;
	}
	
	public Vector[] getPreds()
	{
		return preds;
	}
}

stateinfo.java - 源码说明

本页面展示了「Reinforcement Learning」中的 stateinfo.java 源码文件，采用 Java 编程语言编写，共 71 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫开发者社区收录了大量与强化学习相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?