最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)( 四 )

这里我们同时使用self._reset_session和self._next_observation , 让我们来定义它们 。

交易时段

我们环境的一个重要部分是交易时段的概念 。 如果我们将这个agent部署到外部 , 我们可能永远不会一次运行它超过几个月 。 出于这个原因 , 我们将限制self.df中连续frames的数量 , 我们的agent将连续看到这些帧frames 。

在我们的_reset_session方法中 , 我们首先将current_step重置为0 。 接下来 , 我们将steps_left设置为一个介于1和MAX_TRADING_SESSION之间的随机数 , 现在我们将在代码最前面定义这个随机数 。

最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)

----最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)//----江苏龙网 http://www.jiangsulong.com //

接下来 , 如果我们连续遍历frame , 我们将设置要遍历的整个frame , 否则我们将frame_start设置为self.df中的随机点 , 并创建一个名为active_df的新数frame , 它只是一个切片self.df从frame_start到frame_start+steps_left 。

最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)

----最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)//----江苏龙网 http://www.jiangsulong.com //

本文原始标题为:最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)---来源是:


推荐阅读