最新 | 用深度强化学习打造不亏钱的交易机器人（附代码）( 四 ) 原标题：最新

这里我们同时使用self._reset_session和self._next_observation ，让我们来定义它们。

交易时段

我们环境的一个重要部分是交易时段的概念。如果我们将这个agent部署到外部，我们可能永远不会一次运行它超过几个月。出于这个原因，我们将限制self.df中连续frames的数量，我们的agent将连续看到这些帧frames 。

在我们的_reset_session方法中，我们首先将current_step重置为0 。接下来，我们将steps_left设置为一个介于1和MAX_TRADING_SESSION之间的随机数，现在我们将在代码最前面定义这个随机数。

----最新 | 用深度强化学习打造不亏钱的交易机器人（附代码）//----江苏龙网 http://www.jiangsulong.com //

接下来，如果我们连续遍历frame ，我们将设置要遍历的整个frame ，否则我们将frame_start设置为self.df中的随机点，并创建一个名为active_df的新数frame ，它只是一个切片self.df从frame_start到frame_start+steps_left 。

----最新 | 用深度强化学习打造不亏钱的交易机器人（附代码）//----江苏龙网 http://www.jiangsulong.com //

本文原始标题为：最新 | 用深度强化学习打造不亏钱的交易机器人（附代码）---来源是：

最新 | 用深度强化学习打造不亏钱的交易机器人（附代码）( 四 )