...
首页> 外文期刊>電子情報通信学会技術研究報告 >Distributed Lightpath Establishment based on Reinforcement Learning in WDM Networks: On Providing Service Differentiation and Effective Wavelength Utilization
【24h】

Distributed Lightpath Establishment based on Reinforcement Learning in WDM Networks: On Providing Service Differentiation and Effective Wavelength Utilization

机译:WDM网络中基于强化学习的分布式光路建立:提供服务差异化和有效的波长利用

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,WDMネットワークの光パス交換に強化学習を適用し,サービスの差別化と波長の有効利用を実現する方式を提案する.提案方式では,強化学習の-手法であるQ学習を用い,光パス設定要求が到着するとこれまでの学習で得られている最も有効な行動に従って光パスの設定可否を決定する.その後,現在の状態と選択した行動を基に学習を行い,学習が十分に行われるとサービスの差別化と波長の有効利用が実現される.本方式は波長多重数やサービスクラス数が増加した場合にも適用が可能であり,光パス設定の到着過程や使用時間分布に仮定を置く必要がない.また,提案方式がGMPLSにどのように適用されるかについて検討する.提案方式の性能をシミュレーションで評価し,数値例において学習時間と学習パラメータが提案方式の性能に与える影響について検討する.さらに提案方式の有効性を評価し,提案方式が利用可能な波長数についても調査する.%In our proposed method, each node utilizes Q-learning, which is one of the reinforcement learning tech­niques, and when a new lightpath establishment request arrives, the node decides whether the lightpath request should be accepted or rejected according to the most effective action. Then, the node learns the optimal action based on the current state and the used action. After the adequate learning, the node can provide the service differentiation and the effective wavelength utilization. This method can be available when the number of wave­lengths and the number of classes are large without the assumptions about the lightpath arrival process and the distribution of the lightpath holding time. We also discuss how the proposed method is used with Generalized Multi-Protocol Label Switching (GMPLS). We evaluate the performance of the proposed method with simulation. Prom numerical examples, we show the impacts of learning time and learning parameters on the performance of the proposed method. In addition, we evaluate the effectiveness of the proposed method and investigate the number of wavelengths with which our proposed method can be available.
机译:在本文中,我们提出了一种将强化学习应用于WDM网络中的光路交换的方法,以实现服务差异化和有效的波长利用率。在所提出的方法中,使用了作为强化学习的方法的Q学习,并且当光路设置请求到达时,根据到目前为止学习所获得的最有效的动作来确定是否设置光路。此后,基于当前状态和所选动作执行学习,并且如果充分执行学习,则可以实现服务区分和波长的有效利用。即使波分复用的数量或服务类别的数量增加,也可以应用该方法,并且不必对光路设置的到达过程或使用时间的分布进行假设。我们还将讨论所提出的方法如何应用于GMPLS。通过仿真评估了所提方法的性能,并在数值例子中研究了学习时间和学习参数对所提方法性能的影响。此外,我们评估了该方法的有效性,并研究了该方法可以使用的波长数量。 %在我们提出的方法中,每个节点都获得Q学习,这是强化学习技术之一,当新的光路建立请求到达时,该节点根据最有效的动作来决定应接受还是拒绝光路请求。然后,节点根据当前状态和所使用的动作来学习最佳动作,经过充分学习后,节点可以提供服务区分和有效的波长利用率。在没有关于光程到达过程和光程保持时间分布的假设的情况下,此类类别很大。我们还讨论了该方法如何与广义多协议标签交换(GMPLS)结合使用,并通过仿真评估了该方法的性能.prom数值例子,我们显示了学习时间和学习参数对提出的我的表现的影响。此外,我们评估了该方法的有效性,并研究了可用于该方法的波长数量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号