首页> 中国专利> 最优化系统和最优化方法

最优化系统和最优化方法

摘要

使用模拟退火法对参数进行最优化的最优化系统(1)的特征在于,具备:条件设定部(41),设定包括所使用的温度、作为评价对象的参数的参数候选以及测定时间的条件,该测定时间是测定用于评价参数候选的代价函数的评价值的时间;评价部(31),使用所设定的条件测定评价值;采用与否判定部(42),基于评价值判定参数候选的采用与否;以及结束判定部(43),判定是否满足预先决定的结束条件,在直到满足结束条件为止重复进行包括条件的设定、评价值的测定以及参数候选的采用与否判定的评价处理,条件设定部(41)在每当重复评价处理时,基于在该评价处理中使用的温度,决定测定时间。

著录项

  • 公开/公告号CN112262397A

    专利类型发明专利

  • 公开/公告日2021-01-22

    原文格式PDF

  • 申请/专利权人 三菱电机株式会社;

    申请/专利号CN201880093937.4

  • 发明设计人 秋山祐治;

    申请日2018-06-05

  • 分类号G06N3/00(20060101);

  • 代理机构11038 中国贸促会专利商标事务所有限公司;

  • 代理人金春实

  • 地址 日本东京

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本发明涉及一种使用模拟退火法(simulated annealing)的最优化系统和最优化方法。

背景技术

对具有多个参数的系统进行最优化的方法被称为组合最优化问题。作为组合最优化问题的解法中的重视收敛速度的解法,可列举如最速下降法那样的梯度下降法。然而,梯度下降法具有依赖于搜索初始值而陷入局部最优的可能性高这样的严重的缺点。

对此,在非专利文献1中公开了使用模拟退火法的最优化方法。模拟退火法是如下方法:通过重复进行从参数空间中选择参数候选、对选择出的参数候选进行评价并基于评价值判定参数的采用与否的评价处理,来对多个参数的组合进行最优化。在模拟退火法中,在初期扩大选择参数候选时的概率分布来对参数空间的大范围进行搜索,逐渐向能量低的区域缩小搜索范围。因此,能够降低依赖于搜索初始值而陷入局部最优的可能性。在模拟退火法中,在搜索范围的控制中使用被称为“温度”的参数。温度取0以上的实数,越是高温则搜索范围越大。

非专利文献1:S.Kirkpatrick,C.D.Gelatt Jr.,M.P.Vecchi,Optimization bySimulated Annealing,Science,New Series,Vol.220,No.4598.(May 13,1983),pp.671-680

发明内容

发明要解决的问题

然而,在上述非专利文献1所公开的使用模拟退火法的最优化方法中,存在最优化中花费时间这样的问题。

本发明是鉴于上述情况而完成的,目的在于得到一种能够缩短最优化所花费的时间的最优化系统。

用于解决问题的方案

为了解决上述问题并达到目的,本发明的最优化系统是一种使用模拟退火法对参数进行最优化的最优化系统,其特征在于,具备:条件设定部,设定包括所使用的温度、作为评价对象的参数的参数候选以及测定时间的条件,该测定时间是测定用于评价参数候选的代价函数的评价值的时间;评价部,使用所设定的条件测定评价值;采用与否判定部,基于评价值判定参数候选的采用与否;以及结束判定部,判定是否满足预先决定的结束条件,直到满足结束条件为止重复进行包括条件的设定、评价值的测定以及参数候选的采用与否判定的评价处理,条件设定部在每当重复评价处理时,基于在该评价处理中使用的温度决定测定时间。

发明的效果

本发明所涉及的最优化系统起到能够缩短最优化所花费的时间这样的效果。

附图说明

图1是表示本发明的实施方式1所涉及的最优化系统的结构的图。

图2是表示由图1所示的最优化系统进行最优化的对象的参数与代价函数的评价值的关系的图。

图3是表示图1所示的最优化系统所使用的温度与测定时间的关系的图。

图4是表示图1所示的最优化系统的动作的流程图。

图5是表示本发明的实施方式2所涉及的最优化系统的动作的流程图。

图6是表示实施方式2所涉及的最优化系统的最优化处理的经过时间与信噪比的关系的图。

图7是表示实施方式2所涉及的最优化系统的最优化处理的步骤数与信噪比的关系的图。

图8是表示本发明的实施方式3所涉及的最优化系统的结构的图。

图9是表示本发明的实施方式4所涉及的最优化系统的结构的图。

图10是表示实施方式1至4的处理电路的图。

图11是表示实施方式1至4的控制电路的图。

图12是表示图1所示的最优化系统的变形例的图。

图13是表示图8所示的最优化系统的变形例的图。

(附图标记说明)

1、2、3、4:最优化系统;10:发送器;20:发送滤波器;30:接收器;31:评价部;40:采样器;41:条件设定部;42:采用与否判定部;43:结束判定部;50:接收滤波器;60:模拟器。

具体实施方式

以下,基于附图详细说明本发明的实施方式所涉及的最优化系统和最优化方法。此外,不是由该实施方式限定本发明。

实施方式1.

图1是表示本发明的实施方式1所涉及的最优化系统1的结构的图。最优化系统1具有发送器10、发送滤波器20、接收器30以及采样器(sampler)40。

最优化系统1使用模拟退火法,对从发送器10经由发送滤波器20向接收器30传送信号的通信路径中使用的参数进行最优化。在此,作为最优化的对象的参数例如是通信路径的调整参数,能够包括发送滤波器20的滤波器系数。最优化系统1重复进行如下评价处理:基于按照温度进度表变化的温度T,选择参数候选p

发送器10根据发送信息生成发送信号序列。发送器10将生成的发送信号序列输入到发送滤波器20。发送滤波器20对输入的发送信号序列进行滤波来整形。发送滤波器20将整形后的发送信号序列输出到与接收器30连接的通信路径。发送滤波器20例如是FIR(Finite Impulse Response:有限脉冲响应)滤波器。发送器10使用由后述的采样器40设定的参数候选p

接收器30接收经由发送滤波器20和通信路径从发送器10传送的发送信号序列。接收器30基于接收到的发送信号序列生成接收信息。接收器30具有评价部31。评价部31使用测定时间τ对评价值E(p

采样器40是从对象的参数空间中对参数候选p

采用与否判定部42使用条件设定部41所设定的条件,基于在进行了从发送器10向接收器30的信号的传送时测定出的代价函数的评价值E(p

图2是表示由图1所示的最优化系统1进行最优化的对象的参数p与代价函数的评价值E(p)的关系的图。参数p是最优化系统1的最优化处理的对象。关于参数p,在图2中以1维进行模式化来表示,但是一般是在由多个轴构成的多维空间内表示的值。评价值E(p)是标量值。参数p(t)是当前的时刻t或步骤t中的已采用的参数p的值。参数候选p

另外,关于作为从参数p(t)转移到参数p(t+1)的概率的参数转移概率P(ΔE),依赖于参数p(t)下的代价函数的评价值E(p)与参数p(t+1)下的代价函数的评价值E(p)的差分ΔE以及温度T来决定。

在模拟退火法中,关于将参数空间进行了转移的情况下的代价函数的差分值为差分ΔE的情况下的参数转移概率P(ΔE),在将转移时的温度设为作为0以上的实数的温度T的情况下,用以下所示的数学式(1)表示。

[数学式1]

由此,能够满足基于作为模拟退火法在采样中利用的方法的Metropolis-Hastings法的概率采样中的细致平衡条件。在温度变化足够慢的情况下,在参数空间中,概率分布成为相对于代价函数的评价值E(p)以指数函数方式决定的玻尔兹曼分布。因此,通过使温度T从高温逐渐下降到低温,参数空间上的概率分布以指数函数方式集中在代价函数的评价值E(p

模拟退火法通过适当地控制最优化的各阶段的温度,最优化的精度变化,因此期望能够任意地调整温度进度表,不期望由于与最优化的精度没有关系的理由而对能够应用的温度进度表施加限制。在本实施方式中,能够应用任意的温度进度表。

另外,在将期望的测定时间τ中的平均的数据错误率(BER:Bit Error Rate)用作代价函数的评价值E(p)的情况下,测定时间τ越短则测定噪声越大。关于考虑了因测定时间τ产生的影响的参数转移概率P

[数学式2]

图3是表示图1所示的最优化系统1所使用的温度T与测定时间τ的关系的图。如上所述,模拟退火法利用基于Metropolis-Hastings法的概率采样,Metropolis-Hastings法根据参数转移概率P

因此,条件设定部41能够基于温度T决定测定时间τ。更具体地说,条件设定部41能够温度T越高则越缩短测定时间τ。例如,条件设定部41能够以成为与温度T越高则越单调地减小的函数成比例的值的方式决定测定时间τ。作为更具体的例子,条件设定部41能够按照以下的数学式(3)以成为与温度的平方根的倒数成比例的值的方式决定测定时间τ。

[数学式3]

图4是表示图1所示的最优化系统1的动作的流程图。首先,采样器40的条件设定部41设定初始条件(步骤S101)。初始条件包括温度T和参数p。条件设定部41基于所采用的参数p和所设定的温度T对参数候选p

条件设定部41进一步基于所设定的温度T决定测定时间τ(步骤S103)。具体地说,条件设定部41将测定时间τ决定为与对参数候选p

评价部31使用接收器30经由发送滤波器20从发送器10接收到的接收信号,测定误码率来作为代价函数的评价值E(p

采样器40的采用与否判定部42基于从评价部31通知的评价值E(p

条件设定部41当被通知了满足采用条件的意思时,按照温度进度表更新温度T(步骤S107)。更新后的温度T使用于接下来的评价处理。

接着,结束判定部43判定是否满足结束条件(步骤S108)。例如在结束条件是达到预先决定的总最优化时间的情况下,结束判定部43对从开始最优化处理起的经过时间进行计数,能够基于经过时间是否达到预先决定的总最优化时间来判定是否满足结束条件。

在满足结束条件的情况下(步骤S108:“是”),采样器40结束最优化(步骤S109)。在不满足结束条件的情况下(步骤S108:“否”),采样器40从步骤S102起使处理重复。

如以上说明的那样,根据本发明的实施方式1,使用模拟退火法对参数p进行最优化的最优化系统1具有:条件设定部41,设定包括作为评价对象的参数p的参数候选p

在此,条件设定部41按每个评价处理,基于表示选择参数候选p

实施方式2.

接着,说明本发明的实施方式2。在上述实施方式1中,将接收到的数据的误码率用作代价函数的评价值E(p

实施方式2所涉及的最优化系统2的结构与图1所示的最优化系统1同样,因此在此省略说明。图5是表示本发明的实施方式2所涉及的最优化系统2的动作的流程图。

步骤S101至步骤S103与图4同样,因此省略说明。评价部31测定信噪比来计算代价函数的评价值E(p

在此,信噪比的测定时间τ中的平均值被用作评价值E(p

并且,在上述中,以特性越良好则评价值E(p

接着,说明实施方式2的效果。图6是表示实施方式2所涉及的最优化系统2的最优化处理的经过时间与信噪比的关系的图。在图6中,将使用一般的模拟退火法的以往的最优化曲线C11和最优化系统2的最优化曲线C12一并示出。如图6所示可知,与使用一般的模拟退火法的情况相比,在本发明的实施方式2所涉及的最优化系统2中,从最优化处理的开始阶段到中间阶段能够迅速地推进特性改善,作为整体来说最优化以大约5分之1的时间收敛。

图7是表示实施方式2所涉及的最优化系统2的最优化处理的步骤数与信噪比的关系的图。在图7中将使用一般的模拟退火法的以往的最优化曲线C21和最优化系统2的最优化曲线C22一并示出。如图7所示可知,在最优化系统2中,虽然削减了每个步骤的测定时间τ,但是与使用一般的模拟退火法的情况相比,也没有发现特性劣化。

如以上说明的那样,在本发明的实施方式2中,即使在将信噪比用作评价值E(p

实施方式3.

图8是表示本发明的实施方式3所涉及的最优化系统3的结构的图。最优化系统3对最优化系统1、2的结构追加具有接收滤波器50。接收滤波器50例如是FIR滤波器,配置于从发送器10经由发送滤波器20发送的信号被接收器30接收为止的通信路径上。由此,接收器30被输入由接收滤波器50滤波后的信号。以下,主要说明与实施方式1、2的不同点。

采样器40的条件设定部41所决定的参数候选p

如以上说明的那样,根据本发明的实施方式3所涉及的最优化系统3,不仅能够对发送滤波器20的调整参数进行最优化,还能够对接收滤波器50的调整参数进行最优化。

实施方式4.

图9是表示本发明的实施方式4所涉及的最优化系统4的结构的图。在实施方式1~3中,通过物理上的通信路径等求出代价函数的评价值E(p

最优化系统4包括模拟器60和采样器40。采样器40的结构与实施方式1~3同样。采样器40的条件设定部41所设定的测定时间τ和参数候选p

模拟器60具有评价部31。另外,模拟器60具有使用采样器40所设定的条件例如测定时间τ、参数候选p*来对无线通信路径中的数据传送进行模拟的功能。当模拟器60对有噪声的系统进行模拟时,一般来说具有根据测定时间τ而代价函数的评价值产生偏差这样的性质,与对物理上的通信路径的特性进行评价时同样地,能够通过基于温度T决定测定时间τ来缩短最优化处理所花费的时间。

接着,说明实施方式1~4的硬件结构。评价部31、条件设定部41、采用与否判定部42以及结束判定部43是分别通过处理电路来实现的。这些处理电路既可以通过专用的硬件来实现,也可以是使用CPU(Central Processing Unit:中央处理单元)的控制电路。

在上述的处理电路是通过专用的硬件来实现的情况下,它们是通过图10所示的处理电路90来实现的。图10是表示实施方式1至4的处理电路90的图。处理电路90是单一电路、复合电路、被编程的处理器、被并行编程的处理器、ASIC(Application SpecificIntegrated Circuit:专用集成电路)、FPGA(Field Programmable Gate Array:现场可编程门阵列)、或将它们组合而成的部件。

在上述的处理电路是通过使用CPU的控制电路来实现的情况下,该控制电路例如是图11所示的结构的控制电路91。图11是表示实施方式1至4的控制电路91的图。如图11所示,控制电路91具备处理器92和存储器93。处理器92是CPU,还被称为中央处理装置、处理装置、运算装置、微型处理器、微型计算机、DSP(Digital Signal Processor:数字信号处理器)等。存储器93例如是RAM(Random Access Memory:随机存取存储器)、ROM(Read OnlyMemory:只读存储器)、快闪存储器、EPROM(Erasable Programmable ROM:可擦除可编程只读存储器)、EEPROM(注册商标)(Electrically EPROM:电可擦除可编程只读存储器)等非易失性或易失性的半导体存储器、磁盘、软盘、光盘、高密度盘、迷你盘、DVD(DigitalVersatile Disk:数字多功能盘)等。

在上述的处理电路是通过控制电路91来实现的情况下,通过由处理器92读出并执行在存储器93中存储的与各结构要素的处理对应的程序来实现。另外,存储器93还被用作由处理器92执行的各处理中的临时存储器。

以上实施方式所示的结构表示本发明的内容的一例,既能够与其它公知的技术进行组合,也能够在不脱离本发明的宗旨的范围中省略、变更结构的一部分。

例如,在上述的实施方式1至3中,设接收器30具有评价部31,但是本实施方式不限定于所述例子。也可以如图12和图13所示那样采样器40A具有评价部31。图12是表示图1所示的最优化系统1的变形例的图。图13是表示图8所示的最优化系统3的变形例的图。图12所示的最优化系统1A具有具备评价部31的采样器40A以代替最优化系统1的采样器40。同样地,图13所示的最优化系统3A具有具备评价部31的采样器40A以代替最优化系统3的采样器40。在该情况下,接收器30不具有评价部31,将接收信息输入到采样器40A。另外,条件设定部41向采样器40A内部的评价部31输入测定时间τ,评价部31向采样器40A内部的采用与否判定部42输入评价值E(p

另外,在上述的实施方式中,将发送滤波器20和接收滤波器50设为FIR滤波器,但是本实施方式不限定于所述例子。发送滤波器20和接收滤波器50也可以是IIR(InfiniteImpulse Response:无限脉冲响应)滤波器,例如也可以是如Volterra滤波器那样的非线性滤波器。另外,在上述的实施方式中设最优化的对象的参数p是通信路径的滤波器系数,但是本实施方式不限定于所述例子。例如,参数p也可以是发送功率、发送设备的温度、调制频率等除滤波器系数以外的通信路径的调整参数。另外,通信路径也可以是将多个发送接收机进行多路复用而成的。

另外,在上述的实施方式中,将使信噪比的符号反转得到的值或误码率设为评价值E(p

并且,在上述的实施方式中,设最优化的对象的参数是通信路径的调整参数,但是本实施方式不限定于所述例子。不限定于通信路径,在存在多个调整参数的系统中,在其特性的评价中产生噪声的情况下,能够通过应用本发明的技术来得到同样的效果。

此外,在上述的实施方式中说明了最优化系统1、2、3、4的结构和动作,但是本发明的技术还能够通过由最优化系统1、2、3、4执行的最优化方法、用于执行最优化方法的步骤的最优化程序、存储最优化程序的存储介质等方式来实现。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号