當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Optaplanner规划引擎的工作原理及简单示例(1)

發(fā)布時間：2023/12/6 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了 Optaplanner规划引擎的工作原理及简单示例(1) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

　　在之前的文章中，老猿已介紹過APS及規(guī)劃的相關(guān)內(nèi)容，也對Optaplanner相關(guān)的概念和一些使用示例進(jìn)行過介紹，接下來的文章中，我會自己做一個規(guī)劃小程序 - 一個關(guān)于把任務(wù)分配到不同的機臺上進(jìn)行作來的小程序，并在這個小程序的基礎(chǔ)上對Optaplanner中更多的概念，功能，及使用方法進(jìn)行講解。但在此之前，我需要先講解一下Optaplanner在運行規(guī)則運算的原理。所以，本文是講述一些關(guān)于尋找最優(yōu)解的過程中的原理性的內(nèi)容，作為后續(xù)通過示例深入講解的基礎(chǔ)。但這些原理知識不會涉及過分深奧的數(shù)學(xué)算法，畢竟我們的目標(biāo)不是寫一個新的規(guī)劃引擎出來，只是理解一些概念，用于理解Optaplanner是依據(jù)什么找出一個相對優(yōu)解的。好讓在接下來的一系列文章中，可以快速無障礙地理解我所講解的更細(xì)化的Optaplanner功能。

　　好了，言歸正傳，本文主要是講述Optaplanner是如何在用戶定義的規(guī)則限制條件中，基于約束的限制，對被規(guī)劃對象進(jìn)行排列組合，再對比各個組合（稱作解，或方案），并找出相對最優(yōu)的解出來。在這個尋優(yōu)過程中，Optaplanner會使用到一些相關(guān)算法，例如啟發(fā)式算法（例如First Fit）和延遲接受法（例如禁忌搜索），從而提高尋找相對最優(yōu)解的效率和防止嵌入局部最優(yōu)解，從而可以在固定的時間內(nèi)，找到盡可能優(yōu)的方案。

　　在理解Optapalnner是如何實現(xiàn)之前，我們先復(fù)習(xí)并展開一下上一篇提到的概念 - 約束。

約束（Constraint）:

　　也就是對事物的一種限制，規(guī)定事物的發(fā)展應(yīng)該遵循什么規(guī)則，具體到Optaplanner里，就是用于表達(dá)出什么是對的，什么是錯的，什么情況是最優(yōu)，什么情況次優(yōu)，什么情況較差。從而讓引擎得到各個解的對比依據(jù)。

　　在Optapalnner中的約束可以分為硬約束和軟約束兩種，其實還有更多的約束類型，例如中間約束，甚至是無限層級的約束，但總結(jié)起來,其作用也就是把約束劃分為不同層級，從而區(qū)分出不同的優(yōu)等級而已，如果有軟件開發(fā)經(jīng)驗的同學(xué)，可以理解不同層級的約束，分別是SQL語句里Order By子句后面的字段次序。在進(jìn)行記錄排序時，前面的字段排列的優(yōu)先級，是從性質(zhì)上優(yōu)先于后面的字段的，大家理解了Order By子句，也就理解了不同層級約束的問題了。拉下來我們以最簡單的軟硬約束，來分析一下約束的作用。

硬約束：

　　硬約束是用來規(guī)定什么情況是對的，什么情況是錯的；什么組合是好的，什么組合是不好的......也就是它通常是用來對所得的解進(jìn)行一些定性的狀態(tài)定義。例如一個計劃是否可行，例如會不會同一個機臺同一個時間分配了兩個不同的任務(wù)（假設(shè)每個機臺同時只能做同一個任務(wù)）。一個員工所排班次是否正確（例如一個員工是否被安排了三個連續(xù)的班次）。若出現(xiàn)上種情況，即表示違反了硬約束，這種方案稱作不可行方案。以后的文章里，會提到Optaplanner里有一個明確的概念 - Feasable Solution(可行方案，或稱可行解)，就是表示這個方案是完全符合硬約束的。

軟約束：

　　軟約束規(guī)定什么情況最優(yōu)，什么情況次優(yōu)，什么情況是差的；它是用來定義方案優(yōu)劣的定量狀態(tài)。例如：一個計劃的成本是否足夠低；一個排班表到底有多大程度上的合理性，例如一個人正常情況下是需要5天工作制的，但如果遇到特殊情況，也可以連續(xù)工作6天，但這種情況是特殊的，需要額外付加班費（成本上升）最好不要出現(xiàn)這種情況。那么在編制這個排班表的時候，如果有一個方案是需要有人員連續(xù)工作6天，但如果找到另一個方案，可以令所有人均不需要連續(xù)工作6天，那么，后面這個方案就比那些有人需要連續(xù)工作6天的方案更好了。體現(xiàn)在軟約束上，就是后面的排產(chǎn)表，其軟約束上會比前一個排班表更好，違反的軟約束更少。

　　上述講述的是兩種常見約束，那么這些約束在Optaplanner里是如何生效的呢？那說需要有一種評分機制了，也是我們在使用Optaplanner里，比較難準(zhǔn)確把握的一個內(nèi)容之一。

評分機制：評分是用分?jǐn)?shù)來評價事物特性的一種方法。但如果我們細(xì)心觀察總結(jié)一下，會發(fā)現(xiàn)評份是可以通過兩種方向來評價的；分別是正評分(獎勵性評分)和負(fù)評分(懲罰性評分)。

正評分：通過獲得分?jǐn)?shù)的多少，來體現(xiàn)事物的優(yōu)劣。例如我們在學(xué)校考試過程中，成績是通過一種正分?jǐn)?shù)來體現(xiàn)的，即做對一題獎勵相應(yīng)的分?jǐn)?shù)，分?jǐn)?shù)越高成績越好；完美狀態(tài)是獲得滿分。

負(fù)評分：通過扣除分?jǐn)?shù)的多少，來體現(xiàn)事物的優(yōu)劣。例如我們的駕駛證記分制，每違章一次就扣除相應(yīng)的分?jǐn)?shù)，很明顯這種評份體系中，分?jǐn)?shù)越低越好，也就是扣得越少越好；完美狀態(tài)是扣0分。

　　在對實際問題進(jìn)行約束規(guī)劃時，是一種封閉性約束，也就是約定事物往指定的一個方向發(fā)現(xiàn)，使用負(fù)評分的方式，很顯然更合理。也就是一個方案有哪些不好的，我們通過對它評定一些懲罰分?jǐn)?shù)標(biāo)準(zhǔn)，告訴引擎這種組合出現(xiàn)了一些不太好的情況。如此類推，每找到一個更佳、扣分更少的方案，就離完美就更近一步。無論是使用正方向評份還是反方向評分（或稱負(fù)方向評分），在Optaplanner里都是可以實現(xiàn)的，只不過按我們?nèi)粘５倪壿?#xff0c;在定義方案時，通常我們只會根據(jù)業(yè)務(wù)定義出一些規(guī)則，方案是需要守這些規(guī)則，當(dāng)一個方案出現(xiàn)有違反規(guī)則時，就作出相應(yīng)的懲罰性扣分；這種方法比當(dāng)出現(xiàn)好的情況就加分更合理。因為我們的現(xiàn)實世界里，"好"是可能無限好的，當(dāng)問題足夠復(fù)雜，數(shù)據(jù)量足夠大，即問題規(guī)模夠大時，描述一個方案如何個好法，其實很難是一個定數(shù)。比描述一個方案如何個差法更難，因為前者可以是無限的，而后都就只需要我們定義好什么是差的標(biāo)準(zhǔn)，一但問題范圍確定，它的最差情況（也就是最差的扣分情況）就有一個字?jǐn)?shù)了。所以，在Optaplanner的世界里，常見的做法是，定義一些約束，并設(shè)定相應(yīng)的懲罰分?jǐn)?shù)標(biāo)準(zhǔn)（即將約束量化），用來描述這個方案的制約因素，當(dāng)這個約束實打破時，就作出懲罰性記分，那么到最后，扣分越少的方案就越好。這就是Optaplanner實現(xiàn)尋優(yōu)的最基本原理，但其實現(xiàn)是非常復(fù)雜的，會將問題劃分為很多種類，將尋優(yōu)的過程劃分為多個階段，每個階段利用不同種類的算法來提高找到更優(yōu)方案的效率，每個階段有很多個步驟，每個步驟又有多個移動（沒錯，Optaplanner里就有Step與Move的概念，以后會詳解）；在以后的深入文章中，我會詳細(xì)把這個過程分析出來。

　　上面描述了硬約束、軟約束和評份機制。那么如何將這兩種約束與這種評分機制關(guān)聯(lián)起來，令評分機制可以實現(xiàn)軟、硬約束呢？大家可能已想到，在Optaplanner給出了軟分?jǐn)?shù)，硬分?jǐn)?shù)的概念。在評分機制中，當(dāng)出現(xiàn)一個方案違反了某個硬約束時，就給這個方案扣除這個約束相應(yīng)的分?jǐn)?shù)；同樣地，當(dāng)該方案違反了一種軟約束時，就對該方案扣除該軟約束相應(yīng)的分?jǐn)?shù)。這兩個分?jǐn)?shù)是分開處理的。因為通過它們對應(yīng)的約束類別就知道，它們分別代表的性質(zhì)不一樣，硬分?jǐn)?shù)對應(yīng)的硬約束，代表的是一種定性評價；即描述方案好不好，行不行，可不可取等，一旦被記扣硬分?jǐn)?shù)，那就表示這個方案的性質(zhì)就變了，由可行方案變成不可行方案。理想的方案是一個硬分都不能扣的，一旦扣了就是不可行方案了。有人問，那么定義硬分?jǐn)?shù)的分值有什么用？直接給一個標(biāo)識出來，將方案的可用性定義為True or False，分別代表是事有硬約束被違反不就行了嗎，多簡單呀，因為一旦為False就是不可用了，再去討論它扣了多少分，又有何意義呢？硬約束、硬分?jǐn)?shù)不就是為了給方案定性而設(shè)立的嗎？何必還要記錄它的扣分量，多此一舉呢？

　　如果這樣想，就是一種不全面的想法了。因為大家需要明白，現(xiàn)實世界往往是很大程度是不完美的，但而對不完美，我們是放棄這個世界，還是在不完美中進(jìn)行堅持，對這個不完美的世界，朝完美的方向進(jìn)行改造呢？上面的說法就比較抽象比較虛了，舉個大家容易理解的例子。例如：刑法是用來懲罰犯罪的，在正常的法治社會中，犯罪對于一個人說，就相當(dāng)于違反了硬約束（刑事處罰記錄是終身跟隨的）。也就是對于一個人來說，一生中是否觸犯過刑法，是一個定性的問題。那么既然是定性問題，我們在設(shè)立刑法的時候，其對應(yīng)的懲罰是不是只有一種就足夠了呢？例如凡是觸犯刑法，全部判死刑，那不就簡單得多啦？事實上人類社會是不可能這樣的，因為就算是觸犯了刑法（這個已經(jīng)是定性問題），但罪行也有輕重之分的、對應(yīng)了刑法的不同條款，有些罪名經(jīng)過對罪犯的懲戒，是可以再給他一次機會的，也說就是說觸犯的刑法，是有輕重之分的，但性質(zhì)不會變，他在國家司法機關(guān)的檔案里，永遠(yuǎn)留有普被刑事處理的記錄。所以，這可以稱該種情況為定性范圍內(nèi)的定量問題。就是一個人做錯了就是錯了，其性質(zhì)已經(jīng)定了，但犯的錯誤有多大，還得是一個定量問題。因此，硬約束對應(yīng)的扣除硬的分?jǐn)?shù)有多有少就不難理解了。就是我們的方案如果出現(xiàn)了違反硬約束、被扣除了硬分?jǐn)?shù)的，它在Optaplanner上就是一個不可行方案了。但是在眾多的不可行方案里，其實還要區(qū)分哪個是更不可行，哪些其實只是違反了一點點，還是“稍為可行的”。回到我們的實際排程問題中，有可能客觀條件限制，我們所有排出來的方案（例如生產(chǎn)計劃、排班表、車輛調(diào)試線路圖）都是不可行的，例如：我們排生產(chǎn)計劃的時候，將交貨期延誤作為一種硬約束，但是現(xiàn)實的生產(chǎn)活動中，確確實實有可能無論你怎么排，因為產(chǎn)能、資源限制等因素，你是不可能找到一個完完全全符合交期的生產(chǎn)計劃的，那么這個時間我們就需要找出一個違反得最小的計劃出來，作為可行計劃，視情況進(jìn)行相應(yīng)的修改并執(zhí)行了。也就是說兩害相遇取其輕。

　　對于硬約束，除了上述講到，當(dāng)出現(xiàn)有可能確實需要使用不可行方案作為執(zhí)行計劃的情況外，在Optaplanner進(jìn)行規(guī)則的過程中，其實也起到非常大作用的。先不說optaplanner引來來排程；如果讓你來排，對于各種硬約束，全都不給出一個分?jǐn)?shù)，而是給一個定性的標(biāo)識，就是一旦出現(xiàn)違反了，就報一個違反硬約束的消息出來，你會怎么樣?你肯定會抱怨提示的信息太簡陋了，只有一個標(biāo)識，最多只是知道哪里違反了，再也沒有更詳細(xì)的信息供你參考了。那你接下來的排產(chǎn)活動，其實就是一個組合一個組合逐一地去碰彩了。因為各個方案之間是否有關(guān)聯(lián)，你是無法得知的，所以你根本找不到什么好的辦法去將各種情況下的方案進(jìn)行歸類、比較進(jìn)行往指定的一個方向收斂。但如果在一個硬約束被違反時，會出現(xiàn)一些明確的信息，是哪個硬約束被違反了。違反和程度是多少，扣了多少分，是因為哪個被規(guī)則的對象，放在哪里，或與哪個對象相鄰從而導(dǎo)致的硬約束被違反。這樣就形成了一個很明確指導(dǎo)方向，對于人而言，通過歸納統(tǒng)計就知道某些情況肯定會出現(xiàn)，或極大可能會出現(xiàn)違反硬約束的情況，那我們就可以在排列新方案時，盡力去避免這種情況了；也就是有了參考方向。對于Optaplanner引擎來說也是同理，盡管它不像人這么聰明（但最從近的消息來看，Optapalnner團隊已經(jīng)著手思考人工智能引入到引擎中，從而實現(xiàn)如上述人類一樣對這類問題進(jìn)行歸納思考），但也能夠作為其尋找更佳方案的過程中的一些很重要的參考，從而為尋優(yōu)算法所用，進(jìn)而提高尋優(yōu)效率。例如遺傳算法。

　　軟分?jǐn)?shù)對應(yīng)的軟約束，代表的是一種定量評價；即描述方案有多好、有多差，成本有多高、有多低。它是一種優(yōu)化約束，即在定義它的時候，就已經(jīng)知道它必然是被違反的（也有可能完全不違反，那當(dāng)然是好的，但如果是這樣的話，就脫離了軟約束的初充了）。所以，軟件約束、軟件分?jǐn)?shù)的扣分值用途相對來說就容易理解得多了。

　　?綜上所述，Optaplanner就是通過一種體現(xiàn)為分?jǐn)?shù)的約束機制，進(jìn)行尋找最優(yōu)組合。當(dāng)一個排產(chǎn)問題中，設(shè)定的軟硬兩種約束時，它會優(yōu)先滿足硬約束的要求，再滿足軟約束的要求，也就是說，軟約束被扣為1萬分，也不及硬約束被扣了1分重要，聯(lián)系上面的SQL語句中的Order By子句的例子。

　　Optaplanner其利用途徑有以下兩點：

1. 用分?jǐn)?shù)來確定，一個方案是否可行，是優(yōu)是劣；

2. 在決定每一步的時候，參考上一點的扣分情況，來確定下一次生成方法時，應(yīng)該考慮哪此因素（想想遺傳算法）.

　　這一篇我們先講解一下原理，打一下基礎(chǔ)，下一篇將用一個任務(wù)與機臺的例子來說明一下這些原理在Optaplanner中是如何體現(xiàn)的。

一個IT老農(nóng)，先盡力好當(dāng)兒子、丈夫和父親的責(zé)任，然后做點有趣的事。

總結(jié)

以上是生活随笔為你收集整理的Optaplanner规划引擎的工作原理及简单示例(1)的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。