Pymoo 多目标优化笔记（二）

发表于 2023-09-25 更新于 2025-11-08 分类于 python 阅读次数：本文字数： 1.3k 阅读时长 ≈ 5 分钟

因为许多任务并不是一个简单的函数调用可以解决的，但是我们可以将pymoo 问题定义为一个泛函数，下面的点很重要：

n_offspring：每一代产生多少个新个体，如果太小，则会收敛的很慢，如果太大，则会过度探索空间；

需要将g 都写作： $g(x) \le 0$ 的形式；

并且f 也都应写作 $min$ 形式；

在Windows 上使用多进程，必须要在__main__ 代码块中才行；

定义问题

\begin{array}{lll} min & f_m(x) & m=1,\dots,M \\ s.t. & g_j(x) \le 0 & j=1,\dots, J \\ & h_k(x) = 0 & k=1,\dots, K \\ & x_i^L \le x_i \le x_i^U & i=1,\dots,N \\ & x \in \mathbb{\Omega} \end{array}

现实情况是我们可能需要利用其他程序来求解问题，例如有限元或者CFD 方法，所以我们的程序应该可以调用其他进程：

通过命令行工具调用，如shell/cmd
通过com+ 组件调用
通过官方提供的API 接口调用

调用其他进程

这里我们选择第一个，通过命令行调用。而我们的求解程序则是通过另一个demo01_script.py

import os
import sys
import numpy as np
import pandas as pd

if __name__ == "__main__":  
    x1 = float(sys.argv[1])
    x2 = float(sys.argv[2])
    output = sys.argv[3]
    f1 = 100*(x1**2+ x2**2)  
    f2 = (x1-1)**2 + x2**2
    g1 = 2*(x1-0.1)*(x1-0.9)
    g2 = -20*(x1-0.4)*(x1-0.6)

    data = pd.DataFrame({
        'x1':[x1],
        'x2':[x2],
        'f1':[f1],
        'f2':[f2],
        'g1':[g1],
        'g2':[g2]})
    data.to_csv(output, index=False)

# 输出：   
# x1,x2,f1,f2,g1,g2
# 0.862116483026748,-0.026949728032658448,74.39711181474433,0.019738152093947317,-0.057743305440677836,-2.422566945593222

修改问题的定义

在_evaluate 中去执行其他程序，并读取其中的结果。可以改进的地方就是如何高效地在进程间传递数据：

import os
import numpy as np
import pandas as pd  
from pymoo.core.problem import ElementwiseProblem  

class DemoProblem01(ElementwiseProblem):  

    def __init__(self):
        super().__init__(
            n_var = 2,  
            n_obj = 2,  
            n_ieq_constr = 2,  
            xl = np.array([-2, -2]),  
            xu = np.array([2, 2])
        )

    def _evaluate(self, x, out, *args, **kwargs):
        x1 = x[0]
        x2 = x[1]  
        os.system(f"python demo01_script.py {x1} {x2} res.csv")
        data = pd.read_csv('res.csv')
        
        out["F"] = [data['f1'], data['f2']]
        out["G"] = [data['g1'], data['g2']]

problem = DemoProblem01()

余下的代码不用修改，结果也类似于上一篇笔记。

上面代码运行时间：8min10s

多线程

通过多线程可以有效地加速计算过程，实测下面的代码要比上面的代码速度快了五到六倍：

import os
import threading
import numpy as np
import pandas as pd  
from pymoo.core.problem import ElementwiseProblem, StarmapParallelization  
from multiprocessing.pool import ThreadPool  

n_process = 8  
pool = ThreadPool(n_process)
runner = StarmapParallelization(pool.starmap)

class DemoProblem01(ElementwiseProblem):  

    def __init__(self, **kwargs):
        super().__init__(
            n_var = 2,  
            n_obj = 2,  
            n_ieq_constr = 2,  
            xl = np.array([-2, -2]),  
            xu = np.array([2, 2]), 
            **kwargs
        )

    def _evaluate(self, x, out, *args, **kwargs):
        x1 = x[0]
        x2 = x[1]  
        tid = threading.get_ident()
        # print(pid)
        os.system(f"python demo01_script.py {x1} {x2} res_{tid}.csv")
        data = pd.read_csv(f'res_{tid}.csv')
        
        out["F"] = [data['f1'], data['f2']]
        out["G"] = [data['g1'], data['g2']]

problem = DemoProblem01(elementwise_runner=runner)

上面代码运行时间：1min30s

可以通过 ~~命名管道（不适合）~~ 来实现与子进程/子线程的通信，但是也要看目标程序是不是支持很多特性。最简单的还是文件读写。

Manager 通信

自从python 2.7 以后，内置了多进程模块，其中的Manager 模块可以用于跨进程（父子进程间）通信：

from multiprocessing import Process, Manager

# 定义一个共享列表
def add_data(shared_list, item):
    shared_list.append(item)

if __name__ == '__main__':
    # 创建一个共享的Manager对象
    manager = Manager()
    
    # 创建一个共享列表
    shared_list = manager.list()
    
    # 创建两个进程，分别向共享列表中添加数据
    p1 = Process(target=add_data, args=(shared_list, 'A'))
    p2 = Process(target=add_data, args=(shared_list, 'B'))
    
    # 启动进程
    p1.start()
    p2.start()
    
    # 等待两个进程结束
    p1.join()
    p2.join()
    
    # 打印最终的共享列表内容
    print(shared_list)

BaseManager

而通过BaseManager 则可以创建无关联的进程间的通信，将来也可以用在不同的机器上做分布式计算。看上去应该是基于socket 的，但是封装的比较好，使用起来也比较简单。一般不直接使用BaseManager，而是采用派生子类的方法：

服务端

### server 端
import multiprocessing
from time import sleep

def comServer():
    '''创建一个BaseManager 的服务进程，含有一个内部字典变量。
    暴露两个函数接口：Read 和Write'''
    from multiprocessing.managers import BaseManager
    innerDict = {}

    class DictManager(BaseManager):
        '''一般不直接使用BaseManager，而是派生一个子类'''
        pass

    def read(key):
        return innerDict[key]

    def write(key, value):
        innerDict[key] = value

    # 在派生子类中注册接口，而不是在BaseManager 中
    DictManager.register('read', read)
    DictManager.register('write', write)

    # 设置加密和监听端口
    manager = DictManager(address=('0.0.0.0', 5000), authkey=b'secret_key')
    server = manager.get_server()
    server.serve_forever()


if __name__ == '__main__':
    '''在后台启动DictManager'''
    background_process = multiprocessing.Process(name='comServer', target=comServer)
    background_process.daemon = True
    background_process.start()  

    while True:  
        sleep(20)
        pass

客户端

### client 端
from multiprocessing.managers import BaseManager

class DictManager(BaseManager):
    pass

if __name__ == '__main__':
    # 向派生类注册端口，其实派生类的名字未必要一致
    DictManager.register('read')
    DictManager.register('write')

    # 连接远程服务
    manager = DictManager(address=('127.0.0.1', 5000), authkey=b'secret_key')
    manager.connect()

    # 方法调用
    manager.write("hello", "world!")
    print(manager.read("hello"))

不知道通过文件交换会不会影响硬盘使用寿命，尽管有缓存的存在。

定义问题

调用其他进程

修改问题的定义

多线程

Manager 通信

BaseManager

服务端

客户端

参考资料