scipy-optimize

date: 2022-05-08 excerpt: scipy-optimizeの使い方

scipy-optimizeについて

概要

メジャーな最適化アルゴリズムを抑えた使いやすい最適化フレームワーク
- デフォルトではBFGS, L-BFGS-B, SLSQPを使う
- Nelder-Meadなどの微分を使わない方法もサポート
制約条件の有無
- 一致の制約条件、boolの制約条件などを入れられる
回帰などの独自のscikit-learn互換のものを作れる
- 最小化する関数を詳細に設計できるので便利

具体例(10つの状態を取りうるときにエントロピーが最大になるそれぞれの確率)

エントロピーが最大=何もわからなく、差がない状態=すべてが同じ確率になるはずである

import numpy as np
import random
from scipy import optimize
# 初期値は適当
x = np.array([random.random() for i in range(10)])
x /= x.sum()
print(x)
"""
array([0.17568076, 0.08893014, 0.08130814, 0.13588037, 0.04452422,
       0.10659483, 0.11712342, 0.1996713 , 0.04659363, 0.00369318])
"""

def func(x):
    return -(-(x@np.log(x)).sum()) # 最大化したいので-を掛ける

def constraint(x):
    return x.sum() - 1

cons = [{'type':'eq', 'fun': constraint},]

ret = optimize.minimize(func, x0=x, constraints=cons)
print(ret.x) 
"""
array([0.09999446, 0.10001536, 0.10002089, 0.09996406, 0.10000083,
       0.09999554, 0.09997974, 0.10000217, 0.09999922, 0.10002772])
"""

初期の想定通りにすべてがおおよお同じ値になった

Google Colab

scipy-optimize-example

具体例(最適化の範囲を限定して回帰で近似)

# 説明変数と目的変数を分ける
X = m.drop(columns=["target"]).copy()
y = m["target"]

# 説明変数と目的変数を標準化
for col in X.columns:
    X[col] = (X[col] - np.mean(X[col]))/np.std(X[col])
X_values = X.values
y_values = (y - np.mean(y))/np.std(y)

# 最小化関数を定義
def func(x):
    tmp = np.zeros(len(X_values))
    for i in range(len(x)):
        tmp += x[i] * X_values[:, i]
    return (y_values - tmp).abs().sum()

# 探索範囲を準備
bounds = [(0, np.inf) for _ in range(len(X.columns)) ]

# 最適化
x = np.zeros(len(X.columns)) + 1/300
ret = optimize.minimize(func, x0=x, bounds=bounds, options={'eps': 1e-8, "max_iter": 2500} ) 

# 結果を表示
rf = pd.DataFrame(list(zip(X.columns, ret.x)))
rf.columns = ["feat", "exp"]
display(rf.sort_values(by=["exp"], ascending=False).style.hide_index())

具体例(sklearn互換のカスタム目的関数の回帰)

random cv searchでも使用可能
scipyのoptimizerを利用
- 好きなオプティマイザを使える
  - パラメータの範囲の指定を自由に行える
- 目的関数を細かくコントロールできる
  - L1, L2以外の正則化の利用
  - 複数の目的変数のmixなど

class CustomRegressor():
    def __init__(self, use_intercept=False):
        self.coef_ = None
        self.use_intercept = use_intercept

    def fit(self, X: np.ndarray, y: np.ndarray):
        # slack変数を用いる場合
        match self.use_intercept:
            case True:
                X_ = np.hstack([X, np.ones(len(X)).reshape((len(X), 1))])
            case False:
                X_ = X

        # 最小化関数
        def func(_x):
            tmp = np.zeros(len(X_))
            for i in range(len(_x)):
                tmp += _x[i] * X_[:, i]
            # mseと特定の値への束縛を追加
            loss = ((y - tmp)**2).sum()
            match self.use_intercept:
                case True:
                    loss += ((2000 - _x[-1] * X_[:, -1])**2).sum()
                case False:
                    loss += 0.0
            for col_name in COL_ORDER:
                hp0 = 2
                match col_name:
                    case "xxx":
                        loss += (np.abs(100 - _x[0] * X_[:, 0])**hp0).sum()
                    case "yyy":
                        loss += (np.abs(200 - _x[1] * X_[:, 1])**hp0).sum()
                    case "zzz":
                        loss += (np.abs(300 - _x[2] * X_[:, 2])**hp0).sum()
            return loss
        
        # 境界
        bounds = [(0, np.inf) for _ in range(X_.shape[1]) ]
        
        rets = []
        # for method in ['TNC', 'L-BFGS-B', 'SLSQP']:
        for method in ["L-BFGS-B"]:
            w = np.zeros(X_.shape[1]) + 0.1
            ret = optimize.minimize(func, x0=w, method=method, bounds=bounds, options={'eps': 1e-2, "max_iter": 10000} ) 
            rets.append(ret)
        r = [ret.x for ret in rets][0]
        
        # coef, interceptのセット
        match self.use_intercept:
            case True:
                self.coef_ = r[:-1]
                self.intercept_ = r[-1]
            case False:
                self.coef_ = r
                self.intercept_ = 0.0
        return self

    def predict(self, X: np.ndarray):
        tmp = np.zeros(len(X))
        for i in range(len(self.coef_)):
            tmp += self.coef_[i] * X[:, i]
        tmp += self.intercept_
        return tmp

参考

scipy.optimize.minimize