linear_model.LogisticRegression
は、ロジスティック回帰モデルを構築するためのクラスです。ロジスティック回帰モデルは、2値分類問題を解くために用いられる機械学習アルゴリズムの一つです。
以下は、linear_model.LogisticRegression
を使ったロジスティック回帰モデルの構築と予測の手順です。
まず、必要なライブラリをインポートします。
from sklearn.linear_model import LogisticRegression
次に、訓練データとテストデータを用意します。訓練データは、ロジスティック回帰モデルを構築するために用いられます。テストデータは、構築したモデルの予測精度を評価するために用いられます。以下は、全体の流れです。
# 訓練データとテストデータ x = np.arange(0, 5, 0.5) y = np.array([0, 0, 0, 1, 0, 1, 0, 1, 1, 1,]) # モデル lm = linear_model.LogisticRegression() # モデル訓練 t = x.reshape(1,-1).T lm.fit(t, y) # 予測 prediction = lm.predict(t)
個々にみていきます。
データを準備したら、次に、LogisticRegression
クラスをインスタンス化します。LogisticRegression
クラスには、いくつかのハイパーパラメータがありますが、デフォルト値で問題ない場合は、何も指定する必要はありません。
lm = LogisticRegression()
次に、fit
メソッドを用いてモデルを訓練します。fit
メソッドには、訓練データの特徴量とターゲット変数を与えます。
t = x.reshape(1,-1).T
lm.fit(t, y)
最後に、predict
メソッドを用いてテストデータの予測を行います。
prediction = lm.predict(t)
# 予測結果
array([0, 0, 0, 0, 0, 1, 1, 1, 1, 1])

とても簡単な例でしたが、以上で、linear_model.LogisticRegression
を使ったロジスティック回帰モデルの構築と予測の手順が完了しました。