勾配ブースティングのDART法について調べてみた

Light-GBMの”boosting”ハイパーパラメータで”dart”というものがあり、しかもKaggleなどのコンペティションではこのオプションが使われていることが多い？これはいったいなんだ？と思ったので調べて分かったことをまとめておこうと思います。

“DART”でネット上を調べてみましたが記事をほとんどみつけることができなかったので、原論文を探してみました。・・ありました！

DART: Dropouts meet Multiple Additive Regression Trees (2015)
https://arxiv.org/pdf/1505.01866.pdf

こちらを読んでみました。

読んで分かったことまとめ（箇条書き）

・DARTとは、勾配ブースティングにおいて過学習を防止するため(*1)にMART(*2)にDrop Outの考え方を導入して改良したものである。

・(*1)勾配ブースティングでは、一般的にステップの終盤になるほど、より極所のデータにフィットするような勾配がかかる問題があった。

・(*2)MARTとは、Multiple Additive Regression Trees (多重加法型回帰樹木)の略称であり、決定木のアルゴリズムで用いられるCART法の予測確度を向上させる目的で， CART樹木にBoostingを加味する方法として考案されたもの。勾配ブースティングのベースとなるアルゴリズムである。
(参考文献） https://www.jsce.or.jp/library/open/proc/maglist2/00897/2008/pdf/A13D.pdf

・DART開発以前の過学習への対応としては、Shrinkage が用いられていた。
この方法では、ステップが進むにつれて、作成される補正木の影響度を小さくしていくために定数Shrinkage Factorを掛け合わせていくというもの。

・Drop OutはDeep Newral Networkの分野で精度向上に多大な貢献をしたテクニックで、他のアルゴリズムへの応用も研究されている。

・たとえばロジスティック回帰へDrop Outを導入し、Randam Forestと同様の考え方でアンサンブル学習を行えるようにした研究などがある。

・DARTの評価のために、Classification, Ranking, Regressionのタスクの精度をMARTと比較し、全てのタスクでMARTを上回る精度を出すことができた。

参考：Light-GBMのBoosting Typeパラメータ設定(GOSS, GBDT, DART)の違いによる精度への影響

Kaggleに良いDiscussionがありましたのでリンクを載せておきます。

https://www.kaggle.com/c/home-credit-default-risk/discussion/60921

・データセットにもよるのかもしれないですが、この実験では、
精度：DART > GBDT > GOSS (他２つと比べて過学習しやすい）
計算速度：GOSS > GBDT > DART (他２つと比べて非常に遅い）

計算コストも鑑みるとデフォルトであるGBDTで十分そうですが、Kaggleのようにわすかな精度向上を競う世界では計算コストを犠牲にしてもDARTを選んだ方が有利なんですね・・・。勉強になりました！

というわけで、本日も最後までご覧いただきありがとうごさいました！

おしまい

勾配ブースティングのDART法について調べてみた

読んで分かったことまとめ（箇条書き）

参考：Light-GBMのBoosting Typeパラメータ設定(GOSS, GBDT, DART)の違いによる精度への影響

関連

コメントを残す

Profile

Categories

yutaro013_scenery

Trending Posts

【2023年度最新版】Azure Administrator Associate資格 (AZ-104)を3日で取得した話。勉強方法は？取ってよかった？

【詳解】クライアント証明書認証を実装しながら理解する – 前編：概要～証明書作成編

【VSCodeで開発】コミットしようとしたら「Git の ‘user.name’ と ‘user.email’ を構成していることを確認してください」エラーが発生する

【自然言語処理】PythonとTwitter APIでデータ分析

【2023年最新版】Microsoft Cybersecurity Architect Expert資格 (SC-100)を1週間で取得した話。勉強方法は？取ってよかった？

【2023年最新版】Azure Solution Architect Expert資格 (AZ-305)を1週間で取得した話。勉強方法は？取ってよかった？

超便利＆簡単！VS Codeの設定を複数PC間で同期する

【機械学習】Scikit-Learnで交差検証(Cross-Validation)を一瞬で実装する【Python】

AzureのSAS（共有アクセス署名）を分かりやすく解説する

Azure Developer Associate資格(AZ-204)を10日間で取得した話。勉強方法は？取ってよかった？

Microsoft Power Platform Fundamental資格 (PL-900)を取得した話。勉強方法は？取ってよかった？

【Python×自然言語処理】テキストデータを極性辞書で感情分析してみる

【2023年最新版】Azureの認定資格を1ヶ月で全部とる。資格一覧と対策方法・体験記まとめ

Azure Data Fundamentals資格 (DP-900)を2日で取得した話。勉強方法は？取ってよかった？

CPU使用率とCPU時間について分かりやすく解説する

【データ分析】MacOSで複数のPython/Anacondaバージョンを使い分ける方法【pyenv】

【機械学習】決定木モデルの変数重要度をわかりやすく解説する

機械学習における転移学習とファインチューニング

勾配ブースティングのDART法について調べてみた

Azure AI Fundamentals (AI-900)を2日で取得した話。勉強方法は？取ってよかった？

アーカイブ