ロジスティック回帰

結果を予測し、より良い意思決定を行う

Project Manager Does Motivational Presentation or Team of Electronics Development Engineers, he Uses Digital Whiteboard with Neural Network, AI and Machine Learning.

ロジスティック回帰とは

このタイプの統計分析(ロジット型としても知られています)は、予測分析とモデリングによく使われ、機械学習のアプリケーションにまで拡がっています。 この分析アプローチでは、従属変数は有限またはカテゴリーです。AまたはB(バイナリ回帰)または有限オプションA、B、CまたはDの範囲(多項回帰)のいずれかです。 ロジスティック回帰方程式を使用して確率を推定することにより、従属変数と1つ以上の独立変数の関係を理解するために統計ソフトウェアで使用されます。 

このタイプの分析は、イベントが発生する可能性や選択が行われる可能性を予測するのに役立ちます。 例えば、訪問者がWebサイトで行われたオファーを選択する可能性を知りたい場合があります(従属変数)。 分析では、訪問者がアクセスしたサイト、サイトへの繰り返しの訪問、サイトでの行動(独立変数)など、訪問者の既知の特性を調べることができます。 ロジスティック回帰モデルは、どのタイプの訪問者がオファーを受け入れる可能性が高いか、または受け入れない可能性があるかを判断するのに役立ちます。 その結果、オファーの宣伝についてより良い決定を下したり、オファー自体について決定を下したりすることができます。


機械学習と予測モデル

機械学習は、統計的概念を使用して、機械(コンピューター)が明示的なプログラミングなしで「学習」できるようにします。 ロジスティック・アプローチは、機械が学習しているタスクが2つの値、つまり2項分類に基づいている場合に最適です。 上記の例を使用すると、コンピューターはこのタイプの分析を使用して、オファーの宣伝について決定を下し、それ自体でアクションを実行できます。 そして、より多くのデータが提供されますので、 時間が経つにつれてもっとうまく行えるよう学んでいけるでしょう。

ロジスティック分析を使用するタイプの予測モデルには次のようなものがあります。

  • 一般線形モデル
  • 離散選択
  • 多項ロジット
  • 混合ロジット
  • プロビット
  • 多項プロビット
  • 注文したロジット

ロジスティック回帰が重要な理由

このアプローチを使用して構築された予測モデルは、ビジネスまたは組織にプラスの違いをもたらす可能性があります。 これらのモデルは、人間関係を理解し、結果を予測するのに役立つため、意思決定を改善するために行動することができます。 例えば、製造元の分析チームは、統計ソフトウェア・パッケージの一部としてロジスティック回帰分析を使用して、 機械の部品の故障とそれらの部品がインベントリーに保持されている時間との間の確率を発見できます。 チームは、この分析から受け取った情報を使用して、将来の障害を排除するために配信スケジュールまたはインストール時間を調整することを決定できます。

医学では、この分析アプローチを使用して、特定の母集団の病気や病気の可能性を予測できます。これは、予防的ケアを実施できるということです。 企業はこのアプローチを使用して、購入者の行動を分析することで、従業員の定着率を高めたり、収益性の高い製品を作成したりするパターンを明らかにできます。 ビジネスの世界では、このタイプの分析は、複雑なデジタルデータを分析して解釈するという 目標が明確なデータサイエンティストによって適用されます。


統計の概念と適用

確かに、多項分析は、A、B、C、またはDのさまざまなカテゴリーの結果を調べるときに役立ちます。ただし、バイナリー分析(「はい」または「いいえ」、「存在」または「不在」)がより頻繁に使用されます。 結果は制約されますが、可能性は制約されません。 バイナリーのロジスティック回帰を使用して、野球の統計から地滑りの感受性、手書きの分析まで、あらゆるものを調べることができます。

この分析へのアプローチは、さまざまな統計概念や適用にも役立つことが証明されています。

  • テキスト分析
  • Chi-square自動相互作用検出(CHAID)
  • 共同分析
  • ブートストラップ統計
  • 非線形回帰
  • クラスター統計とクラスター分析ソフトウェア
  • モンテカルロ・シミュレーション
  • 記述統計

統計分析ソフトウェアの使用は、ロジスティック回帰分析、多変量分析、ニューラル・ネットワーク、決定木、線形回帰などのアプローチに大きな価値をもたらします。 ただし、オンプレミス、クラウド、またはハイブリッドのいずれかのクラウド構成で大規模なデータセットに対応する必要がある場合は、ハードウェアおよびクラウド・コンピューティング・ソリューションも検討する必要があります。


効果的なロジスティック回帰の重要な仮定

このアプローチが最も効果的なのはいつ、効果的でないのはいつ?

バイナリー・ロジスティック回帰がより頻繁に使用および議論されますが、各タイプが最も効果的である場合を検討することは役立つ場合があります。

多項 を使用して、行動を予測するための変数のカテゴリー範囲に基づいて被験者をグループに分類できます。 例えば、参加者がいくつかの競合製品の1つをお気に入りとして選択するように求められる調査を実施できます。 あなたはあなたの製品に興味を持っている可能性が最も高い人々のプロファイルを作成し、それに応じてあなたの広告戦略を計画することができます。

バイナリー は、2つの結果を持つカテゴリー応答変数のイベント確率をモデル化する場合に最も役立ちます。 ローンオフィサーは、次のお客様がローンをデフォルトする可能性が高いか、あるいはデフォルトはしなさそうかを知りたいと思っています。 バイナリー分析は、特定のお客様にクレジットを拡張するリスクを評価するのに役立ちます。


潜在的な危険性

 

 Classroom – The Disadvantages of Logistic Regression(ロジスティック回帰のデメリット)(リンクはibm.comの外部にあります)によれば、このタイプの分析が効果的でない場合を理解することも役立つといいます。 注意すべきいくつかの危険があります。

  • 独立変数は有効である必要がありま 変数が正しくないか不完全な場合、モデルの予測値が低下します。
  • 継続的な結果を避けてください。 温度、時間、または開放型のものは、モデルの精度を大幅に低下させます。
  • 相互に関連するデータは使用しないでください。 一部の観測値が相互に関連している場合、モデルはそれらの重要性を過大評価する傾向があります。
  • 過剰適合や誇張に注意してください。 これらの統計分析モデルは正確ですが、正確さというのは、間違いがないとか、不一致がないというわけではありません。

ツールと比較

ツール
この分析アプローチはMicrosoft Excelで実行できますが、条件付きロジスティック回帰、多項ロジット回帰、多項ロジット回帰など、ほぼすべてのアプリケーションで、オープンソース(ロジスティック回帰R)または商用(ロジスティック回帰 SPSS)のソフトウェア・パッケージを使用してデータを分析し、テクニックをより 効率的に適用することをお勧めします。 Excelで分析を実行するか、ロジスティック回帰方程式、ロジスティック回帰モデル、およびロジスティック回帰式を使用するプロセスを大幅に簡素化するIBM SPSS® Statisticsなどの統計ソフトウェア・パッケージを使用できます。

線形回帰との比較
線形分析またはロジスティック分析をいつ使用するかは、一般的なクエリです。 基本的に、線形回帰分析は、従属変数が自由形式または連続である場合(例:天文学的な距離や温度など)、より効果的に適用されます。 従属変数が値の範囲またはカテゴリー(AまたはB ...またはA、B、CまたはD)に制限されている場合は、ロジスティック・アプローチを使用します。


ロジスティック回帰の成功例


関連するソリューション

IBM SPSS Advanced Statistics

単変量と多変量のモデリング手法を使用して複雑な関係を分析すると、より正確な結論に到達します。


IBM SPSS Modeler

ドラッグ・アンド・ドロップのデータサイエンス・ツールを使用して、投資収益率を高めます。


IBM SPSS Regression

カテゴリーの結果を予測し、さまざまな非線形回帰手順を適用します。


IBM Watson Studio

AIと機械学習モデルを構築してトレーニングし、データを準備して分析します。これらはすべて、柔軟なハイブリッドクラウド環境で行われます。


IBM Watson Discovery

コグニティブ探索、強力なテキスト分析、機械学習機能を使用して、すべての非構造化データをマイニングして探索するためのスマートでシンプルな方法をご利用いただけます。