線形回帰とは

線形回帰分析は、ある変数の値を、別の変数の値に基づいて予測するために使用されます。予測したい変数は、従属変数と呼ばれます。他の変数の値を予測するために使用する変数は、独立変数と呼ばれます。

この形式の分析では、従属変数の値を最適に予測する1つ以上の独立変数を使用して、線形方程式の係数が推定されます。線形回帰は、予測された出力値と実際の出力値との間の矛盾を最小限に抑える直線または曲面に適合します。「最小二乗」法を使用して、ペアになった1組のデータの最適な直線を検出する単純な線形回帰計算ツールがあります。次に、Y(独立変数)からX(従属変数)の値を推定します。

線形回帰分布図グラフの例

より容易な予測の生成

Microsoft Excelで線形回帰を実行することも、IBM SPSS® Statisticsのような統計ソフトウェア・パッケージを使用することもできます。このような統計ソフトウェア・パッケージを使用すると、線形回帰方程式、線形回帰モデル、および線形回帰式を使用するプロセスを大幅に簡素化できます。SPSS Statisticsは、単純線形回帰や多重線形回帰などの手法で利用できます。

線形回帰法は、以下のようなさまざまなプログラムおよび環境で実行できます。

  • R線形回帰
  • MATLAB線形回帰
  • Sklearn線形回帰
  • 線形回帰Python
  • Excel線形回帰

線形回帰が重要である理由

線形回帰モデルは比較的単純であり、予測を生成できる解釈しやすい数式を提供します。線形回帰は、ビジネスや学術研究のさまざまな分野に適用できます。

線形回帰は、生物学、行動科学、環境科学、社会科学からビジネスまで、あらゆる分野で使用されています。線形回帰モデルは、未来を科学的かつ正確に予測できることが実証されている方法です。線形回帰は長期にわたって確立されてきた統計的手法であるため、線形回帰モデルの特性は十分に理解されており、簡単に教えることができます。

未来を科学的かつ正確に予測できることが実証された方法

ビジネスや組織のリーダーは、線形回帰手法を使用して、より適切な意思決定を行うことができます。組織は、大量のデータを収集します。線形回帰を使用することで、経験や直感に頼るのではなく、そのデータを使用して現実をより適切に管理できるようになります。大量の生データを取得し、そのデータを実用的な情報に変換できます。

また、線形回帰を使用することで、例えば同僚が以前に見たことがあり、既に理解していると考えているようなパターンや関係を明らかにすることで、より優れた洞察を得ることもできます。例えば、販売データと購入データを分析することで、特定の日や特定の時間に特定の購入パターンがあることがわかる場合があります。回帰分析から得られた洞察は、ビジネス・リーダーが自社製品の需要が高まる時期を予測するのに役立ちます。

効果的な線形回帰のための重要な前提条件

線形回帰分析で成功するために考慮すべき前提条件:

  • 各変数について:有効な事例数、平均偏差、および標準偏差を考慮します。 
  • 各モデルについて:回帰係数、相関行列、部分相関と偏相関、多重R、R2、調整済みR2、R2の変化、推定値の標準誤差、分散分析表、予測値、および残差を考慮します。また、回帰係数、分散共分散行列、分散インフレ係数、許容度、ダービン・ワトソン検定、距離測定(マハラノビス、クック、てこ比の各値)、DfBeta、DfFit、予測間隔、事例ごとの診断情報について、それぞれ95%の信頼区間を考慮します。 
  • プロット:分布図、部分プロット、ヒストグラム、正規確率プロットを考慮します。
  • データ:従属変数と独立変数は定量的でなければなりません。宗教、専攻分野、居住地域などのカテゴリー変数は、バイナリー(ダミー)変数または他のタイプのコントラスト変数に再コーディングする必要があります。 
  • その他の前提条件:独立変数の各値について、従属変数の分布は正規分布でなければなりません。従属変数の分布の分散は、独立変数のすべての値に対して一定でなければなりません。従属変数と各独立変数の関係は線形でなければならず、すべての観測値は独立している必要があります。

データが線形回帰の前提条件を満たしていることを確認

線形回帰を実行する前に、この手順を使用してデータを分析できることを確認する必要があります。データは、特定の必須前提条件を満たしている必要があります。

これらの前提条件は、以下の方法で確認します。

  1. 変数は、連続的なレベルで測定する必要があります。連続変数の例としては、時間、売上、重量、テストの点数などがあります。 
  2. 分布図を使用して、そのような2つの変数の間に線形関係があるかどうかを迅速に見つけます。
  3. 観測値は相互に独立している必要があります(つまり、依存関係は存在してはなりません)。
  4. データに著しい外れ値があってはなりません。 
  5. 等分散性(最適な線形回帰直線に沿った分散がその直線全体を通して維持されているという統計的概念)が見られるかを確認します。
  6. 最適回帰直線の残差(誤差)は正規分布に従います。

傾向と販売見積もりの評価

線形回帰分析を使用して、年齢、教育、経験年数などの独立変数から、販売員の年間総売上(従属変数)を予測することもできます。

価格設定の弾力性の分析

価格の変更は消費者行動に影響を及ぼすことが多く、線形回帰はその分析に役立ちます。例えば、特定の製品の価格が変化し続けている場合、回帰分析を使用して、価格が上昇するにつれて消費が減少するかどうかを確認できます。価格が上昇しても消費量が大幅に減少しなければどうか。購入者はどの価格ポイントで製品の購入をやめるのか。このような情報は、小売業のリーダーにとって非常に役立ちます。

保険会社のリスクの評価

線形回帰手法を使用してリスクを分析することができます。例えば、保険会社が持つ住宅所有者の保険金請求を調査するためのリソースが限られている場合があります。線形回帰を使用すると、会社のチームは請求コストを見積もるモデルを構築できます。分析は、企業のリーダーが、どのようなリスクを取るかについて重要なビジネス上の決定を下すのに役立ちます。

スポーツ分析

線形回帰の対象は、ビジネスだけではありません。スポーツにおいても重要です。例えば、バスケットボール・チームのシーズンの勝利試合数が、そのチームの1試合当たりの平均得点数と関係があるかどうかを知りたい場合があります。分布図は、これらの変数が線形に関連していることを示します。勝利試合数と対戦相手の平均得点数も直線的に関係しています。これらの変数には負の関係があります。勝利試合数が増えるにしたがって、対戦相手の平均得点数は減ります。線形回帰を使用すると、これらの変数の関係をモデル化できます。優れたモデルを使用すると、チームがいくつの試合で勝利するかを予測できます。

線形回帰製品

IBM SPSS Statisticsソフトウェア

この高速かつ強力なソリューションによって、研究と分析を推進します。

IBM SPSS Statistics Grad PackおよびFaculty Packs

学生、教師、研究者の皆様は、予測分析ソフトウェアを手頃な価格で使用できます。

IBM Cognos Statistics

この実績のあるセルフサービス分析ソリューションにより、データを組み合わせてマッチングし、説得力のある視覚化を実現できます。