線形回帰とは
簡単に解釈できる数式を使用して予測を生成
SPSS Statisticsの詳細はこちら
線形回帰における傾向、データ分析、予測の関係を示す図
線形回帰とは

線形回帰分析は、ある変数の値を別の変数の値に基づいて予測するために使用されます。予測する変数は、従属変数と呼ばれます。他の変数の値を予測するために使用する変数は、独立変数と呼ばれます。

この形式の分析では、従属変数の値を最もよく予測する1つ以上の独立変数を含む線形方程式の係数を推定します。線形回帰は、予測された出力値と実際の出力値の間の差異を最小限に抑える直線または曲面を近似します。「最小二乗法」を使用して、一組の対になったデータに対して最適な直線を発見する単純な線形回帰計算機があります。次に、Y(独立変数)からX(従属変数)の値を推定します。

線形回帰のSPSS Statistics

IBM SPSS Statisticsを使用すると、データ点のグループが特定の結果に及ぼす影響を計算し、線形関係と非線形関係の両方をモデル化できます。

予測をより簡単に生成

Microsoft Excelで線形回帰を実行したり、線形回帰式、線形回帰モデル、線形回帰式を使用するプロセスを大幅に簡素化するIBM SPSS® Statisticsなどの統計ソフトウェア・パッケージを使用できます。SPSS Statisticsは、単純線形回帰や多重線形回帰などの手法で活用できます。

線形回帰法は、次のようなさまざまなプログラムや環境で実行できます

  • R線形回帰
  • MATLAB線形回帰
  • Sklearn線形回帰
  • Python線形回帰
  • Excelの線形回帰
線形回帰が重要な理由

線形回帰モデルは比較的単純で、予測を生成できる解釈しやすい数式を提供します。線形回帰は、ビジネスや学術研究のさまざまな分野に応用できます。

線形回帰は、生物学、行動科学、環境科学、社会科学からビジネスに至るまで、あらゆる分野で使用されていることがわかります。線形回帰モデルは、科学的に確実に未来を予測する方法として実証されています。線形回帰は長い間確立されてきた統計手順であるため、線形回帰モデルの特性はよく理解されており、非常に迅速に学習できます。

未来を科学的かつ確実に予測する実証済みの手法

ビジネスや組織のリーダーは、線形回帰手法を使用することで、より適切な意思決定を行うことができます。組織は大量のデータを収集します。線形回帰は、経験や直感に頼るのではなく、そのデータを使用して現実をより適切に管理するのに役立ちます。大量の未加工データを実用的な情報に変換することができます。

また、線形回帰を使用すると、同僚が以前見たことがあり、すでに理解していると思っていたパターンや関係を明らかにすることで、より優れたインサイトを提供することもできます。たとえば、販売および購入データの分析を実行すると、特定の日または特定の時間における特定の購入パターンを明らかにすることができます。回帰分析から収集されたインサイトを利用することで、ビジネス・リーダーが自社製品の需要が高まる時期を予測できます。

線形回帰の詳細については、IBM Knowledge Centerをご覧ください
有効な線形回帰の主な仮定

線形回帰分析を成功させるために考慮すべき前提条件:

  • 各変数について: 有効なケースの数、平均および標準偏差を考慮します。
  • 各モデルについて::回帰係数、相関行列、部分相関と偏相関、多重 R、R2、調整済みR2、R2の変化、推定値の標準誤差、分散分析テーブル、予測値と残差を考慮します。また、各回帰係数の95%の信頼区間、分散共分散行列、分散インフレーション係数、許容誤差、Watson、距離尺度(マハラノビス、クック、レバレッジの値)、DfBeta、DfFit、予測区間、ケースごとの診断情報を考慮します。
  • プロット:散布図、部分プロット、ヒストグラム、正規確率プロットを考慮します。
  • データ: 従属変数と独立変数は定量的である必要があります。宗教、専攻分野、居住地域などのカテゴリー変数は、バイナリー(ダミー)変数や他のタイプの対照変数に再コード化する必要があります。
  • その他の仮定:独立変数の各値について、従属変数の分布は正規でなければなりません。従属変数の分布の分散は、独立変数のすべての値に対して一定である必要があります。従属変数と各独立変数間の関係は線形である必要があり、すべての観測値は独立している必要があります。
SPSS Statisticsを無料で試す
データが線形回帰の仮定を満たしていることを確認する

線形回帰を実行する前に、この手順を使用してデータを分析できることを確認する必要があります。データは、特定の必須前提条件を満たす必要があります。

これらの仮定を確認する方法は次のとおりです。

  1. 変数は連続レベルで測定する必要があります。連続変数の例としては、時間、売上、体重、テストのスコアなどがあります。
  2. 散布図を使用すると、これら2つの変数間に線形関係があるかどうかをすぐに確認できます。
  3. 観測値は互いに独立している必要があります(つまり、依存関係があってはなりません)。
  4. データには有意な外れ値がない必要があります。
  5. 等分散性をチェックします。これは、最適な線形回帰直線に沿った分散がその直線全体にわたって同様のままであるという統計的概念です。
  6. 最適回帰直線の残差(誤差)は正規分布に従います。
この実践的なチュートリアルを使用して、線形回帰データの仮定についてさらに学びましょう
線形回帰の成功例
傾向と売上予測の評価

線形回帰分析を使用して、年齢、学歴、経験年数などの独立変数から営業担当者の年間総売上高(従属変数)を予測することもできます。

料金体系の弾力性の分析

料金体系の変更は消費者の行動に影響することが多く、線形回帰を使用するとその影響を分析できます。たとえば、特定の製品の価格が変化し続ける場合、回帰分析を使用して、価格が上昇するにつれて消費量が減少するかどうかを確認できます。価格が上昇しても消費が大幅に減少しない場合はどうなるのか、購入者はどの価格帯で製品の購入をやめるのか、といった情報は、小売業を営むリーダーにとって非常に役立ちます。

保険会社のリスク評価

リスクの分析には、線形回帰法を使用できます。たとえば、保険会社は、住宅所有者の保険金請求を調査するためのリソースが限られている場合があります。線形回帰を使用すると、同社のチームは請求コストを見積もるためのモデルを構築できます。この分析は、企業のリーダーがどのようなリスクを取るべきかについて重要なビジネス上の決定を下すのに役立つことがあります。

スポーツ分析

線形回帰は、必ずしもビジネスに限ったことではありません。スポーツにおいても重要です。たとえば、バスケットボール・チームがシーズン中に勝利した試合数は、チームが1試合あたりに獲得する平均得点と関係があるのではないかと思うかもしれません。散布図は、これらの変数が線形関係にあることを示します。勝ったゲーム数と対戦相手の平均得点も線形関係にあります。これらの変数には負の関係があります。勝利したゲーム数が増えるにつれて、相手が獲得する平均得点は減少します。線形回帰では、これらの変数の関係をモデル化できます。優れたモデルを使用すると、チームが何試合勝つかを予測できます。

関連ソリューション
IBM SPSS Statisticsソフトウェア

この高速でパワフルなソリューションで、調査と分析を推進しましょう。

SPSS Statisticsを調べる
IBM SPSS Statistics Grad Pack

学生の皆様は、予測分析ソフトウェアを手頃な価格で使用できます。

SPSS Statistics Grad Packの詳細はこちら SPSS Statisticsを無料で試す
IBM® Cognos® Analytics

この実績あるセルフサービス分析ソリューションを活用すると、データを組み合わせて説得力のあるビジュアライゼーションを作成できます。

Cognosソフトウェアの詳細はこちら
参考情報 IBM Knowledge Centerの線形回帰の詳細 無料チュートリアルの線形回帰の簡単な例 線形回帰を使用して自動車販売をモデル化する方法 方法選択変数回帰モデル 線形回帰セットルールについて 線形回帰統計 線形回帰プロット 線形回帰の変数選択方法 新しい変数、予測値、残差、その他の統計を保存