線形回帰とは

線形回帰とは、ある変数の値を別の変数の値から予測するために使用される分析方法です。予測する変数は従属変数と呼ばれます。また、他の変数の値を予測ために使用する変数は独立変数と呼ばれます。

この形式の分析では、従属変数の値を最もよく予測する1つ以上の独立変数を含む線形方程式の係数を推定します。線形回帰は、予測された出力値と実際の出力値の間の差異を最小限に抑える直線または曲面を近似します。「最小二乗法」を使用して、一組の対になったデータに対して最適な直線を発見する単純な線形回帰計算機があります。次に、Y（独立変数）からX（従属変数）の値を推定します。

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

予測をより簡単に生成

Microsoft Excelで線形回帰を実行したり、線形回帰式、線形回帰モデル、線形回帰式を使用するプロセスを大幅に簡素化するIBM SPSS Statisticsなどの統計ソフトウェア・パッケージを使用できます。SPSS Statisticsは、単純線形回帰や多重線形回帰などの手法で活用できます。

線形回帰法は、次のようなさまざまなプログラムや環境で実行できます。

R線形回帰
MATLAB線形回帰
Sklearn線形回帰
線形回帰Python
Excelの線形回帰

AI Academy

カスタマー・サービスでAIを活用する

生成AIが、セルフサービス、ヒューマン・エージェント、コンタクト・センターの運用という3つの主要領域で、よりシームレスなエクスペリエンスで顧客を満足させ、組織の生産性を向上させる方法をご覧ください。

エピソードに移動

線形回帰が重要な理由

線形回帰モデルは比較的単純で、予測を生成できる解釈しやすい数式を提供します。線形回帰は、ビジネスや学術研究のさまざまな分野に応用できます。

線形回帰は、生物学や行動科学、環境科学、社会科学からビジネスに至るまで、あらゆる分野で使用されていることがわかります。線形回帰モデルは、科学的に確実に未来を予測する方法として実証されています。線形回帰は長い間確立されてきた統計手順であるため、線形回帰モデルの特性はよく理解されており、非常に迅速に学習できます。

未来を科学的かつ確実に予測する実証済みの手法

ビジネスや組織のリーダーは、線形回帰手法を使用することで、より適切な意思決定を行うことができます。組織は大量のデータを収集します。線形回帰は、経験や直感に頼るのではなく、そのデータを使用して現実をより適切に管理するのに役立ちます。大量の未加工データを実用的な情報に変換することができます。

また、線形回帰を使用すると、同僚が以前見たことがあり、すでに理解していると思っていたパターンや関係を明らかにすることで、より優れたインサイトを提供することもできます。たとえば、販売および購入データの分析を実行すると、特定の日または特定の時間における特定の購入パターンを明らかにすることができます。回帰分析から収集されたインサイトを利用することで、ビジネス・リーダーが自社製品の需要が高まる時期を予測できます。

有効な線形回帰の主な仮定

線形回帰分析を成功させるために考慮すべき前提条件は以下のとおりです。

各変数について：有効なケースの数と平均および標準偏差を考慮します。
各モデルについて：回帰係数、相関行列、部分相関と偏相関、多重 R、R2、調整済みR2、R2の変化、推定値の標準誤差、分散分析テーブル、予測値と残差を考慮します。また、各回帰係数の95％の信頼区間や分散共分散行列、分散インフレーション係数、許容誤差、Watson、距離尺度（マハラノビス、クック、レバレッジの値）、DfBeta、DfFit、予測区間、ケースごとの診断情報を考慮します。
プロット：散布図、部分プロット、ヒストグラム、正規確率プロットを考慮します。
データ：従属変数と独立変数は定量的である必要があります。宗教や専攻分野、居住地域などのカテゴリー変数は、バイナリー（ダミー）変数や他のタイプの対照変数に再コード化する必要があります。
その他の仮定：独立変数の各値について、従属変数の分布は正規でなければなりません。従属変数の分布の分散は、独立変数のすべての値に対して一定である必要があります。従属変数と各独立変数間の関係は線形である必要があり、すべての観測値は独立している必要があります。

データが線形回帰の仮定を満たしていることを確認しましょう

線形回帰を実行する前に、この手順でデータを分析できることを確認する必要があります。データは、特定の必須前提条件を満たす必要があります。

これらの仮定を確認する方法は次のとおりです。

変数は連続レベルで測定する必要があります。連続変数の例としては、時間や売上、体重、テストのスコアなどがあります。
散布図を使用すると、これら2つの変数間に線形関係があるかどうかをすぐに確認できます。
観測値は互いに独立している必要があります（つまり、依存関係があってはなりません）。
データには有意な外れ値が含まれてはいけません。
等分散性をチェックします。これは、最適な線形回帰直線に沿った分散がその直線全体にわたって同様のままであるという統計の概念です。
最適回帰直線の残差（誤差）は正規分布に従います。

線形回帰の成功例

傾向と売上予測の評価

線形回帰分析を使用して、年齢や学歴、経験年数などの独立変数から営業担当者の年間総売上高（従属変数）を予測することもできます。

料金体系の弾力性の分析

料金体系の変更は消費者の行動に影響することが多いですが、線形回帰を使用するとその影響を分析できます。たとえば、特定の製品の価格が変化し続ける場合、回帰分析を使用して、価格が上昇するにつれて消費量が減少するかどうかを確認できます。価格が上昇しても消費が大幅に減少しない場合はどうなるのか、購入者はどの価格帯で製品の購入をやめるのか、こういった情報は、小売業を営むリーダーにとって非常に役立ちます。

保険会社のリスク評価

リスクの分析には、線形回帰法を使用できます。たとえば、保険会社は、住宅所有者の保険金請求を調査するためのリソースが限られている場合があります。線形回帰を使用すると、同社のチームは請求コストを見積もるためのモデルを構築できます。この分析は、企業のリーダーがどのようなリスクを取るべきかについて重要なビジネス上の決定を下すのに役立つことがあります。

スポーツ分析

線形回帰は、必ずしもビジネスに限ったものではありません。スポーツにおいても重要です。たとえば、バスケットボール・チームがシーズン中に勝利した試合数は、チームが1試合あたりに獲得する平均得点と関係があるのではないかと考えることがあるかもしれません。散布図は、これらの変数が線形関係にあることを示します。勝ったゲーム数と対戦相手の平均得点も線形関係にあります。これらの変数には負の関係があります。勝利したゲーム数が増えるにつれて、相手が獲得する平均得点は減少します。線形回帰では、これらの変数の関係をモデル化できます。優れたモデルを使用すると、チームが何試合勝つかを予測できます。

生成AI + MLの力を解き放つ

生成AIと機械学習をビジネスに活用する確実な方法を学びましょう。

線形回帰とは