1. HOME
  2. ブログ
  3. Python初心者が機械学習で売上を予測してみた(クスノキ・プロジェクトへの招待 Vol.23)

Python初心者が機械学習で売上を予測してみた(クスノキ・プロジェクトへの招待 Vol.23)

こんにちは。インターン生の中村友南です。

少しずつ暖かい日が増え、春の訪れを感じる季節となりました。
新しいことを始めたくなるこの時期に、皆さまはいかがお過ごしでしょうか。私はこのクスノキ・プロジェクトを通して、プログラミングという今まで想像もしていなかった新しい領域に踏み出し、日々成長を感じています。

クスノキ・プロジェクトは、機械学習を1から学びたい皆さまを歓迎しています。
ぜひ一緒に、新しい一歩を踏み出してみませんか。

 

さて・・・

前回のブログでは、機械学習の全体像を整理し、とりわけ「分類」をPythonで体験しました。今回はもう一つの基本である、回帰(Regression)を学んでいきます。前回・前々回から続く内容になっていますので、まだの方はぜひあわせてご覧ください。👇

[回帰のイメージ]

回帰は与えられたデータから数値を予測することを指します。分類と違い、結果は 数値そのものになります。

グラフで見ると、 点の集まりに 一本の線(関数)を当てはめるイメージになります。

回帰の具体例は以下のようなものです。

  1. 明日の気温は何度か
  2. 売上はいくらになるか

「いくら?」「どれくらい?」を予測するのが回帰です。
過去のデータに見られる傾向をもとに、将来どの程度の値になるのかを推定することができます。売上予測や気温予測のように、「どれくらいになるのか」を見積もる場面で活用されます。

ここで、前回の内容を振り返って、分類と回帰を比較してみましょう。

分類 回帰
合格 or 不合格 点数は何点か
購入する or しない 売上はいくらか
YES / NO 数値

 

どちらも「データから学習する」という点は同じですが、答えの形が違うことが最大のポイントです!

 

それでは、実際にPythonで回帰を体験していきます。今回は「広告費から売上を予測する」例を使います。画像のコードをそのまま貼り付けてみるだけでも、十分だと思います。ぜひ一緒に手を動かしてみましょう!

 

Step1:ライブラリを読み込む

まずは、次のコードをそのまま貼り付けて実行してください。

ここでは、数字を扱うのが得意なツールと、予測をするのが得意なツールを呼び出しています。
ツールを呼び出すための、一つの「テンプレート構文」です。まずは動かしてみましょう!今回使うのは「線形回帰」という最も基本的なモデルです。

 

Step2:データを作る

 

今回は、広告費と売上の簡単なデータを用意します。

 

xが広告費、yが売上です。機械学習では、x:原因になりそうなもの y:予測したい結果 という形で整理します。

今回は「広告費が増えると売上も増える」という関係を学習させようとしています。

 

Step3:モデルを作る

ここで機械学習が行われています。モデルは、売上 = a × 広告費 + b という式の「a」と「b」を自動で計算しています。

「広告費が1万円増えると、売上は何万円増えるのか?」をデータから導き出しているのです。

ここが機械学習の核心部分です。

 

Step4:売上を予測する

では、広告費が「35万円」のとき、売上はいくらになるでしょうか?

 

ここでは、学習した式を使って新しい値を予測しています。これで予測値が表示されます。

 

Step5:グラフで確認する

点(実データ)に対して、一本の直線が引かれます。

  • 点 → 実際のデータ
  • 線 → モデルが学習した法則

この直線が、データの傾向に合っていれば、「うまく学習できている」と言えます。

機械学習では、数字だけでなく目で確認することも非常に重要です。

 

今回取り上げたような売上予測は、企業経営の根幹です。

  • どれだけ広告を出すべきか
  • 在庫をどれくらい仕入れるか
  • 来月の資金繰りはどうなるか

こうした判断の土台になります。まさにビジネスに直結する技術と言えるでしょう。

ぜひ今回のモデルを参考にして、実際のビジネス例や日常生活の中にも応用してみてください!

このブログが面白いと思って頂けますならば、インターンシップの励みになります。ソーシャルメディア等で拡散して頂けると幸いです。

※当ブログの記述内容は弊研究所の公式見解ではなく、執筆者の個人的見解です。

株式会社原田武夫国際戦略情報研究所・インターン生 中村友南拝