回帰ってなに
雰囲気もなにもわからず ML Study Jams を続けるのは辛い。せめて雰囲気だけでも捉えたい。
回帰 regression
- 変数
- 順序付け不能な離散変数
- 順序付け可能な離散変数
- 連続変数
- 尺度: 変数の性質についての分類
- 名義尺度
- 順序尺度
- など
- 代表値: 要約した値
- 平均値/
- 中央値
- など
- 回帰
- regression
- 統計学において、Y が連続値の時にデータに Y = f(X) というモデルを当てはめる事 https://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90
- 回帰分析
- regression analysis
- 回帰により分析する事
- 最も基本的なモデルは Y = AX + B という形式の線形回帰である https://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90
- 回帰分析とは、ある変数xが与えられたとき、それと相関関係のあるyの値を説明・予測することです。 http://www.randpy.tokyo/entry/2017/06/16/153435
- たくさんの変数を持つ集まり (= ベクトル) についてある関数にノイズが加わったような状態が事例として観測されました。このときその関数を予測しましょうというのが回帰分析です。 https://qiita.com/ynakayama/items/5732f0631c860d4b5d8b
線形回帰 linear regression
- グラフの点からモデルを当てはめて線を得たの図 https://ja.wikipedia.org/wiki/%E7%B7%9A%E5%BD%A2%E5%9B%9E%E5%B8%B0#/media/File:Normdist_regression.png
- 例では線形関数(1次関数)を仮定しているので、線形回帰となりますが、非線形関数を仮定した場合は、非線形回帰になります http://www.randpy.tokyo/entry/2017/06/16/153435
- 「BigQuery ML 予測モデルによるタクシー運賃の予測」は線形回帰
このラボでは、BigQuery の一般公開データセットに含まれる数百万件に及ぶニューヨーク市内のタクシー賃走データを探索します。その後、機械学習モデルを BigQuery 内に作成し、モデル入力に基づいてタクシー運賃を予測します。最後に、モデルの性能を評価し、予測を行います。
ロジスティック回帰 Logistic regression
- ベルヌーイ分布に従う変数の統計的回帰モデルの一種である。連結関数としてロジットを使用する一般化線形モデル (GLM) の一種でもある
- 社会科学分野での典型的な応用として、企業の過去のデータをもとに信用リスクを推定するという用法がある。
- 線形モデルの一種であることは分かった https://ja.wikipedia.org/wiki/%E3%83%AD%E3%82%B8%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%9B%9E%E5%B8%B0
- 線形回帰と似ているが、目的変数が2値のときに利用する。 例えば、この人は商品を購入するか否か、棒に当たるか否か、引っ越すか否か、転職するか否かなどなど。 https://qiita.com/yshi12/items/3dbd336bd9ff7a426ce9
- 「BQML で分類モデルを使用して訪問者の購入を予測する」はロジスティック回帰。買う/買わないを予測
このラボでは、このデータを使用して一般的なクエリを実行し、企業が知りたい顧客の購買習慣に関する情報を取得します。