ベルリン・ドイツ【Airbnb】データ分析と機械学習

2018年12月24日月曜日

python データ分析 金融マティックス

t f B! P L
前回のボストン・アメリカ【Airbnb】データ分析と機械学習のつづきです。【Airbnb】ドイツのベルリンを対象に、機械学習でデータ分析をしてみました<右手にコンパス>。物件の価格分布、アメニティと価格との関連、ヒートマップなどデータ分析しました。

ベルリン・ドイツ【Airbnb】データ分析と機械学習

ベルリン・ドイツ【Airbnb】を対象にして、機械学習でデータ分析

Airbnbデータの取得/ベルリン【Airbnb】データ分析と機械学習

前回と同じように、データはInside Airbnbというサイトから取得します。

ベルリン近郊のデータを表示/ベルリン【Airbnb】データ分析と機械学習

ベルリンには22552件のAirbnb物件があることが分かります。
地区ごとに物件を整理してもみました。

ベルリン近郊のデータを表示/ベルリン【Airbnb】データ分析と機械学習

物件の評価スコアを整理して表示/ベルリン【Airbnb】データ分析と機械学習

悪い評価のものはあまりなく、高い評価のものが多いようです。

物件の評価スコアを整理して表示/ベルリン【Airbnb】データ分析と機械学習

物件の価格帯を調べて表示/ベルリン【Airbnb】データ分析と機械学習


物件の評価スコアを整理して表示/ベルリン【Airbnb】データ分析と機械学習
ベルリンで最も高価なAirbnbの価格は$ 9000 /泊です。
ほかにも、お城に泊まれる物件など種類も豊富でした。

物件の価格帯を調べて表示/ベルリン【Airbnb】データ分析と機械学習

外れ値を除去した後の物件の価格分布/ベルリン【Airbnb】データ分析と機械学習

1泊300ドルを超える出品と、0ドルの出品を「外れ値」とし削除した上で、物件の価格分布を表示しました。
外れ値を除去した後の物件の価格分布/ベルリン【Airbnb】データ分析と機械学習

今度は、100件以上ある地区を対象に、箱ひげ図を表示。

外れ値を除去した後の物件の価格分布<箱ひげ図>/ベルリン【Airbnb】データ分析と機械学習

外れ値を除去した後の物件の価格分布/ベルリン【Airbnb】データ分析と機械学習

アメニティと価格の関連性を分析/ベルリン【Airbnb】データ分析と機械学習

ジムやエアコンがついている物件は価格が高くなるようです。

アメニティと価格の関連性を分析/ベルリン【Airbnb】データ分析と機械学習

数値データをヒートマップで表示/ベルリン【Airbnb】データ分析と機械学習

収容人数とベッド数、ベッドルーム数は相関の関係にあるといえそうです。

参照サイト


Exploring & Machine Learning for Airbnb Listings in Toronto
機械学習でAirbnbのデータを分析してみた
ボストン・アメリカ【Airbnb】データ分析と機械学習/右手にコンパス
Seaborn でヒートマップを作成する/Pythonでデータサイエンス

このブログを検索

Translate

QooQ