データが主食

データ系エンジニアのぽえむ。分析だったり、読んだ本のメモだったり。

書籍「Designing Data-Intensive Applications」まとめ(Part2)

ktr89.hateblo.jp

に引き続き「Designing Data-Intensive Applications」のまとめです。

Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

Part II. Distributed Data

通常だとRDBをもっと深入りしそうなところですがいきなり分散データのPartです。楽しみですね。

続きを読む

書籍「Designing Data-Intensive Applications」まとめ(Part1)

はじめに

Designing Data-intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

Designing Data-intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

機械学習人工知能ビッグデータ。胡散臭いバズワードが流行しています。機会学習理論を理解するためには、線形代数が必要だみたいな言説をよく耳にしますが、処理基盤がないと何もできません。ということで、ビッグデータ処理基盤に関するオライリー本です。まだ日本語訳も出ておらず、情報も少ないので読んだ部分を整理していこうと思います。かなりボリュームのある本ですので、章ごとにまとめていきます。

Part I. Foundations of Data Systems

続きを読む

都道府県ごとBMI分布は?東京都の女性は痩せているのか?

今回は政府が公開しているNDBオープンデータをグラフ化して見たいと思います。

 

NDBオープンデータとは?

f:id:ktr89:20170924230654p:plain

http://www.mhlw.go.jp/file/06-Seisakujouhou-12400000-Hokenkyoku/0000139560.pdf

 

わかりやすく示されているということなので、本ブログでも分析をかけてみようと思います。

 

都道府県ごとのBMIの分布

女性にとってはデリケートな部分ですが、気になるところでも有ります。BMIを見てみましょう。

 

f:id:ktr89:20170924230410p:plain
f:id:ktr89:20170924230402p:plain

今回は、美人や非美人が多いと言われている(自分の周りで)5つの都道府県を分析対象とします(北海道、東京都、福岡県、秋田県、茨城県)。性別ごとに、BMIの比率を累積しグラフ化しています。

 

東京都の女性は痩せている

左側のグラフが女性ですが、東京都の女性のBMIは低いことがわかります。一方で、北海道の女性のBMIは大きいこともわかります。

 

男性のBMIは都道府県によらず変わらない

右側のグラフが男性ですが、都道府県によらず変わらないですね。これもおもしろいです。

 

 

今回の分析対象データ

老人比率の高い都道府県は?現在と2040年。

久しぶりのRESAS APIの可視化です。

 

前回は人口ピラミッドの時系列可視化にチャレンジしました。

 

今回は、それを都道府県単位で切って見ていこうと思います。とくに、社会保障という観点では、人口に対する老人比率ではないでしょうか?

 

各都道府県ごとの人口に対する老人比率

今回はこの指標を可視化して、気付きを得てみたいと思います。以下が、2015年現在の各都道府県ごとの老人比率です。やはり、都会では低いことがわかりますね。一方で日本海側の老人比率が高いことも分かります。

f:id:ktr89:20170903230807p:plain

秋田の老人比率は日本一です。友人から過疎が進んでいるという話は聞いていましたが、日本一だとは思っても見ませんでした。

 

2040年の老人比率は?

では、未来ではどうなっているのでしょうか?こちらも可視化してみましょう。

f:id:ktr89:20170903230549p:plain

正直、あまり変わらないですね。行政が現在値から予測したデータなので、しょうがないですね。

 

 

 

間取りを地図にマッピング。家族向けマンションは郊外か?

不動産価格分析シリーズです。

今回の分析対象はマンションの間取りです。 

都内のマンションなら1Lが貸しやすいとか、郊外のマンションなら3LDKが貸しやすいとか、そういった話をよく耳にします。たしかにそれっぽい話ではあるものの、実際のところよくわからないです。不動産投資をしている個人の経験を聞いても、タイミングも違いますし、同じ物件は複数ないですよね。なので、「とある事例」を聞くよりも、実データに基づく分布が気になるところです。

 

3LDK、4LDKなどのファミリー層向けマンションって少し郊外にあるイメージですよね。

都心で子育てしたくないとか、純粋に間取りの割に安いということもあって、郊外でファミリー層向けマンションを購入する方が多いのではないでしょうか。

参考

「ブログを始めた理由・マンションでは3LDKが最も多い間取りです」 - 4人家族なのに3LDKのマンションインテリア

 

売りに出されている中古マンションの位置と間取りの関係

今回の分析では、間取りごとに地図上のどこあたりに位置しているのかを明らかにしていきます。都内でよく売られている中古マンションの間取り、郊外でよく売りに出されている中古マンションの間取り、そういったものを可視化していきます。

(売りに出されているだけで、需要が有るのかはわかりません。。。。。)

 

下のグラフは、売出し中の中古マンション間取りで色分けしてを緯度・経度でプロットしたものです。

f:id:ktr89:20170819134556p:plain

都内では部屋数少なめ、郊外は部屋数多め

わかりやすくでましたね。

1LDKなどの単身層向けマンションは都心に集中し、郊外にはあまりないことが分かります。

一方で、3LDK、4LDKなどのファミリー層向けマンションは郊外に散らばっていますね。

 

供給量はわかりましたが、需要量も知りたいところ。日本の不動産売買情報は一般に公開されていないので生データを取得することはできません。

 

 

今回の分析対象データは以下参照。