MATHGRAM

主に数学とプログラミング、時々趣味について。

python:データ処理tips その3 クロス集計したものをヒートマップで可視化する

クロス集計とか便利すぎだろ!

初心者ゆえにクロス集計という言葉すら知らずに、いわゆるクロス集計を自前で実装していました。しかもクソおそい。馬鹿かよほんと。
この流れでヒートマップを作ればかなりいい感じに可視化をできる気がします。

まずはクロス集計

import numpy as np
from pandas import *
import matplotlib.pyplot as plt

df = read_csv('tips.csv')

# CSV データのクロス集計をおこなう
cross = crosstab(df.day, df.size)
print( cross )

ちなみにcrosstabの返り値はデータフレーム型です。

ヒートマップ!!

ax = plt.subplots()
heatmap = ax.pcolor(cross, cmap=plt.cm.Blues)
plt.show()

たったこれだけでクールなヒートマップが描けちゃいます。
マジで自前クロス集計書いてた時間戻ってきてくれ...

p.s. 結局、発想より知識ってことっすね