クロス集計とか便利すぎだろ!
初心者ゆえにクロス集計という言葉すら知らずに、いわゆるクロス集計を自前で実装していました。しかもクソおそい。馬鹿かよほんと。
この流れでヒートマップを作ればかなりいい感じに可視化をできる気がします。
まずはクロス集計
import numpy as np from pandas import * import matplotlib.pyplot as plt df = read_csv('tips.csv') # CSV データのクロス集計をおこなう cross = crosstab(df.day, df.size) print( cross )
ちなみにcrosstabの返り値はデータフレーム型です。
ヒートマップ!!
ax = plt.subplots() heatmap = ax.pcolor(cross, cmap=plt.cm.Blues) plt.show()
たったこれだけでクールなヒートマップが描けちゃいます。
マジで自前クロス集計書いてた時間戻ってきてくれ...
p.s. 結局、発想より知識ってことっすね