隨著政府開放資料(Open Government Data, OGD)平台的建置,有了更多資料可以玩。配合還可以的電腦和Excel,可以玩一些圖,尋找有趣之處。
會有下面的練習,是我今天聽到一個故事。
一個北上的診所助理有個憂鬱。她今年35,家人問她有沒有在台北買房的打算,如果沒有,不如回來雲林縣,因為20-50歲僅租屋而不買房,房租都夠買房(※這其實是大屁話,但本文設定的重點不在反駁這命題,不過買房有其他效益,以後討論)。
到底這位助理要不要回雲林?決策(decision)中,得考量很多資訊,譬如買房或不買房的方案底下,消費的差別;以及工作尋找的難易度。除此之外,有些考量不是這麼容易量化,譬如臺北和雲林的購物方便,儘管可化約成大致的傾向,卻難以精確量化成刻度,儘管很多時候得唬人,得想辦法量化,為得是要人閉嘴,尤其是你的長輩。
思考問題:如何舉證讓長輩閉嘴
假定我是那位牙醫助理,我可能會考量下列命題,主張我該留在台北:
1. 臺北比雲林好找工作;2. 租房子比買房子划算;
其他隱約考量,但不能公開的考量有:
1. 比起留在父母身邊被控制,我寧願遠離父母;2. 花錢買爽的方便度,臺北>雲林
有些問題我沒還沒時間找資料,但初步來說,我有些想法論證「臺北比雲林好找工作」,利用政府開放資料平台找到「醫療機構基本資料」(resource: https://data.gov.tw/dataset/15393)。
該人員從事護理相關工作,因此我們先考量機構的比例。畢竟機構數量決定了工作量,如果廚師要找工作,A地的餐廳比B地的餐廳多,則我們可以初步假設,相比B地,A地比較好找廚師的工作:
- 雲林區域(雲林縣+彰化縣+嘉義縣+市嘉義)/臺北區域(台北市+新北市)
樞紐分析表
1. 次數分配表(圖1)
2. 交叉表(圖2)
有了這個,基本上可以不必開SPSS了,作圖也很方便(圖3)。至於要跑複雜一點的模型,那可能得借助python或R。
加上GOOGLE地圖,可以表達一個簡單的報告(圖4)。
圖1:次數分配表
圖2:交叉表
圖3:其他圖示例
圖4:結合GOOGLE地圖表達地理位置
代結論:臺北縣市/雲林縣診所數=93/7
顯然,臺北縣市/雲林縣診所數=93/7,若貿然跑回雲林縣,很可能房租省了,卻換成失業。沒錢發洩性消費,也沒存到多少錢。縱使考量範圍從雲林縣擴張到彰化或嘉義,也僅上升17%。何況其他為言明的決策考量,譬如越接近母親等家庭的權力核心,是否更容易被逼做其他決定,尤其結婚--找個沒感情基礎的人嫁了,滿足家族的欲望而犧牲。
本文是我練習樞紐的小紀錄,PO上此留做紀念。除了分享樞紐分析表外,還有政府開放資料,歡迎大家多多使用和給平台建設者提供意見。
參考資料
政府開放資料平台,醫療機構基本資料。https://data.gov.tw/dataset/15393。下載瀏覽日期:20180120。
筆者資訊 |
|
兔草民(nobuusa) 閱讀愛好者,尤好「粗鄙之語」與「王司徒」,現居於台北市。 |