爬蟲系列結束了,但是你的學習之路永遠不會停止
這個系列還有很多沒辦法 Cover 到的地方
像是我沒有講到 Scrapy,因為我自己也沒學過這個框架
我也沒有寫一篇超詳細的教學來介紹 Selenium,雖然我沒用過是一個原因
但最大的重點是 : 我不可能真的寫 Selenium 的教學,因為網路上已經很多了
做這個爬蟲系列的重點在於提出很多「關鍵字」,然後引導大家去思考跟查資料
有一件很現實的事情,就是你看完整個系列,你也不會直接變成爬蟲高手
其實不只是我的文章,就像市面上有任何一本書告訴你看完就是高手,那絕對是假的
資工領域的技術尤其是這樣,技術日新月異,怎麼可能有學完的一天 ?
以爬蟲來說,每個網站要處理的表單不同,資料擺放也不同,不可能有爬完的一天
面對這樣的狀況,我只能把我認為爬蟲「核心」的部分提出來
告訴讀者哪些重要 ? 哪些可以看看就好 ?
最後讀者要有能力知道它想要什麼「關鍵字」,進而去 Google 解決自己的問題
我發現到,很多「爬蟲教學」都只是在解釋每個函式庫怎麼使用而已
而忽略了爬蟲的基礎是 HTTP 協定
的確,你可以完全不懂 HTTP 也能寫爬蟲,但是如果你懂,你會更理解 requests
還有一件事情,自學者很需要一個即時回饋的管道,或者說任何人都需要
如果由我自己來寫爬蟲系列,那底下的留言區就是大家最直接獲得回饋的管道
有什麼問題直接問,讓我來回答你的概念
當然我更希望你直接加入資工串的討論,而不是只針對我一人提問
就這樣,我想說的話都說完了,希望可以在資工串看到更多新血