https://github.com/melody50819/web-crawler
此專案主在爬取 Potato Media 網路論壇的貼文連結。
Potato Media 是全台第一社交挖礦論壇,有別於其他平台,只要在站內做出任何內容或互動貢獻,皆可直接獲得收益。互動內容包含:
本專案使用 Python3,及 Poetry 套件管理環境。
相關套件使用請見 pyproject.toml
。
chromedriver
本專案使用 Python3,及 Poetry 套件管理環境,相關套件使用請見 pyproject.toml
。
chromedriver
post_cnt
:可設定爬取文章連結數量common.py
:主要儲存爬取文章時會用到的套件,包括Selenium
、open()
等相關共用方法。craw_post.py
:主要程式account.json
:存放登入帳號與網站相關urlcookies.json
:可用來存取網站登入cookie(此部分尚未開發完成)post.json
:爬取後的文章連結會寫入此檔案