前往
大廳

主題

可用於分析場外是否有網軍與其熱門趨勢?場外爬蟲程式碼

我也太廢了吧 | 2022-07-02 08:09:28 | 巴幣 10 | 人氣 506

上篇的只要文章中的程式碼即可運行

這篇相較上篇的程式碼比較完整且複雜

所以獨立用一篇來記錄這樣

程式碼在這

用Scrapy去爬巴哈姆特場外休憩區的標題跟預覽內文

並輸出csv檔

連結中有附上其他人的教學

我主要是來這裡紀錄自己的東西

要跑專案的話下載專案檔後

開啟CMD小黑窗

cd指令到專案資料夾位置

然後pip install -r requirements.txt安裝相關套件

最後再輸入Scrapy crawl BH即可運行

可以設定要爬多少頁，我試過至少可以爬百頁以上

不過過度對巴哈伺服器發出請求會對巴哈伺服器造成影響

還在測試的程式碼，建議不要一次設定爬太多頁

以下這是匯出成CSV的結果

因為標題太多字了，所以內文被標題遮住

#爬蟲 #場外 #程式 #python

5

創作回應

我也太廢了吧 iamjone

追蹤創作集

作者相關創作

作品資料夾

可用於分析場外是否有網軍與其熱門趨勢?場外爬蟲程式碼

巴哈場外休憩區10頁簡易標題爬蟲

利用100頁的場外標題及預覽內文製作星爆文字雲

關於探討人生意義的動畫-靈魂急轉彎與隻手探險簡易感想

5/28 自身抱怨廢文，總要為過去行為付出代價

寫歌day2 試唱方面的困難

寫歌day 1

5/13 近況與未來或許會做的事

一袋米要扛幾樓

住家外傍晚的彩虹

OCA習題（一）

6/29(廢文）不經意又陷入痛苦的的迴圈

動畫瘋算還行的推理類動畫，重啟咲良田與艾梅洛閣下二世簡易無雷感想

5/24尋找或轉移替代的情感與事物

5/17生命的意義

還是一樣爛啦

5/10略感煩躁

5/2回診與不敢面對的未來

混亂的心情

4/26廢文

外星文 Ñ ±â´ÉÀ¡Áø ÇÁ·Î±×·¡¹Ö ¾ð

【文梓君想要吸我的血】１１－外星人在命理大樓工作也太衝擊！

外星人:我他媽為和平而來｜梗圖分享

[黏土]外星人田中太郎詹姆士

外星人觀察日記

相關創作

達人【爬蟲 + React + SQLite】實現無後端SQL查詢，養生寫前端

%%鼠拒收病婿

22

1820

車圖爬蟲 : BahaDrift (Ver 0.1.0) - 讓你再也不缺席！

8

588

[Python] 爬蟲程式練習3

0

101

[Python] 爬蟲程式練習2

0

189

[EN] AI VTuber 來教你 Python

4

609

達人 [星爆AI #1] 了解繪圖AI原理，圖像生成對抗網路 GAN 基礎篇

%%鼠拒收病婿

24

2374

G-Banner - Ver 0.1.0 使用說明

11

494

達人 [Python+ CV ] 修圖軟體製作：GUI框架, JS事件, 縮放拖拉, based64轉numpy

%%鼠拒收病婿

29

1143

雜談(4) - Echo Server

6

534

[Docker] 在Mac M1使用Docker安裝MySQL,並存取本地端資料

帥氣跳蚤蛋

1

2962

【手把手帶你學會爬蟲】#4 認識 Http

3

1023

【程式作品】嘉義大學選課輔助器

15

1912

[Design Pattern C#] Observer Pattern 觀察者模式 Event &Delegate

帥氣跳蚤蛋

5

649

【手把手帶你學會爬蟲】#3 別著急！先來找 API！

5

5055

[LeetCode Python] 5. Longest Palindromic Substring— Dynamic Programming

帥氣跳蚤蛋

3

797

【手把手帶你學會爬蟲】#2 認識 HTML

1

642

【手把手帶你學會爬蟲】#1 介紹爬蟲(或叫序章？)

4

637

紀錄些最近學到的程式小知識 - 讚美Golang

2

455

[Design Pattern C#] Iterator Pattern 迭代器模式與 yield

帥氣跳蚤蛋

2

501

[Design Pattern C#] Decorator Pattern 裝飾者模式範例

帥氣跳蚤蛋

3

610

更多創作

我也太廢了吧 iamjone

追蹤創作集

其他創作

作品資料夾