創作內容

0 GP

e-hentai crawler test

作者：艾倫D索妮雅│2020-07-22 16:37:56│巴幣：0│人氣：591

github: test

####### e-hentai 爬蟲測試 #######

import urllib.request as req

import requests from bs4

import BeautifulSoup

import os

import time

url = 'https://e-hentai.org/s/67763a1e8c/1298046-1'

Header = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36'}

pagenum = 127 #總頁數

count = 1 #計算目前存到第幾頁

def crawl(url,count):

source = req.Request(url,headers = Header)

with req.urlopen(source) as response:

data = response.read().decode('utf-8')

page = BeautifulSoup(data,"html.parser")

div = page.find('div',id='i3') #找出div id為i3

Next_link = div.a['href'] #抓div中的a標籤提取裡面href的路徑

img = div.a.img['src'] #抓div中的a中的img標籤提取裡面src的路徑

fname = 'D:\\本子存放區\\My Showgirl Nina\\'+str(count)+'.jpg' #檔案儲存路徑+名稱

download = requests.get(img)

with open(fname,'wb') as f:

f.write(download.content)

f.close()

del download

print('downloaded: '+fname.split('\\')[-1])

if(count<pagenum):

count+=1

del source

crawl(Next_link,count)

#開始抓爬

crawl(url,count)

喜歡收藏引用留言推上首頁檢舉

引用網址：https://home.gamer.com.tw/TrackBack.php?sn=4857466
All rights reserved. 版權所有，保留一切權利

相關創作

【雷迪雜談】想委託繪師？新手委託人需注意的那些事-前置作業篇

【不定時日誌】關於《鋼彈SEED FREEDOM》4DX限定特典小說場次未到先發完的後續

24.0514大型更新

留言共 2 篇留言

緋：
這早就有人寫ㄌ

07-22 22:33

艾倫D索妮雅：
要去哪裡載@@07-22 23:36

緋：
ㄅ過我的是N變態 E的應該也很好找啦直接GOOGLE就有了阿

07-23 12:09

我要留言提醒：您尚未登入，請先登入再留言

喜歡★arthur850512 可決定是否刪除您的留言，請勿發表違反站規文字。

前一篇：跟風...#sailor... 後一篇：紀錄vs2017 .py...

追蹤私訊切換新版閱覽

作品資料夾

一些資訊知識 (4)

JavaScript + html (10)

Gameplay遊戲紀錄 (3)

Lobster0627 給全體巴友：
大家可以多多來我的YT頻道看看哦(*´∀`)~♥https://www.youtube.com/@lobstersandwich看更多我要大聲說昨天18:30