这几天写爬虫上瘾了。。
首先,还是仅支持python3
开源地址Github:https://github.com/eqblog/pornhub-
其次,需要以下库:
pip3 install requests pip3 install lxml pip3 install bs4
使用方法(示例):
视频爬虫使用:
python3 pornhub_spider.py [分类] [清晰度]
例如:
python3 pornhub_spider.py 111 240
视频url使用(会生成url.txt文件,url储存在此文件内):
python3 pornhub_spider_url.py [分类] [清晰度]
例如:
python3 pornhub_spider_url.py 111 240
刚才试了一下 貌似下载不了 能爬到 标题 下载不了
pornhub的爬虫单线程下载很慢,建议你爬下url拿多线程下载器下载
python3 pornhub_spider_url.py 111 240 也爬不出来东西
依赖都是安装好的
windows 安裝了python3
輸入這3條命令都沒反應
pip3 install requests
pip3 install lxml
pip3 install bs4
环境变量有设置好吗?
返回了什么错误?
大佬这个111分类是怎么分类的
大佬 我这开始就错什么鬼?
Traceback (most recent call last):
File “/Users/a1/PycharmProjects/pornhub–master/pornhub_spider.py”, line 8, in
cat=sys.argv[1]
IndexError: list index out of range
某1加密了,爬虫失效了。