博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
命令行工具(2)
阅读量:5300 次
发布时间:2019-06-14

本文共 753 字,大约阅读时间需要 2 分钟。

一 配置文件scrapy.cfg

1 全局配置文件路径  盘符: ... \scrapy\scrapy

 

2 项目配置文件

  

配置文件的优先级别: 用户定义的配置文件优先级别高于系统范围的默认值.

 

二 创建醒目的基本命令

scrapy startproject myproject #创建项目cd myproject #进入项目根目录scrapy genspider mydomain mydomain.com #创建爬虫文件scrapy crawl mydomain  #启动爬虫文件

 

三 命令分类

全局命令

  •   #创建项目
  •     #创建爬虫文件
  •      #查看配置信息
  •     #启动某爬虫文件
  •        #启动爬虫shell交互界面
  •        #爬取某网页
  •        #网页查看爬取数据
  •      #查看爬虫版本

 

仅限项目的命令:

  •    #启动爬虫文件
  •    #爬虫语法检测        
  •    #查看爬虫列表
  •    #编辑爬虫文件
  •   #解析某网页
  •   

 

四 用法示例

$ scrapy list #查看爬虫列表spider1spider2$ scrapy edit spider1 #编辑爬虫文件$ scrapy view http://www.example.com/some/page.html #网页打开请求页面源码$ scrapy shell [url] #启动shell$ scrapy parse http://www.example.com/ -c parse_item$ scrapy settings --get DOWNLOAD_DELAY$ scrapy runspider myspider.py  #启动指定爬虫文件$ scrapy version [-v] #查看爬虫版本

 

转载于:https://www.cnblogs.com/angle6-liu/p/10725284.html

你可能感兴趣的文章
十. 图形界面(GUI)设计9.列表和组合框
查看>>
10.17动手动脑
查看>>
操作系统实验一:并发程序设计
查看>>
互联网协议入门(一)
查看>>
16_Python变量作用域_Python编程之路
查看>>
js index of()用法
查看>>
XSS原理及防范
查看>>
WPF中Image显示本地图片
查看>>
SVN版本管理
查看>>
哈希表等概率情况下查找成功和查找不成功的平均查找长度的计算
查看>>
Windows Phone 7你不知道的8件事
查看>>
脚本删除文件下的文件
查看>>
实用拜占庭容错算法PBFT
查看>>
java b组 小计算器,简单计算器..
查看>>
java的二叉树树一层层输出,Java构造二叉树、树形结构先序遍历、中序遍历、后序遍历...
查看>>
php libevent 定时器,PHP 使用pcntl和libevent实现Timer功能
查看>>
php仿阿里巴巴,php实现的仿阿里巴巴实现同类产品翻页
查看>>
matlab fis编辑器在哪,基本FIS编辑器
查看>>
linux的串口子系统,TTY子系统
查看>>
修改linux远程22端口,linux修改ssh远程端口22
查看>>