schedule和CrawlerProcess定時執行多個爬蟲

阿新 • • 發佈：2019-01-09

import smtplib,schedule
# 通過CrawlerProcess同時執行幾個spider
from scrapy.crawler import CrawlerProcess
from spiders.liepin_spider import LiepinSpiderSpider as lie_1
from spiders.liepin_spider_2 import LiepinSpiderSpider as lie_2
from spiders.liepin_spider_3 import LiepinSpiderSpider as lie_3
# 匯入獲取專案配置的模組
from scrapy.utils.project import get_project_settings

def start_spider():
    try:
    #一定要先載入配置檔案
        process = CrawlerProcess(get_project_settings())
        process.crawl(lie_1)
        process.crawl(lie_2)
        process.crawl(lie_3)
        process.start()
        now_time = time.strftime('%Y-%m-%d', time.localtime(time.time()))
        print('---{}---執行完成'.format(now_time))

    except Exception as e:
        print('--出現錯誤--', e)
        #email_spider('liepin', e) #傳送郵件的方法，可以自己寫




def main():
    print('開始檢測，等待時間到達，開始執行')
    schedule.every().day.at("13:04").do(start_spider)
    schedule.every().day.at("17:00").do(start_spider)
    while True:
        schedule.run_pending()
        time.sleep(10)
        

if __name__ == '__main__':
    main()

schedule和CrawlerProcess定時執行多個爬蟲

import smtplib,schedule # 通過CrawlerProcess同時執行幾個spider from scrapy.crawler import CrawlerProcess from spiders.liepin_spider import LiepinSpiderSpi

scrapy順序執行多個爬蟲

clas aio 爬蟲 sleep class abs pan path execute 1 # -*- coding:utf-8 -*- 2 3 from scrapy import cmdline 4 from scrapy.cmdline import e

scrapy 一個專案裡同時執行多個爬蟲

在spiders檔案同級建立一個commands資料夾，建立一個py檔案，我自定義為crawlall.py。 from scrapy.commands import ScrapyCommand class Command(ScrapyCommand): requires_pro

Python開發【筆記】：單線程下執行多個定時器

自動代碼 python 線程 timer ont -s 大量過多單線程多定時器　　前言：公司業務需求，實例當中大量需要啟動定時器的操作；大家都知道python中的定時器用的是threading.Timer，每當啟動一個定時器時，程序內部起了一個線程，定時器觸發執行結

python爬蟲scrapy之如何同時執行多個scrapy爬行任務

還需學習 lis 參數文件名其中 .project 自定義 com 背景：　　剛開始學習scrapy爬蟲框架的時候，就在想如果我在服務器上執行一個爬蟲任務的話，還說的過去。但是我不能每個爬蟲任務就新建一個項目吧。例如我建立了一個知乎的爬行任務，但是我在這個爬行任務中

springboot動態配置定時任務2種方式，整合Quartz多執行緒併發執行多個定時任務配置

我的專案是採用的idea+gradle+springboot專案構建，下面是springboot實現定時任務所需要的jar包 //定時任務使用 compile group: 'org.quartz-scheduler', name: 'quartz', version:

extjs 迴圈執行多個非同步請求時，引數和後臺以及相關問題和衍生問題的處理

在Extjs中，非同步請求的寫法： Ext.Ajax.request({ url: '***.action', //async: false, params: { p1: v1, p2: v2 ... }, success: function(resp

單檔案複製到指定目錄和自動執行多個.bat檔案實現（2012.06.05）

實現程式碼： package com.cn.text; /** * * @author tec_feng */ import java.awt.*; import java.awt.event.ActionEvent; import java.awt.event.Ac

Java異步執行多個HTTP請求的例子（需要apache http類庫）

ride 同步 conn done 例子 latch block org ftw 直接上代碼 package org.jivesoftware.spark.util; import java.io.IOException; import java.uti

怎樣用批處理來執行多個exe文件

asc pri line views bat文件 tro ext sta each 怎樣用批處理來運行多個exe文件 @echo off start *****.exe start *****.exe start *****.exe star

使用SQLCMD在SQLServer執行多個腳本

created 告訴 out c盤 order 步驟 null bat文件 mar 概述：作為DBA，經常要用開發人員提供的SQL腳本來更新正式數據庫，但是一個比較合理的開發流程，當提交腳本給DBA執行的時候，可能已經有幾百個sql文件，並且有執行順

scrapy多個爬蟲公用一些中間件、pipelines

scrapy python 使用python3請求頭headers：user-agent、代理ip，這些放在一個工程項目裏，有的爬蟲是需要中間件的或者根據反爬添加相應的條件，那這樣的情況下怎麽辦？1.中間件處理默認帶上請求頭，不帶啟用ip代理功能spiders文件夾下的爬蟲類添加屬性中間件處理這樣不管

testng.xml 執行多個測試用例

pan nis -- 編輯 XML ini 執行 demo 名稱 1.在工程名字上點擊右鍵，點擊【New】-->【File】 2.在彈出的【New File】對話框中的【File name】輸入【testng.xml】,點擊【Finish】即創建了一個testng的

Appium自動化測試-同時執行多個裝置

在之前的文章中，學習了Appium的基本使用，可以參考Appium自動化測試-入門，我們接著學習一下在一臺電腦中同時執行多裝置的方法，這樣在測試多種裝置的時候，可以直接在本地完成。一、啟動Appium 一個Appium伺服器只能連線一個測試裝置進行測試，如果要在一臺電腦上同時測

Docker建立執行多個mysql容器的方法示例

1.使用mysql/mysql-server:latest映象快速啟動一個Mysql例項 docker run --name ilink_user_01 -e MYSQL_ROOT_PASSWORD=123456 0d 0p 3307:3306 mysql/mysql-server:latest

執行多個Tomcat（Windows平臺）

需求：在一臺計算機上，只安裝一份Tomcat發行版軟體，執行一個以上的Tomcat例項。或者，因為計劃週期性地更新所安裝的Tomcat，不想把Web應用程式的檔案放入Tomcat發行版的目錄樹中。解決方案：《Tomcat權威指南》第2章重置Tomcat，重定向We

多執行緒池，批量執行多個任務(實用總結)

1 import java.util.Random; public class Main { public static void main(String[] args) {

python 在不同CPU上同時執行多個程式

出處/From https://www.quora.com/If-you-run-Python-under-a-dual-core-CPU-then-can-you-run-two-Python-programs-at-once-one-that-utilizes-1-core-and-the-other-u

linux在一行命令列上執行多個命令

1. [ ; ] 如果被分號(;)所分隔的命令會連續的執行下去，就算是錯誤的命令也會繼續執行後面的命令。 [[email protected] etc]# lld ; echo “ok” ; lok -bash: lld: command not fou

10 單臺伺服器執行多個Tomcat

簡介一臺伺服器下運營多個Tomcat 步驟 1. 新增新增的Tomcat相關的環境變數 CATALINA_BASE=c:\tomcat1 CATALINA_HOME=c:\tomcat1 TOMCAT_HOME=c:\tomcat1 CATALINA_2_BAS

schedule和CrawlerProcess定時執行多個爬蟲

相關推薦