從 Scrapy 學習模組匯入技巧

阿新 • • 發佈：2020-11-29

我們平時匯入第三方模組的時候，一般使用的是import關鍵字，例如：

import scrapy
from scrapy.spider import Spider

但是如果各位同學看過 Scrapy 的settings.py檔案，就會發現裡面會通過字串的方式來指定 pipeline 和 middleware，例如：

 DOWNLOADER_MIDDLEWARES = {
     'Test.middlewares.ExceptionRetryMiddleware': 545,
     'Test.middlewares.BOProxyMiddlewareV2': 543,
 }

  SPIDER_MIDDLEWARES  
= {
    'Test.middlewares.LoggingRequestMiddleware': 543,
 }

我們知道，這裡的Test.middlewares.ExceptionRetryMiddleware實際上對應了根目錄下面的Test資料夾裡面的middlewares.py檔案中的ExceptionRetryMiddleware類。那麼 Scrapy 是如何根據這個字串，匯入這個類的呢？

在 Scrapy 原始碼中，我們可以找到相關的程式碼^[1]：

def load_object(path):
    """Load an object given its absolute object path, and return it.
    object can be a class, function, variable or an instance.
    path ie: 'scrapy.downloadermiddlewares.redirect.RedirectMiddleware'
     
"""

    try:
        dot = path.rindex('.')
    except ValueError:
        raise ValueError("Error loading object '%s': not a full path" % path)

    module, name = path[:dot], path[dot+1:]
    mod = import_module(module)

    try:
        obj = getattr(mod, name)
    except AttributeError:
         
raise NameError("Module '%s' doesn't define any object named '%s'" % (module, name))

    return obj

根據這段程式碼，我們知道，它使用了importlib模組的import_module函式：

首先根據字串路徑最右側的.把字串路徑分成兩個部分，例如：Test.middlewares.LoggingRequestMiddleware分成Test.middlewares和LoggingRequestMiddleware
使用import_module匯入左邊的部分
從左邊部分通過getattr獲得具體的類

現在我們來測試一下。我們建立的測試檔案結構如下圖所示：

其中，pipelines.py檔案的內容如下圖所示：

class Pipeline:
    def __init__(self):
        print('初始化中。。。。')

    def say(self):
        print('說話 。。。。。')

main.py檔案的內容如下圖所示：

from importlib import import_module

path = 'test.pipelines.Pipeline'

dot = path.rindex('.')
module, name = path[:dot], path[dot + 1:]
modu = import_module(module)
obj = getattr(modu,name)

pipeline = obj()
pipeline.say()

執行main.py，可以看到pipelines.py中的Pipeline類被成功執行了，如下圖所示：

參考資料

[1]

相關的程式碼:https://github.com/scrapy/scrapy/blob/master/scrapy/utils/misc.py#L33

轉自：微信公眾號：未聞Code

從 Scrapy 學習模組匯入技巧

我們平時匯入第三方模組的時候，一般使用的是import關鍵字，例如： import scrapy

我的python學習之路-異常處理和模組匯入

本節摘要　　一、模組匯入　　　　1.1 import匯入　　　　1.2匯入任意資料夾下的任意模組

重學Java | 從原始碼學習 springboot redis使用

Spring boot 在2.x之後系統的redis 切換成了Lettuce實現. 為了契合Spring boot自動裝配的思想和優點,儘量在使用的時候使用系統已經提供的,在不滿足的情況下再自己自定義相關的bean 物件.

萌新從TreeMap學習紅黑樹

引萌新學習資料結構挺久的了，常用資料結構都可以手撕，而平衡樹只是瞭解原理，撕不出來，看各種部落格文章也看得暈頭轉向的。

python3 動態模組匯入與全域性變數使用例項

動態匯入有兩種： 1 __main__(): f=\"demo.A\" aa=__main__(f) aa.A.t() 2 import importlib: import importlib

python模組匯入的方法

模組在python程式設計中的地位舉足輕重，熟練運用模組可以大大減少程式碼量，以最少的程式碼實現複雜的功能。

詳解Typescript 內建的模組匯入相容方式

一、前言前端的模組化規範包括 commonJS、AMD、CMD 和 ES6。其中 AMD 和 CMD 可以說是過渡期的產物，目前較為常見的是commonJS 和 ES6。在 TS 中這兩種模組化方案的混用，往往會出現一些意想不到的問題。

Python xlrd模組匯入過程及常用操作

簡介讀取Excle文件，支援xls，xlsx格式安裝：pip3 install xlrd 匯入：import xlrd xlrd 模組方法

模組匯入與內建模組

模組：本質上就是以.py結尾的檔案。其目的就是為了檔案裡的程式碼實現一些功能

如何本地搭建一個支援es6的import from 模組匯入環境

今天想使用一下import from語法測試個東西，結果在node環境中執行時，報錯，說不支援import語法，之前都是在vue-cli的環境中直接使用的，還以為不需要什麼環境呢。。。

手牽手，從零學習Vue原始碼系列二（變化偵測篇）

系列文章：手牽手，從零學習Vue原始碼系列一（前言-目錄篇) 手牽手，從零學習Vue原始碼系列二（變化偵測篇）

python 19個值得學習的程式設計技巧

Python最大的優點之一就是語法簡潔，好的程式碼就像虛擬碼一樣，乾淨、整潔、一目瞭然。要寫出 Pythonic（優雅的、地道的、整潔的）程式碼，需要多看多學大牛們寫的程式碼，github 上有很多非常優秀的原始碼值得閱讀

Python爬蟲之Scrapy學習

為什麼要用爬蟲框架？如果你對爬蟲的基礎知識有了一定了解的話，那麼是時候該瞭解一下爬蟲框架了。那麼為什麼要使用爬蟲框架？

java版開源工作流引擎ccflow從表資料資料來源匯入設定

>>> 關鍵字馳騁工作流引擎流程快速開發平臺workflow ccflow jflow.net開源工作流

零基礎如何高效學習程式設計｜成就我的10個程式設計學習實用小技巧

這幾天有很多小夥伴私信問我：老鬼呀，我最近開始學習程式設計，但是感覺自己的學習效率特別的低，你是怎麼學習程式設計的呢，有什麼好的學習方法，如何高效的學習程式設計，學習程式設計有什麼方法論嗎？

JavaScript中的模組匯入有一個缺點

在使用ES2015模組匯入功能的時候你有什麼覺得不爽的地方嗎？反正我有！下面就來說說。

PE學習：匯入表注入

最近深感自己基礎不牢，回頭學了一遍PE，順手做了個匯入表注入的小練習首先準備一個DLL用來測試

Zend Framework學習 -- 模組

2019獨角獸企業重金招聘Python工程師標準>>> 專案中按照業務劃分模組，使專案結構更清晰

SOLIDWORKS: Importing Geometry From Other Applications SOLIDWORKS：從其他應用程式匯入幾何體 Lynda課程中文字幕

SOLIDWORKS: Importing Geometry From Other Applications 中文字幕 SOLIDWORKS：從其他應用程式匯入幾何體中文字幕SOLIDWORKS: Importing Geometry From Other Applications

Simulink學習——模組封裝（建立簡單封裝）

建立模組封裝我們經常會看到一些庫，裡面的模組長得和基礎simulink元件區別很大，看上去很酷，雙擊他們會有一些明顯是二次開發的對話方塊，而且模組裡面含有了複雜的子系統。那麼如何將自己做的模型也做成