1. 程式人生 > 其它 >教你如何將華為雲CDN日誌轉存到OBS

教你如何將華為雲CDN日誌轉存到OBS

CDN記錄了所有域名(包括已刪除域名,如果您開通了企業專案,則已刪除域名不支援此功能)被網路使用者訪問的詳細日誌,您可以通過CDN控制檯檢視和下載最近30天的日誌,對您的業務資源被訪問情況進行詳細分析。

日誌轉儲存服務是華為雲CDN配合函式工作流,將CDN日誌儲存到OBS桶,可以幫助您將日誌儲存更長的時間,便於您基於長時間的日誌做出自定義的資料分析,有助於您更好地瞭解您CDN的服務質量,以及您的終端客戶的訪問詳情,提高您的業務決策能力。

本文以Python3.6為例,為您介紹通過API建立FunctionGraph函式和Timer觸發器,實現定時將CDN日誌轉存到OBS。

前提條件

暫時僅支援日誌轉存到北京四的OBS桶,請您提前準備好位於北京四的OBS桶。

操作步驟

  1. 建立委託
    a. 登入華為雲控制檯,在左側導航欄,選擇管理與監管>統一身份認證服務
    b. 在左側導航欄,選擇“委託”頁籤,單擊右上方的“+ 建立委託”。
    c. 在建立委託頁面,按照如下引數設定委託。
    * 委託名稱:FG_TO_CDN。
    * 委託型別:雲服務。
    * 雲服務:函式工作流FunctionGraph。
    * 持續時間:永久。

    d. 單擊“下一步”,進入為“FG_TO_CDN”委託配置許可權介面。
    * 許可權選擇:OBS OperateAccess 、CDN LogsReadOnlyAccess。

e. 單擊“下一步”,配置作用範圍。
* 作用範圍:全域性服務。

f.  單擊“確認”,完成委託配置。
  1. 準備函式工作流環境
    a. 登入華為雲控制檯,在左側導航欄,選擇計算>函式工作流”,region選擇“北京四”。
    b. 單擊右上方“建立函式”,進入建立函式介面
    * 選擇模板:建立空白函式。
    * 輸入函式名稱:cdn_to_obs(可自定義)。
    * 所屬應用:選擇預設的“default”。
    * 委託名稱:選擇已建立好的委託“FG_TO_CDN” 。
    * 企業專案:選擇“default”。
    * 執行時語言:選擇“Python 3.6”。
    * 程式碼上傳方式:選擇“預設程式碼”。

    c. 單擊“建立函式”,進入程式碼編輯介面,將

    程式碼示例的程式碼內容貼入線上IDE。

    說明:

    如果有多個域名的日誌需要轉存,您需要分別為每個域名建立一個函式工作流。
    

    d. 單擊“配置”,進入函式配置介面。
    * 執行超時時間:函式執行的超時時間,超時的函式將被強行停止,建議設定為900。

       說明:
    
        如果您發現轉存的日誌數量不對,請向“函式工作流”服務提工單,增大執行超時時間。
    
    *   url :https://cdn.myhuaweicloud.com/v1.0/cdn/logs(CDN日誌下載的url)。
    *   domain_name :xxx.com(需要轉存日誌的CDN加速域名)。
    *   obsAddress :xxx.com(用於存日誌的OBS桶域名)。
    *   destBucket :******(用於存日誌的OBS桶名稱)。
    
    1.  單擊右上方“儲存”,完成設定。

e. 建立“觸發器”。在函式配置介面選擇“觸發器”,單擊右側“建立觸發器”。
* 觸發器型別:定時觸發器 (TIMER)。
* 定時器名稱:自定義的定時器名稱,例如:Timer-0001。
* 觸發規則:Cron表示式。
* Cron表示式:0 0 8 * * ?(每天早上8點執行一次日誌轉儲存)。
* 是否開啟:開啟。

    1.  單擊“確定”,完成定時觸發器設定。

f. 建立測試事件。在函式配置介面,單擊右上角“請選擇測試事件”下拉框,選擇“配置測試事件”。
* 配置測試事件:建立新的測試事件。
* 事件模板:空白模板。
* 事件名稱:test。
* 測試事件:{"message":"CDNLog-OBS"}。

    1.  單擊“儲存”,完成測試事件建立。
g.  測試函式。在函式詳情頁面,單擊右上角“請選擇測試事件”下拉框,選擇“test”,單擊“測試”。
  1. 檢視配置是否成功
    a. 登入華為雲控制檯,在左側導航欄,選擇儲存>物件儲存服務OBS”。
    b. 單擊您儲存日誌的桶,在左側導航欄選擇“物件”。
    c. 訪問路徑:資料夾(桶名稱)>資料夾(加速域名)>資料夾(日誌日期)>日誌內容。
說明:

*   當前[程式碼示例](https://support.huaweicloud.com/bestpractice-cdn/cdn_01_0138.html#cdn_01_0138__section18880191812527)僅支援轉存當前時間前一日的日誌,如果您需要轉存日誌的加速域名前一日沒有日誌產生,則OBS桶側不會產生相關檔案。
*   OBS桶將對轉存到桶裡的日誌收費,具體收費規則請參考[計費說明](https://support.huaweicloud.com/price-obs/obs_42_0001.html)。
  1. 停止日誌轉存服務
    a. 登入華為雲控制檯,在左側導航欄,選擇“計算>函式工作流”region選擇“北京四”。
    b. 在左側導航欄選擇“函式”>“函式列表”,選中2中建立的函式名。
    c. 在函式詳情頁選擇“觸發器”。

    d. 單擊“停用”,完成配置。

程式碼示例

程式碼如下所示:

# -*- coding:utf-8 -*-
import requests
import datetime
import time
import os
import sys
import json

from com.obs.client.obs_client import ObsClient

from urllib.parse import urlparse

if sys.version_info.major == 2 or not sys.version > '3':
    import httplib
else:
    import http.client as httplib

current_file_path = os.path.dirname(os.path.realpath(__file__))
# Adds the current path to search paths to import third-party libraries.
sys.path.append(current_file_path)

TEMP_ROOT_PATH = "/tmp/"  # Downloads a file from OBS to this directory.
region = 'china'  # This parameter does not need to be changed and will be used when FunctionGraph accesses OBS.
secure = True  # This parameter does not need to be changed and will be used when FunctionGraph accesses OBS.
signature = 'v4'  # This parameter does not need to be changed and will be used when FunctionGraph accesses OBS.
port = 443  # This parameter does not need to be changed and will be used when FunctionGraph accesses OBS.
path_style = True  # This parameter does not need to be changed and will be used when FunctionGraph accesses OBS.

def handler(event, context):
    logger = context.getLogger()
    queryDate = context.getUserData('queryDate')
    if queryDate is None:
        yesterday = datetime.date.today() + datetime.timedelta(-1)
        queryDate = yesterday.strftime("%Y-%m-%d")
        timeStamp = int(time.mktime(yesterday.timetuple()) * 1000)
    else:
        date = datetime.datetime.strptime(queryDate, "%Y-%m-%d")
        timeStamp = int(time.mktime(date.timetuple()) * 1000)

    pageSize = 20
    pageNumber = 1

    requests.packages.urllib3.disable_warnings()
    start(context, queryDate, timeStamp, pageSize, pageNumber)

def start(context, queryDate, timeStamp, pageSize, pageNumber):
    logger = context.getLogger()
    logUrl = context.getUserData('url')
    domainName = context.getUserData('domain_name')

    params = {'query_date': timeStamp, 'domain_name': domainName, 'page_size': pageSize, 'page_number': pageNumber, 'enterprise_project_id':'ALL'}
    headers = {'Content-Type': 'application/json;charset=UTF-8', 'X-Auth-Token': context.getToken()}
    res = requests.get(logUrl, params=params, headers=headers, verify=False)
    if res.status_code != 200:
        logger.info("query log urls: " + res.url + ", error: " + res.text)
        return ("query log urls: " + res.url + ", error: " + res.text)

    resJson = json.loads(res.text)
    logger.info(res.text)
    total = resJson['total']
    i = 0
    for val in resJson['logs']:
        i += 1
        logger.info(val["link"])

        url = urlparse(val["link"])
        netlocs = url.netloc.split(":")
        conn = httplib.HTTPConnection(netlocs[0], int(netlocs[1]))
        conn.request('GET', url.path + "?" + url.query)
        objName = os.path.join(val["domain_name"], queryDate, val["name"])
        put_content_to_obs(context, objName, conn.getresponse())

    if pageSize * pageNumber < total:
        start(context, queryDate, timeStamp, pageSize, pageNumber + 1)

def put_content_to_obs(context, objName, content):
    ak = context.getAccessKey()
    sk = context.getSecretKey()
    obsAddress = context.getUserData('obsAddress')
    destBucket = context.getUserData('destBucket')
    TestObs = ObsClient(access_key_id=ak, secret_access_key=sk,
                        is_secure=secure, server=obsAddress, signature=signature, path_style=path_style, region=region,
                        ssl_verify=False, port=port,
                        max_retry_count=5, timeout=20)
    resp = TestObs.putContent(destBucket, objName, content=content)
    if resp.status < 300:
        print('requestId:', resp.requestId)
    else:
        print('errorCode:', resp.errorCode)
        print('errorMessage:', resp.errorMessage)

本文由華為雲釋出。