1. 程式人生 > >PHP-過濾器-連線資料庫-解析XML

PHP-過濾器-連線資料庫-解析XML

PHP 過濾器

what?

PHP 過濾器用於驗證和過濾來自非安全來源的資料,比如使用者的輸入。

驗證和過濾使用者輸入或自定義資料是任何 Web 應用程式的重要組成部分。

設計 PHP 的過濾器擴充套件的目的是使資料過濾更輕鬆快捷。

why?

幾乎所有 web 應用程式都依賴外部的輸入。這些資料通常來自使用者或其他應用程式(比如 web 服務)。通過使用過濾器,您能夠確保應有程式獲得正確的輸入型別。

您應該始終對外部資料進行過濾!

輸入過濾是最重要的應用程式安全課題之一。

什麼是外部資料?

  • 來自表單的輸入資料
  • Cookies
  • 伺服器變數
  • 資料庫查詢結果

函式和過濾器

如需過濾變數,請使用下面的過濾器函式之一:

  • filter_var() - 通過一個指定的過濾器來過濾單一的變數
  • filter_var_array() - 通過相同的或不同的過濾器來過濾多個變數
  • filter_input - 獲取一個輸入變數,並對它進行過濾
  • filter_input_array - 獲取多個輸入變數,並通過相同的或不同的過濾器對它們進行過濾

在下面的例子中,我們用 filter_var() 函式驗證了一個整數:

<?php
$int = 123;

if(!filter_var($int, FILTER_VALIDATE_INT))
 {
 echo("Integer is not valid");
 }
else
 {
 echo("Integer is valid");
 }
?>

上面的程式碼使用了 "FILTER_VALIDATE_INT" 過濾器來過濾變數。由於這個整數是合法的,因此程式碼的輸出是:"Integer is valid"。

假如我們嘗試使用一個非整數的變數,則輸出是:"Integer is not valid"。

Validating 和 Sanitizing

有兩種過濾器:

Validating 過濾器:

  • 用於驗證使用者輸入
  • 嚴格的格式規則(比如 URL 或 E-Mail 驗證)
  • 如果成功則返回預期的型別,如果失敗則返回 FALSE

Sanitizing 過濾器:

  • 用於允許或禁止字串中指定的字元
  • 無資料格式規則
  • 始終返回字串

選項和標誌

選項和標誌用於向指定的過濾器新增額外的過濾選項。

不同的過濾器有不同的選項和標誌。

在下面的例子中,我們用 filter_var() 和 "min_range" 以及 "max_range" 選項驗證了一個整數:

<?php
$var=300;

$int_options = array(
"options"=>array
 (
 "min_range"=>0,
 "max_range"=>256
 )
);

if(!filter_var($var, FILTER_VALIDATE_INT, $int_options))
 {
 echo("Integer is not valid");
 }
else
 {
 echo("Integer is valid");
 }
?>

就像上面的程式碼一樣,選項必須放入一個名為 "options" 的相關陣列中。如果使用標誌,則不需在陣列內。

由於整數是 "300",它不在指定的範圍內,以上程式碼的輸出將是 "Integer is not valid"。

驗證輸入

讓我們試著驗證來自表單的輸入。

我們需要作的第一件事情是確認是否存在我們正在查詢的輸入資料。

然後我們用 filter_input() 函式過濾輸入的資料。

在下面的例子中,輸入變數 "email" 被傳到 PHP 頁面:

<?php
if(!filter_has_var(INPUT_GET, "email"))
 {
 echo("Input type does not exist");
 }
else
 {
 if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL))
  {
  echo "E-Mail is not valid";
  }
 else
  {
  echo "E-Mail is valid";
  }
 }
?>

例子解釋:

上面的例子有一個通過 "GET" 方法傳送的輸入變數 (email):

  1. 檢測是否存在 "GET" 型別的 "email" 輸入變數
  2. 如果存在輸入變數,檢測它是否是有效的郵件地址

淨化輸入

讓我們試著清理一下從表單傳來的 URL。

首先,我們要確認是否存在我們正在查詢的輸入資料。

然後,我們用 filter_input() 函式來淨化輸入資料。

在下面的例子中,輸入變數 "url" 被傳到 PHP 頁面:

<?php
if(!filter_has_var(INPUT_POST, "url"))
 {
 echo("Input type does not exist");
 }
else
 {
 $url = filter_input(INPUT_POST, "url", FILTER_SANITIZE_URL);
 }
?>

例子解釋:

上面的例子有一個通過 "POST" 方法傳送的輸入變數 (url):

  1. 檢測是否存在 "POST" 型別的 "url" 輸入變數
  2. 如果存在此輸入變數,對其進行淨化(刪除非法字元),並將其儲存在 $url 變數中

假如輸入變數類似這樣:"http://www.W3非o法ol.com.c字元n/",則淨化後的 $url 變數應該是這樣的:

http://www.W3School.com.cn/  

過濾多個輸入

表單通常由多個輸入欄位組成。為了避免對 filter_var 或 filter_input 重複呼叫,我們可以使用 filter_var_array 或 the filter_input_array 函式。

在本例中,我們使用 filter_input_array() 函式來過濾三個 GET 變數。接收到的 GET 變數是一個名字、一個年齡以及一個郵件地址:

<?php
$filters = array
 (
 "name" => array
  (
  "filter"=>FILTER_SANITIZE_STRING
  ),
 "age" => array
  (
  "filter"=>FILTER_VALIDATE_INT,
  "options"=>array
   (
   "min_range"=>1,
   "max_range"=>120
   )
  ),
 "email"=> FILTER_VALIDATE_EMAIL,
 );

$result = filter_input_array(INPUT_GET, $filters);

if (!$result["age"])
 {
 echo("Age must be a number between 1 and 120.<br />");
 }
elseif(!$result["email"])
 {
 echo("E-Mail is not valid.<br />");
 }
else
 {
 echo("User input is valid");
 }
?>

例子解釋:

上面的例子有三個通過 "GET" 方法傳送的輸入變數 (name, age and email)

  1. 設定一個數組,其中包含了輸入變數的名稱,以及用於指定的輸入變數的過濾器
  2. 呼叫 filter_input_array 函式,引數包括 GET 輸入變數及剛才設定的陣列
  3. 檢測 $result 變數中的 "age" 和 "email" 變數是否有非法的輸入。(如果存在非法輸入,)

filter_input_array() 函式的第二個引數可以是陣列或單一過濾器的 ID。

如果該引數是單一過濾器的 ID,那麼這個指定的過濾器會過濾輸入陣列中所有的值。

如果該引數是一個數組,那麼此陣列必須遵循下面的規則:

  • 必須是一個關聯陣列,其中包含的輸入變數是陣列的鍵(比如 "age" 輸入變數)
  • 此陣列的值必須是過濾器的 ID ,或者是規定了過濾器、標誌以及選項的陣列

使用 Filter Callback

通過使用 FILTER_CALLBACK 過濾器,可以呼叫自定義的函式,把它作為一個過濾器來使用。這樣,我們就擁有了資料過濾的完全控制權。

您可以建立自己的自定義函式,也可以使用已有的 PHP 函式。

規定您準備用到過濾器函式的方法,與規定選項的方法相同。

在下面的例子中,我們使用了一個自定義的函式把所有 "_" 轉換為空格:

<?php
function convertSpace($string)
{
return str_replace("_", " ", $string);
}

$string = "Peter_is_a_great_guy!";

echo filter_var($string, FILTER_CALLBACK, array("options"=>"convertSpace"));
?>

以上程式碼的結果是這樣的:

Peter is a great guy!

例子解釋:

上面的例子把所有 "_" 轉換成空格:

  1. 建立一個把 "_" 替換為空格的函式
  2. 呼叫 filter_var() 函式,它的引數是 FILTER_CALLBACK 過濾器以及包含我們的函式的陣列

連線mysql資料庫

1、連線

<?php
$mysqli = mysqli_connect("localhost", "root", "123123");
if ($mysqli) {
    echo 'mysql connect success!<br>';
}
else{
    echo "mysql connect failed!<br>";
//    echo mysqli_error($mysqli);
}
?>

2、關閉

<?php
if (mysqli_close($mysqli)) {
    echo '<br>mysql connection close!';
}
?>

3、選擇資料庫

<?php
mysqli_select_db("test", $mysqli);
?>

4、執行sql(insert into)

<?php
$sql = "CREATE TABLE Persons 
(
personID int NOT NULL AUTO_INCREMENT, 
PRIMARY KEY(personID),
FirstName varchar(15),
LastName varchar(15),
Age int
)";
mysqli_query($sql,$mysqli);

mysqli_query("INSERT INTO Persons (FirstName, LastName, Age) 
VALUES ('Peter', 'Griffin', '35')");
?>

5、執行SQL(select)

<?php
mysqli_select_db("my_db", $con);

$result = mysqli_query("SELECT * FROM Persons");

while($row = mysqli_fetch_array($result))
  {
  echo $row['FirstName'] . " " . $row['LastName'];
  echo "<br />";
  }
?>

解析XML

如需讀取和更新 - 建立建立並處理 - 一個 XML 文件,您需要 XML 解析器。

有兩種基本的 XML 解析器型別:

  • 基於樹的解析器:這種解析器把 XML 文件轉換為樹型結構。它分析整篇文件,並提供了 API 來訪問樹種的元素,例如文件物件模型 (DOM)。
  • 基於事件的解析器:將 XML 文件視為一系列的事件。當某個具體的事件發生時,解析器會呼叫函式來處理。

expat XML

Expat 解析器是基於事件的解析器。

基於事件的解析器集中在 XML 文件的內容,而不是它們的結果。正因如此,基於事件的解析器能夠比基於樹的解析器更快地訪問資料

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75









<?php

/**

 * Created by IntelliJ IDEA.

 * User: zzd

 * Date: 2018/3/4

 * Time: 10:32

 * expat是基於事件的xml解析器,利於讀取資料

 */



//Initialize the XML parser

//通過 xml_parser_create() 函式初始化 XML 解析器

$parser=xml_parser_create();



//建立配合不同事件處理程式的的函式

//Function to use at the start of an element

function start($parser,$element_name,$element_attrs)

{

    switch($element_name)

    {

        case "NOTE":

            echo "-- Note --<br />";

            break;

        case "TO":

            echo "To: ";

            break;

        case "FROM":

            echo "From: ";

            break;

        case "HEADING":

            echo "Heading: ";

            break;

        case "BODY":

            echo "Message: ";

    }

}



//Function to use at the end of an element

function stop($parser,$element_name)

{

    echo "<br />";

}



//Function to use when finding character data

function char($parser,$data)

{

    echo $data;

}



//Specify element handler

//新增 xml_set_element_handler() 函式來定義,當解析器遇到開始和結束標籤時執行哪個函式

xml_set_element_handler($parser,"start","stop");



//Specify data handler

//新增 xml_set_character_data_handler() 函式來定義,當解析器遇到字元資料時執行哪個函式

xml_set_character_data_handler($parser,"char");



//Open XML file

$fp=fopen("test.xml","r");



//Read data

while ($data=fread($fp,4096))

{

    //通過 xml_parse() 函式來解析檔案 "test.xml"

    xml_parse($parser,$data,feof($fp)) or

    //萬一有錯誤的話,新增 xml_error_string() 函式把 XML 錯誤轉換為文字說明

    die (sprintf("XML Error: %s at line %d",

        xml_error_string(xml_get_error_code($parser)),

        xml_get_current_line_number($parser)));

}



//呼叫 xml_parser_free() 函式來釋放分配給 xml_parser_create() 函式的記憶體

//Free the XML parser

xml_parser_free($parser);



?>

DOM XML

DOM 解析器是基於樹的解析器。

W3C DOM 提供了針對 HTML 和 XML 文件的標準物件集,以及用於訪問和操作這些文件的標準介面。

W3C DOM 被分為不同的部分 (Core, XML 和 HTML) 和不同的級別 (DOM Level 1/2/3):

  • Core DOM - 為任何結構化文件定義標準的物件集
  • XML DOM - 為 XML 文件定義標準的物件集
  • HTML DOM - 為 HTML 文件定義標準的物件集
1
2
3
4
5
6
7
8
9









<?php

$xmlDoc = new DOMDocument();

$xmlDoc->load("note.xml");



print $xmlDoc->saveXML();

?>

/**

George John Reminder Don't forget the meeting!

*/
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25









<?php

$xmlDoc = new DOMDocument();

$xmlDoc->load("note.xml");



$x = $xmlDoc->documentElement;

foreach ($x->childNodes AS $item)

  {

  print $item->nodeName . " = " . $item->nodeValue . "<br />";

  }

?>

/**

#text = 

to = George

#text = 

from = John

#text = 

heading = Reminder

#text = 

body = Don't forget the meeting!

#text = 

*/

/**

在上面的例子中,您看到了每個元素之間存在空的文字節點。

當 XML 生成時,它通常會在節點之間包含空白。XML DOM 解析器把它們當作普通的元素,如果您不注意它們,有時會產生問題。

*/

simple XML

SimpleXML 是 PHP 5 中的新特性。在瞭解 XML 文件 layout 的情況下,它是一種取得元素屬性和文字的便利途徑。

與 DOM 或 Expat 解析器相比,SimpleXML 僅僅用幾行程式碼就可以從元素中讀取文字資料。

SimpleXML 可把 XML 文件轉換為物件,比如:

  • 元素 - 被轉換為 SimpleXMLElement 物件的單一屬性。當同一級別上存在多個元素時,它們會被置於陣列中。
  • 屬性 - 通過使用關聯陣列進行訪問,其中的下標對應屬性名稱。
  • 元素資料 - 來自元素的文字資料被轉換為字串。如果一個元素擁有多個文字節點,則按照它們被找到的順序進行排列。

當執行類似下列的基礎任務時,SimpleXML 使用起來非常快捷:

  • 讀取 XML 檔案
  • 從 XML 字串中提取資料
  • 編輯文字節點或屬性

不過,在處理高階 XML 時,比如名稱空間,最好使用 Expat 解析器或 XML DOM

  1. 載入 XML 檔案
  2. 取得第一個元素的名稱
  3. 使用 children() 函式建立在每個子節點上觸發的迴圈
  4. 輸出每個子節點的元素名稱和資料
1
2
3
4
5
6
7
8
9
10









<?php

$xml = simplexml_load_file("test.xml");



echo $xml->getName() . "<br />";



foreach($xml->children() as $child)

  {

  echo $child->getName() . ": " . $child . "<br />";

  }

?>