1. 程式人生 > >使用php進行文章關鍵字(標籤)的提取

使用php進行文章關鍵字(標籤)的提取

對於這個問題,還真是搜尋了大量的資料,網上就沒有個現成的好的文件進行說明一下,該如何弄。沒辦法自己搞吧。

 

黃天不負有心人,經過一下午的搜尋查詢,篩選,終於找到一個純php實現的中文切分工具。

 

名稱:PHPAnalysis

 

官方網址:http://www.phpbone.com/phpanalysis/

 

但是下載不太給力;

 

現在我上傳到了我的百度雲空間了,可以在這裡快速下載:https://pan.baidu.com/s/1LorLhkfZEkrYI3r_stWXoA

 

不說了,說說怎麼用吧。

------------------------我是分割線------------------------

首先將下載來的程式解壓縮,在自己的工程中找個目錄放下;裡邊的東西不用去動;

 

然後我建立了一個工具方法進行關鍵字提取:

<?php

/**
 * 關鍵字提取方法
 *
 * @param $title string
 *         進行分詞的標題
 * @param $content string
 *         進行分詞的內容
 * @return array 得到的關鍵詞陣列
 */

function getKeywords($title = "", $content = "") {
    if (empty ( $title )) {
        return array ();
    }
    if (empty ( $content )) {
        return array ();
    }
    $data = $title . $title . $title . $content; // 為了增加title的權重,這裡連線3次

    //這個地方寫上phpanalysis對應放置路徑
    //require_once dirname ( dirname ( __FILE__ ) ) . '/phpanalysis/phpanalysis.class.php';
//    require_once '/phpanalysis/phpanalysis.class.php';
    require(dirname(__FILE__) . '/phpanalysis/phpanalysis.class.php');

    PhpAnalysis::$loadInit = false;
    $pa = new PhpAnalysis ( 'utf-8', 'utf-8', false );
    $pa->LoadDict ();
    $pa->SetSource ( $data );
    $pa->StartAnalysis ( true );

    $tags = $pa->GetFinallyKeywords ( 3 ); // 獲取文章中的五個關鍵字

   $tagsArr = explode ( ",", $tags );
   $char=implode('|',$tagsArr);
   return $char;//返回關鍵字陣列
}

 

資料庫查詢方法:

 SELECT * FROM ecs_goods WHERE goods_name REGEXP '100g|胡蘿蔔|優質';

其實我們只使用了裡邊的一丁點的功能。具體詳細的描述可以去他們官網檢視。

 

本文歡迎轉載,轉載請註明:http://itsshq.com/article-234.html