使用php進行文章關鍵字(標籤)的提取
阿新 • • 發佈:2018-11-05
對於這個問題,還真是搜尋了大量的資料,網上就沒有個現成的好的文件進行說明一下,該如何弄。沒辦法自己搞吧。
黃天不負有心人,經過一下午的搜尋查詢,篩選,終於找到一個純php實現的中文切分工具。
名稱:PHPAnalysis
官方網址:http://www.phpbone.com/phpanalysis/
但是下載不太給力;
現在我上傳到了我的百度雲空間了,可以在這裡快速下載:https://pan.baidu.com/s/1LorLhkfZEkrYI3r_stWXoA
不說了,說說怎麼用吧。
------------------------我是分割線------------------------
首先將下載來的程式解壓縮,在自己的工程中找個目錄放下;裡邊的東西不用去動;
然後我建立了一個工具方法進行關鍵字提取:
<?php /** * 關鍵字提取方法 * * @param $title string * 進行分詞的標題 * @param $content string * 進行分詞的內容 * @return array 得到的關鍵詞陣列 */ function getKeywords($title = "", $content = "") { if (empty ( $title )) { return array (); } if (empty ( $content )) { return array (); } $data = $title . $title . $title . $content; // 為了增加title的權重,這裡連線3次 //這個地方寫上phpanalysis對應放置路徑 //require_once dirname ( dirname ( __FILE__ ) ) . '/phpanalysis/phpanalysis.class.php'; // require_once '/phpanalysis/phpanalysis.class.php'; require(dirname(__FILE__) . '/phpanalysis/phpanalysis.class.php'); PhpAnalysis::$loadInit = false; $pa = new PhpAnalysis ( 'utf-8', 'utf-8', false ); $pa->LoadDict (); $pa->SetSource ( $data ); $pa->StartAnalysis ( true ); $tags = $pa->GetFinallyKeywords ( 3 ); // 獲取文章中的五個關鍵字 $tagsArr = explode ( ",", $tags ); $char=implode('|',$tagsArr); return $char;//返回關鍵字陣列 }
資料庫查詢方法:
SELECT * FROM ecs_goods WHERE goods_name REGEXP '100g|胡蘿蔔|優質';
其實我們只使用了裡邊的一丁點的功能。具體詳細的描述可以去他們官網檢視。
本文歡迎轉載,轉載請註明:http://itsshq.com/article-234.html