1. 程式人生 > >nodeJs 控制檯列印中文顯示為Unicode解決方案

nodeJs 控制檯列印中文顯示為Unicode解決方案

在使用 NodeJs 採集其他網站網頁時遇到的,在獲取原始碼後發現裡面原來的中文被轉成了 Unicode(UTF8) 編碼的中文(如:&# [xxx]),這當然不是真正想要的中文實體

解決方案:

使用 html-entities 對字元進行解碼

安裝:

npm install --save html-entities

使用:

var Entities = require('html-entities').XmlEntities;
entities = new Entities();
var str = '<p>&# [xxx]</p>';

console.log(entities.decode(str));