1. 程式人生 > 程式設計 >詳解在Python中使用Torchmoji將文字轉換為表情符號

詳解在Python中使用Torchmoji將文字轉換為表情符號

很難找到關於如何使用Python使用DeepMoji的教程。我已經嘗試了幾次,後來又出現了幾次錯誤,於是決定使用替代版本:torchMoji。

TorchMoji是DeepMoji的pyTorch實現,可以在這裡找到:https://github.com/huggingface/torchMoji

詳解在Python中使用Torchmoji將文字轉換為表情符號

事實上,我還沒有找到一個關於如何將文字轉換為表情符號的教程。如果你也沒找到,那麼本文就是一個了。

安裝

這些程式碼並不完全是我的寫的,原始碼可以在這個連結上找到。

pip3 install torch==1.0.1 -f https://download.pytorch.org/whl/cpu/stable 
git clone https://github.com/huggingface/torchMoji
import os
os.chdir('torchMoji')
pip3 install -e .
#if you restart the package,the notebook risks to crash on a loop
#I did not restart and worked fine

該程式碼將下載約600 MB的資料用於訓練人工智慧。我一直在用谷歌Colab。然而,我注意到,當程式要求您重新啟動筆記本進行所需的更改時,它開始在迴圈中崩潰並且無法補救。如果你使用的是jupyter notebook或者colab記事本不要重新,不管它的重啟要求就可以了。

python3 scripts/download_weights.py

這個指令碼應該下載需要微調神經網路模型。詢問時,按“是”確認。

設定轉換功能函式

使用以下函式,可以輸入文進行轉換,該函式將輸出最可能的n個表情符號(n將被指定)。

import numpy as np
import emoji,json
from torchmoji.global_variables import PRETRAINED_PATH,VOCAB_PATH
from torchmoji.sentence_tokenizer import SentenceTokenizer
from torchmoji.model_def import torchmoji_emojis
 
EMOJIS = ":joy: :unamused: :weary: :sob: :heart_eyes: :pensive: :ok_hand: :blush: :heart: :smirk: :grin: :notes: :flushed: :100: :sleeping: :relieved: :relaxed: :raised_hands: :two_hearts: :expressionless: :sweat_smile: :pray: :confused: :kissing_heart: :heartbeat: :neutral_face: :information_desk_person: :disappointed: :see_no_evil: :tired_face: :v: :sunglasses: :rage: :thumbsup: :cry: :sleepy: :yum: :triumph: :hand: :mask: :clap: :eyes: :gun: :persevere: :smiling_imp: :sweat: :broken_heart: :yellow_heart: :musical_note: :speak_no_evil: :wink: :skull: :confounded: :smile: :stuck_out_tongue_winking_eye: :angry: :no_good: :muscle: :facepunch: :purple_heart: :sparkling_heart: :blue_heart: :grimacing: :sparkles:".split(' ')
model = torchmoji_emojis(PRETRAINED_PATH)
with open(VOCAB_PATH,'r') as f:
 vocabulary = json.load(f)
st = SentenceTokenizer(vocabulary,30)def deepmojify(sentence,top_n =5):
 def top_elements(array,k):
 ind = np.argpartition(array,-k)[-k:]
 return ind[np.argsort(array[ind])][::-1]tokenized,_,_ = st.tokenize_sentences([sentence])
 prob = model(tokenized)[0]
 emoji_ids = top_elements(prob,top_n)
 emojis = map(lambda x: EMOJIS[x],emoji_ids)
 return emoji.emojize(f"{sentence} {' '.join(emojis)}",use_aliases=True)

文字實驗

text = ['I hate coding AI']for _ in text:
 print(deepmojify(_,top_n = 3))

輸出

詳解在Python中使用Torchmoji將文字轉換為表情符號

如您所見,這裡給出的是個列表,所以可以新增所需的字串數。

原始神經網路

如果你不知道如何編碼,你只想試一試,你可以使用DeepMoji的網站:https://deepmoji.mit.edu/

詳解在Python中使用Torchmoji將文字轉換為表情符號

原始碼應該完全相同,事實上,如果我輸入5個表情符號而不是3個,這就是我程式碼中的結果:

詳解在Python中使用Torchmoji將文字轉換為表情符號

輸入列表而不是一句話

在進行情緒分析時,我通常會在Pandas上儲存tweets或評論的資料庫,我將使用以下程式碼,將字串列表轉換為Pandas資料幀,其中包含指定數量的emojis。

import pandas as pddef emoji_dataset(list1,n_emoji=3):
 emoji_list = [[x] for x in list1]for _ in range(len(list1)):
 for n_emo in range(1,n_emoji+1):
  emoji_list[_].append(deepmojify(list1[_],top_n = n_emoji)[2*-n_emo+1])emoji_list = pd.DataFrame(emoji_list)
 return emoji_listlist1 = ['Stay safe from the virus','Push until you break!','If it does not challenge you,it will not change you']

我想估計一下這個字串列表中最有可能出現的5種表情:

emoji_dataset(list1,5)

詳解在Python中使用Torchmoji將文字轉換為表情符號

就是這麼簡單

作者:Michelangiolo Mazzeschi

deephub翻譯組

到此這篇關於詳解在Python中使用Torchmoji將文字轉換為表情符號的文章就介紹到這了,更多相關Python Torchmoji文字轉換為表情符號內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!