TensorFlow學習筆記 —— tf.nn.nce_loss

阿新 • • 發佈：2019-01-01

Tensorflow 的NCE-Loss的實現和word2vec

這兩天因為實現mxnet的nce-loss，因此研究了一下tensorflow的nce-loss的實現。所以總結一下。

先看看tensorflow的nce-loss的API：

def nce_loss(weights, biases, inputs, labels, num_sampled, num_classes,
             num_true=1,
             sampled_values=None,
             remove_accidental_hits=False,
             partition_strategy="mod",
             name="nce_loss")

假設nce_loss之前的輸入資料是K維的，一共有N個類，那麼

weight.shape = (N, K)
bias.shape = (N)
inputs.shape = (batch_size, K)
labels.shape = (batch_size, num_true)
num_true : 實際的正樣本個數
num_sampled: 取樣出多少個負樣本
num_classes = N
sampled_values: 取樣出的負樣本，如果是None，就會用不同的sampler去取樣。待會兒說sampler是什麼。
remove_accidental_hits: 如果取樣時不小心取樣到的負樣本剛好是正樣本，要不要幹掉

partition_strategy：對weights進行embedding_lookup時並行查表時的策略。TF的embeding_lookup是在CPU裡實現的，這裡需要考慮多執行緒查表時的鎖的問題。

nce_loss的實現邏輯如下：

_compute_sampled_logits: 通過這個函式計算出正樣本和取樣出的負樣本對應的output和label
sigmoid_cross_entropy_with_logits: 通過 sigmoid cross entropy來計算output和label的loss，從而進行反向傳播。這個函式把最後的問題轉化為了num_sampled+num_real個兩類分類問題，然後每個分類問題用了交叉熵的損傷函式，也就是logistic regression常用的損失函式。TF裡還提供了一個softmax_cross_entropy_with_logits的函式，和這個有所區別。

再來看看TF裡word2vec的實現，他用到nce_loss的程式碼如下：

  loss = tf.reduce_mean(
      tf.nn.nce_loss(nce_weights, nce_biases, embed, train_labels,
                     num_sampled, vocabulary_size))

可以看到，它這裡並沒有傳sampled_values，那麼它的負樣本是怎麼得到的呢？繼續看nce_loss的實現，可以看到裡面處理sampled_values=None的程式碼如下：

    if sampled_values is None:
      sampled_values = candidate_sampling_ops.log_uniform_candidate_sampler(
          true_classes=labels,
          num_true=num_true,
          num_sampled=num_sampled,
          unique=True,
          range_max=num_classes)

所以，預設情況下，他會用log_uniform_candidate_sampler去取樣。那麼log_uniform_candidate_sampler是怎麼取樣的呢？他的實現在這裡：

他會在[0, range_max)中取樣出一個整數k
P(k) = (log(k + 2) - log(k + 1)) / log(range_max + 1)

可以看到，k越大，被取樣到的概率越小。那麼在TF的word2vec裡，類別的編號有什麼含義嗎？看下面的程式碼：

def build_dataset(words):
  count = [['UNK', -1]]
  count.extend(collections.Counter(words).most_common(vocabulary_size - 1))
  dictionary = dict()
  for word, _ in count:
    dictionary[word] = len(dictionary)
  data = list()
  unk_count = 0
  for word in words:
    if word in dictionary:
      index = dictionary[word]
    else:
      index = 0  # dictionary['UNK']
      unk_count += 1
    data.append(index)
  count[0][1] = unk_count
  reverse_dictionary = dict(zip(dictionary.values(), dictionary.keys()))
  return data, count, dictionary, reverse_dictionary

可以看到，TF的word2vec實現裡，詞頻越大，詞的類別編號也就越大。因此，在TF的word2vec裡，負取樣的過程其實就是優先採詞頻高的詞作為負樣本。

在提出負取樣的原始論文中, 包括word2vec的原始C++實現中。是按照熱門度的0.75次方取樣的，這個和TF的實現有所區別。但大概的意思差不多，就是越熱門，越有可能成為負樣本。

TensorFlow學習筆記 —— tf.nn.nce_loss

Tensorflow 的NCE-Loss的實現和word2vec 這兩天因為實現mxnet的nce-loss，因此研究了一下tensorflow的nce-loss的實現。所以總結一下。先看看tensorflow的nce-loss的API： def nce_loss(weights, b

TensorFlow實戰筆記——tf.nn.nce_loss

先看看tensorflow的nce-loss的API：、def nce_loss(weights, biases, inputs, labels, num_sampled, num_classes, num_true=1,

Tensorflow學習筆記——tf.ummary用法

轉於;https://www.cnblogs.com/lyc-seu/p/8647792.html Tensorflow學習筆記——tf.ummary用法最近在研究tensorflow自帶的例程speech_command,順便學習t

TensorFlow學習筆記 —— tf.train.Optimizer

反正是要學一些API的，不如直接從例子裡面學習怎麼使用API，這樣同時可以複習一下一些基本的機器學習知識。但是一開始開始和以前一樣，先直接講類和常用函式用法，然後舉例子。這裡主要是各種優化器，以及使用。因為大多數機器學習任務就是最小化損失，在損失定義的情況下，後面的工作就交給優化器啦。

TensorFlow學習筆記-tf.estimator

tf.estimator.Estimator Estimator class訓練和測試TF模型。Estimator物件封裝好通過model_fn指定的模型，給定輸入和其它超引數，返回ops執行training, evaluation or predi

tensorflow學習：tf.nn.conv2d 和 tf.layers.conv2d

看了很多tensorflow卷積的例子，有的用了tf.nn.conv2d，有的用了tf.layers.conv2d，那麼這兩個究竟有啥不同呢？ tf.layers.conv2d(inputs, fi

tensorflow 學習筆記-- tf.reduce_max、tf.sequence_mask

1、tf.reduce_max函式的作用：計算張量的各個維度上的元素的最大值。例子:import tensorflow as tf max_value = tf.reduce_max([1, 3, 2]) with tf.Session() as sess:

Tensorflow學習筆記之tf.nn.relu

Tensorflow學習筆記之tf.nn.relu 關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。線性整流函式（Rectified Linear Unit，ReLU），又稱修正線性單元。其定義如下圖，在橫座標的右側，ReLU函式為線性函式。在橫座標

Tensorflow學習筆記（用哪學哪)tf.nn.dropout

tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None, name=None) 根據給出的keep_prob引數，將輸入tensor x按比例輸出。預設情況下, 每個元素儲存或丟棄都是獨立的 x

Tensorflow學習筆記(2)：tf.nn.dropout 與 tf.layers.dropout

You want to use the dropout() function in tensorflow.contrib.layers, not the one in tensorflow.nn. The only differences in the two funct

Tensorflow學習筆記之tf.layers.conv2d

Tensorflow學習筆記關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。 conv2d(inputs, filters, kernel_size, strides=(1, 1), padding='valid', d

TensorFlow學習筆記之--[tf.clip_by_global_norm,tf.clip_by_value,tf.clip_by_norm等的區別]

以下這些函式可以用於解決梯度消失或梯度爆炸問題上。 1. tf.clip_by_value tf.clip_by_value( t, clip_value_min, clip_value_max, name=None ) 輸入一個張量t，把t中的每一個元素的值都

tensorflow學習筆記1：tf.Variable、tf.get_variable與tf.get_variable、tf.variable_scope對比總結

** 0. 淺談tensorflow變數機制 ** tensorflow提供了通過變數名稱來建立或者獲取一個變數的機制。通過這個機制，在不同的函式中可以直接通過變數的名字來使用變數，而不需要將變數通過引數的形式到處傳遞，實現了變數共享。 ** 1. 對比tf.V

《TensorFlow學習筆記》tf.concat函式用法

tf版本：1.5.0 concat官方定義 Args: values: A list of Tensor objects or a single Tensor. 單個張量或是一個關於張量的

TensorFlow學習筆記（九）tf搭建神經網路基本流程

1. 搭建神經網路基本流程定義新增神經層的函式 1.訓練的資料 2.定義節點準備接收資料 3.定義神經層：隱藏層和預測層 4.定義 loss 表示式 5.選擇 optimizer 使 loss 達到最小然後對所有變數進行初始化，通過 sess.run optimizer，迭代 1000 次進行學習： i

tensorflow學習筆記（二十六）：構建TF程式碼

如何構建TF程式碼 batch_size: batch的大小 mini_batch: 將訓練樣本以batch_size分組 epoch_size: 樣本分為幾個min_batch num_epoch : 訓練幾輪讀程式碼的時候應該關注的幾部分

TensorFlow學習筆記（一）：TF基本操作

一.TensorFlow基本執行流程如下: 使用圖 (graph) 來表示計算任務. 在被稱之為會話 (Session) 的上下文 (context) 中執行圖. 使用 tensor 表示資料. 通過變數 (Variable) 維護狀態. 使用 f

TensorFlow學習筆記[一]—— 填充張量函式 tf.pad 解析

函式的作用：對張量按照你的需求進行填充函式原型：pad( tensor, paddings, mode='CONSTANT', name=None )引數說明：tensor: A 'Tensor'. #tensor是要填充的張量;

tensorflow學習筆記（二）

example initial turn rate mnist pac rac test mode import tensorflow as tfimport numpy as npimport mathimport tensorflow.examples.tutorial

tensorflow學習筆記(三)：實現自編碼器

sea start ear var logs cos soft 編碼 red 黃文堅的tensorflow實戰一書中的第四章，講述了tensorflow實現多層感知機。Hiton早年提出過自編碼器的非監督學習算法，書中的代碼給出了一個隱藏層的神經網絡，本人擴展到了多層，改進

TensorFlow學習筆記 —— tf.nn.nce_loss

Tensorflow 的NCE-Loss的實現和word2vec

相關推薦