kaggle google Quest比賽程式碼閱讀筆記

阿新 • • 發佈：2020-07-31

關於抽取bert裡面第幾層的程式碼:

(

＃我們取零，因為據我瞭解，這就是[CLS]令牌...
＃想法是也要合併最後4層而不是最後一層，因為它太接近輸出了
＃層，它可能沒有那麼有效，因為它受到o / p的更多控制。

)

https://www.kaggle.com/c/google-quest-challenge/discussion/123770

class BertForSequenceClassification_v2(BertPreTrainedModel):
    r"""
        **labels**: (`optional`) ``torch.LongTensor`` of shape ``(batch_size,)``:
    Outputs: `Tuple` comprising various elements depending on the configuration (config) and inputs:
        **loss**: (`optional`, returned when ``labels`` is provided) ``torch.FloatTensor`` of shape ``(1,)``:
            Classification (or regression if config.num_labels==1) loss.
        **logits**: ``torch.FloatTensor`` of shape ``(batch_size, config.num_labels)``
            Classification (or regression if config.num_labels==1) scores (before SoftMax).
        **hidden_states**: (`optional`, returned when ``config.output_hidden_states=True``)
            list of ``torch.FloatTensor`` (one for the output of each layer + the output of the embeddings)
            of shape ``(batch_size, sequence_length, hidden_size)``:
            Hidden-states of the model at the output of each layer plus the initial embedding outputs.
        outputs = model(input_ids, labels=labels)
        loss, logits = outputs[:2]
    """
    def __init__(self, config):

        super(BertForSequenceClassification_v2, self).__init__(config)

       # config.output_hidden_states=True (make sure)
        self.num_labels = config.num_labels
        self.bert = BertModel(config)
        self.dropout = nn.Dropout(config.hidden_dropout_prob)
        self.classifier = nn.Linear(config.hidden_size, self.config.num_labels)
        self.init_weights()

        def forward(self, input_ids=None, attention_mask=None, token_type_ids=None,
                position_ids=None, head_mask=None, inputs_embeds=None, labels=None, 
                extra_feats=None):

        outputs = self.bert(input_ids,
                            attention_mask=attention_mask,
                            token_type_ids=token_type_ids,
                            position_ids=position_ids,
                            head_mask=head_mask,
                            inputs_embeds=inputs_embeds)

        # sequence_output = outputs[0]
        # pooled_output = outputs[1]

        hidden_states = outputs[2] #hidden_states: 12 layers tuples each is of (batch_size, sequence_length, hidden_size) + embedding``
        # print(seq[-1].shape, seq[-1][:, 0].shape)

        # we are taking zero because in my understanding that's the [CLS] token...
        # idea is to pool last 4 layers as well instead of just the last one, since it's too close to the output
        # layers, it might not be that efficient as it's more regulated by the o/p's..

        h12 = hidden_states[-1][:, 0].reshape((-1, 1, 768))
        h11 = hidden_states[-2][:, 0].reshape((-1, 1, 768))
        h10 = hidden_states[-3][:, 0].reshape((-1, 1, 768))
        h9  = hidden_states[-4][:, 0].reshape((-1, 1, 768))

        all_h = torch.cat([h9, h10, h11, h12], 1) #Also don't forget to add the last CLS token seq_op/pooled_op as you wish..
        mean_pool = torch.mean(all_h, 1)

        pooled_output = self.dropout(mean_pool)
        logits = self.classifier(pooled_output)
        outputs = (logits,) + outputs[2:]  # add hidden states and attention if they are here

        return outputs  # (loss), logits, (hidden_states), (attentions)

kaggle google Quest比賽程式碼閱讀筆記

關於抽取bert裡面第幾層的程式碼: ( ＃我們取零，因為據我瞭解，這就是[CLS]令牌...＃想法是也要合併最後4層而不是最後一層，因為它太接近輸出了＃層，它可能沒有那麼有效，因為它受到o / p的更多控制。

cartographer程式碼閱讀筆記

map_builder.h 是演算法的入口，封裝了local submap和 global pose-graph的優化 int MapBuilder:: AddTrajectoryBuiler() {

夢斷程式碼閱讀筆記03

第五章--管束奇客和狗用程式碼的多少去衡量一個程式設計師的好壞是最白痴的做法，一段精彩的程式碼或許僅僅是小小的一段創新，而那種做法只會讓越來越多的人敲出越來越雜亂無章繁瑣的程式碼。在變成當中我們可以用一

夢斷程式碼閱讀筆記01

今天讀了《夢斷程式碼》的前三章，讀完第一章後，我感覺當修改窗體大小是出現閃爍：可怕。這感覺的是一個很可笑的總結，但是這是一個程式設計師在實踐中真是遇到的真心體會到的問題。是的，我們編寫程式時，常常修改

夢斷程式碼閱讀筆記2

《夢斷程式碼》作者羅森伯格對OSAF主持的Chandler專案進行田野調查，跟蹤經年，試圖藉由Chandler的開發過程揭示軟體開發中的一些根本性大問題。本書是講一事，也是講百千事；是寫一軟體，也是寫百千軟體；是寫一群人

01夢斷程式碼閱讀筆記之一

　　第一次閱讀，大概瞭解了夢斷程式碼這本書的大致內容簡介：　　《夢斷程式碼》作者羅森伯格對OSAF主持的Chandler專案進行田野調查，跟蹤經年，試圖藉由Chandler的開發過程揭示軟體開發中的一些根本性大問題。本

06夢斷程式碼閱讀筆記之六

經過一個多月的時間，我終於將夢斷程式碼這本書讀完了，通過這段時間的閱讀，我感覺這真的是一本很好的書，能夠給一個程式設計師正確的指引方向，教會一個程式設計師很多東西。

夢斷程式碼閱讀筆記之一

夢斷程式碼閱讀筆記之一第0章：軟體時間從作者玩的遊戲Summer入手，解釋了完成一件事所需要大量的時間。但是在做軟體的過程中，我們總不能做出完美的軟體，這不僅僅和時間和經驗有關。

夢斷程式碼閱讀筆記

我從書中發現幾點我比較感興趣的內容。　　第一個，樂高之夢。將程式用樂高積木一樣拼接起來。對於這一點，現在很多公司都已經多多少少在用了。但是書中也提到，有很多程式設計師往往不喜歡借用別人的代碼，如果看一

《第一行程式碼》閱讀筆記（二十）——持久化技術（檔案儲存+SharedPreferences）

檔案儲存 ——第一行程式碼檔案儲存是Android中最基本的一種資料儲存方式，它不對儲存的內容進行任何的格式化處理，所有資料都是原封不動地儲存到檔案當中的，因而它比較適合用於儲存一些簡單的文字資料或二進位制

《第一行程式碼》閱讀筆記（二十二）——LitePal操作資料庫

這裡郭神又是一頓稱讚，反正強無敵就行了。筆者也諮詢了一些大神、專家。對於初學者來說這個框架不僅十分方便，足以應付需求，而且郭神講解通俗易懂，值得一看。

《第一行程式碼》閱讀筆記（二十一）——SQLite資料庫（CRUD）

書的開頭就是一頓誇讚，反正SQLite強無敵！寫在最前現在使用第三方的視覺化工具使用的比較多了，這裡簡單提一嘴。

《第一行程式碼》閱讀筆記（二十五）——PermissionsDispatcher（補充）

PermissionsDispatcher是一個基於註解、幫助開發者簡單處理Android 6.0系統中的執行時許可權的開源庫。避免了開發者編寫大量繁瑣的樣板程式碼。

《第一行程式碼》閱讀筆記（二十四）——Android動態請求許可權

首先本章就介紹了什麼是危險許可權，而不是危險許可權的就是普通許可權。那有那些危險許可權呢，不用記，需要的時候直接來這個表裡查。「Android中危險許可權列表」同時可以訪問http://developer.android.com/refere

《第一行程式碼》閱讀筆記（二十三）——資料庫設計（補充）

廢話不多說，先看下結構然後直接上程式碼 public class StudyProgressDBHelper extends SQLiteOpenHelper {

《第一行程式碼》閱讀筆記（二十八）——網路技術（OkHttp+JSON/GSON）

網路技術在程式設計中也是非常重要的一環，在android底層是通過HttpURLConnection實現的，後來出現了一款優秀的框架OkHttp，實現了對底層的封裝。然後隨著技術的進步，現在更多的是使用OkHttp+Retrofit+Rxjava網路框

《第一行程式碼》閱讀筆記（二十七）——多媒體播放Demo

因為音訊和視訊播放十分相似，所以這裡筆者自己製作了一個簡單的Demo。讓我們一起來看下吧。

《第一行程式碼》閱讀筆記（二十六）——內容提供器

——第一行程式碼內容提供器( Content Provider )主要用於在不同的應用程式之間實現資料共享的功能，它提供了一套完整的機制，允許一個程式訪問另一個程式中的資料，同時還能保證被訪資料的安全性。目前，使用內容

《第一行程式碼》閱讀筆記（三十五））——進階開發

全域性獲取Context 不難看出Context一共有三種類型，分別是Application、Activity和Service。這三個類雖然分別各種承擔著不同的作用，但它們都屬於Context的一種，而它們具體Context的功能則是由ContextImpl類去實

《第一行程式碼》閱讀筆記（三十四）——Material Design

ToolBar 首先：注意使用androidx.appcompat.widget.Toolbar而不是android.widget.Toolbar 在這一章節中，作者主要介紹了幾個知識點。筆者在此梳理一些

kaggle google Quest比賽程式碼閱讀筆記

相關推薦