Upload model

Browse files

Files changed (3) hide show

AbLang_roberta_model.py +41 -0
config.json +5 -3
pytorch_model.bin +2 -2

AbLang_roberta_model.py ADDED Viewed

	@@ -0,0 +1,41 @@

+from transformers.models.roberta.modeling_roberta import RobertaEmbeddings, RobertaModel, RobertaForMaskedLM
+from typing import Optional
+import torch
+class RobertaEmbeddingsV2(RobertaEmbeddings):
+    def __init__(self, config):
+        super().__init__(config)
+        self.pad_token_id = config.pad_token_id
+        self.position_embeddings = torch.nn.Embedding(config.max_position_embeddings, config.hidden_size, padding_idx=0) # here padding_idx is always 0
+    def forward(
+        self,
+        input_ids: torch.LongTensor,
+        token_type_ids: Optional[torch.LongTensor] = None,
+        position_ids: Optional[torch.LongTensor] = None,
+        inputs_embeds: Optional[torch.FloatTensor] = None,
+        past_key_values_length: int = 0,
+    ) -> torch.Tensor:
+        inputs_embeds = self.word_embeddings(input_ids)
+        position_ids = self.create_position_ids_from_input_ids(input_ids)
+        position_embeddings = self.position_embeddings(position_ids)
+        embeddings = inputs_embeds + position_embeddings
+        return self.dropout(self.LayerNorm(embeddings))
+    def create_position_ids_from_input_ids(self, input_ids: torch.LongTensor) -> torch.Tensor:
+        mask = input_ids.ne(self.pad_token_id).int()
+        return torch.cumsum(mask, dim=1).long() * mask
+class RobertaModelV2(RobertaModel):
+    def __init__(self, config, add_pooling_layer=False):
+        super().__init__(config, add_pooling_layer=add_pooling_layer)
+        self.embeddings = RobertaEmbeddingsV2(config)
+class RobertaForMaskedLMV2(RobertaForMaskedLM):
+    def __init__(self, config):
+        super().__init__(config)
+        self.roberta = RobertaModelV2(config, add_pooling_layer=False)

config.json CHANGED Viewed

@@ -1,13 +1,15 @@
 {
   "add_pooling_layer": false,
   "architectures": [
-    "BertModelV2"
   ],
   "attention_probs_dropout_prob": 0.1,
   "auto_map": {
-    "AutoModel": "AbLang_bert_model.BertModelV2"
   },
   "classifier_dropout": null,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
@@ -15,7 +17,7 @@
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 160,
-  "model_type": "bert",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 21,

 {
   "add_pooling_layer": false,
   "architectures": [
+    "RobertaModelV2"
   ],
   "attention_probs_dropout_prob": 0.1,
   "auto_map": {
+    "AutoModel": "AbLang_roberta_model.RobertaModelV2"
   },
+  "bos_token_id": 0,
   "classifier_dropout": null,
+  "eos_token_id": 2,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 160,
+  "model_type": "roberta",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 21,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f1df129a33dc579997effd90fb6ff33b8bcd2f2619fc2726cc524e02f71f4f3e
-size 343223341

 version https://git-lfs.github.com/spec/v1
+oid sha256:567cab815c99edb6aaa2063648779b8157cedeecd3a2618aeef3bbb7c0d4d848
+size 340860389