Training in progress, step 500

Files changed (4) hide show

config.json ADDED Viewed

+{
+  "_name_or_path": "BridgeTower/bridgetower-large-itm-mlm-itc",
+  "architectures": [
+    "BridgeTowerForContrastiveLearning"
+  ],
+  "contrastive_hidden_size": 512,
+  "drop_rate": 0.1,
+  "head_hidden_scale": 2,
+  "hidden_act": "gelu",
+  "hidden_size": 1024,
+  "init_layernorm_from_vision_encoder": false,
+  "initializer_factor": 1,
+  "layer_norm_eps": 1e-05,
+  "link_tower_type": "add",
+  "logit_scale_init_value": 2.6592,
+  "model_type": "bridgetower",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 6,
+  "share_cross_modal_transformer_layers": true,
+  "share_link_tower_layers": false,
+  "text_config": {
+    "architectures": [
+      "BridgeTowerTextModel"
+    ],
+    "classifier_dropout": null,
+    "hidden_size": 1024,
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "model_type": "bridgetower_text_model",
+    "num_attention_heads": 16,
+    "num_hidden_layers": 24
+  },
+  "tie_word_embeddings": false,
+  "torch_dtype": "float32",
+  "transformers_version": "4.34.1",
+  "vision_config": {
+    "architectures": [
+      "BridgeTowerVisionModel"
+    ],
+    "hidden_size": 1024,
+    "image_size": 294,
+    "model_type": "bridgetower_vision_model",
+    "num_hidden_layers": 24,
+    "patch_size": 14
+  }
+}

gaudi_config.json ADDED Viewed

+{
+  "autocast_bf16_ops": null,
+  "autocast_fp32_ops": null,
+  "hmp_bf16_ops": [
+    "add",
+    "addmm",
+    "bmm",
+    "div",
+    "dropout",
+    "gelu",
+    "iadd",
+    "linear",
+    "layer_norm",
+    "matmul",
+    "mm",
+    "rsub",
+    "softmax",
+    "truediv"
+  ],
+  "hmp_fp32_ops": [
+    "embedding",
+    "nll_loss",
+    "log_softmax"
+  ],
+  "hmp_is_verbose": false,
+  "hmp_opt_level": "O1",
+  "optimum_version": "1.8.0",
+  "transformers_version": "4.34.1",
+  "use_fused_adam": true,
+  "use_fused_clip_norm": true,
+  "use_habana_mixed_precision": false,
+  "use_torch_autocast": true
+}

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b7c4b558788f08343aff6ce1a1a3e9c147810805f9acfd79d41f03a8d9ebbd0d
+size 3462613729

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:85d2157d40df87abb135bd72f54f1f621dfb2268663545d517c265830ac98077
+size 4539