model_safe_ft

This is a merge of pre-trained language models created using mergekit.

Merge Details

Merge Method

This model was merged using the Linear merge method.

Models Merged

The following models were included in the merge:

Configuration

The following YAML configuration was used to produce this model:

models:
  - model: swarup3204/gemma-3-1b-pt-ft
    parameters:
      weight: 1.0
  - model: swarup3204/gemma-3-1b-pt-safety-vector
    parameters:
      weight: 1.0
merge_method: linear
dtype: bfloat16
parameters:
  normalize: false
  int8_mask: true

Downloads last month: 4

Safetensors

Model size

1.0B params

Tensor type

BF16

Model tree for swarup3204/gemma-3-1b-pt-ft-safe

swarup3204/gemma-3-1b-pt-ft

swarup3204/gemma-3-1b-pt-safety-vector

Merge model

this model

Paper for swarup3204/gemma-3-1b-pt-ft-safe

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

Paper • 2203.05482 • Published Mar 10, 2022 • 7