| { | |
| "_name_or_path": "google/owlvit-base-patch32", | |
| "architectures": [ | |
| "OwlViTForObjectDetection" | |
| ], | |
| "id2label": { | |
| "0": 1, | |
| "1": 2, | |
| "10": 12, | |
| "100": 103, | |
| "101": 104, | |
| "102": 105, | |
| "103": 106, | |
| "104": 107, | |
| "11": 13, | |
| "12": 14, | |
| "13": 15, | |
| "14": 16, | |
| "15": 17, | |
| "16": 18, | |
| "17": 19, | |
| "18": 20, | |
| "19": 21, | |
| "2": 3, | |
| "20": 22, | |
| "21": 23, | |
| "22": 24, | |
| "23": 25, | |
| "24": 26, | |
| "25": 27, | |
| "26": 28, | |
| "27": 29, | |
| "28": 30, | |
| "29": 31, | |
| "3": 4, | |
| "30": 32, | |
| "31": 33, | |
| "32": 34, | |
| "33": 35, | |
| "34": 36, | |
| "35": 37, | |
| "36": 38, | |
| "37": 39, | |
| "38": 40, | |
| "39": 41, | |
| "4": 6, | |
| "40": 42, | |
| "41": 43, | |
| "42": 44, | |
| "43": 45, | |
| "44": 46, | |
| "45": 47, | |
| "46": 48, | |
| "47": 49, | |
| "48": 50, | |
| "49": 51, | |
| "5": 7, | |
| "50": 52, | |
| "51": 53, | |
| "52": 54, | |
| "53": 55, | |
| "54": 56, | |
| "55": 57, | |
| "56": 58, | |
| "57": 59, | |
| "58": 60, | |
| "59": 61, | |
| "6": 8, | |
| "60": 62, | |
| "61": 63, | |
| "62": 64, | |
| "63": 66, | |
| "64": 67, | |
| "65": 68, | |
| "66": 69, | |
| "67": 70, | |
| "68": 71, | |
| "69": 72, | |
| "7": 9, | |
| "70": 73, | |
| "71": 74, | |
| "72": 75, | |
| "73": 76, | |
| "74": 77, | |
| "75": 78, | |
| "76": 79, | |
| "77": 80, | |
| "78": 81, | |
| "79": 82, | |
| "8": 10, | |
| "80": 83, | |
| "81": 84, | |
| "82": 85, | |
| "83": 86, | |
| "84": 87, | |
| "85": 88, | |
| "86": 89, | |
| "87": 90, | |
| "88": 91, | |
| "89": 92, | |
| "9": 11, | |
| "90": 93, | |
| "91": 94, | |
| "92": 95, | |
| "93": 96, | |
| "94": 97, | |
| "95": 98, | |
| "96": 99, | |
| "97": 100, | |
| "98": 101, | |
| "99": 102 | |
| }, | |
| "initializer_factor": 1.0, | |
| "label2id": { | |
| "1": "0", | |
| "2": "1", | |
| "3": "2", | |
| "4": "3", | |
| "6": "4", | |
| "7": "5", | |
| "8": "6", | |
| "9": "7", | |
| "10": "8", | |
| "11": "9", | |
| "12": "10", | |
| "13": "11", | |
| "14": "12", | |
| "15": "13", | |
| "16": "14", | |
| "17": "15", | |
| "18": "16", | |
| "19": "17", | |
| "20": "18", | |
| "21": "19", | |
| "22": "20", | |
| "23": "21", | |
| "24": "22", | |
| "25": "23", | |
| "26": "24", | |
| "27": "25", | |
| "28": "26", | |
| "29": "27", | |
| "30": "28", | |
| "31": "29", | |
| "32": "30", | |
| "33": "31", | |
| "34": "32", | |
| "35": "33", | |
| "36": "34", | |
| "37": "35", | |
| "38": "36", | |
| "39": "37", | |
| "40": "38", | |
| "41": "39", | |
| "42": "40", | |
| "43": "41", | |
| "44": "42", | |
| "45": "43", | |
| "46": "44", | |
| "47": "45", | |
| "48": "46", | |
| "49": "47", | |
| "50": "48", | |
| "51": "49", | |
| "52": "50", | |
| "53": "51", | |
| "54": "52", | |
| "55": "53", | |
| "56": "54", | |
| "57": "55", | |
| "58": "56", | |
| "59": "57", | |
| "60": "58", | |
| "61": "59", | |
| "62": "60", | |
| "63": "61", | |
| "64": "62", | |
| "66": "63", | |
| "67": "64", | |
| "68": "65", | |
| "69": "66", | |
| "70": "67", | |
| "71": "68", | |
| "72": "69", | |
| "73": "70", | |
| "74": "71", | |
| "75": "72", | |
| "76": "73", | |
| "77": "74", | |
| "78": "75", | |
| "79": "76", | |
| "80": "77", | |
| "81": "78", | |
| "82": "79", | |
| "83": "80", | |
| "84": "81", | |
| "85": "82", | |
| "86": "83", | |
| "87": "84", | |
| "88": "85", | |
| "89": "86", | |
| "90": "87", | |
| "91": "88", | |
| "92": "89", | |
| "93": "90", | |
| "94": "91", | |
| "95": "92", | |
| "96": "93", | |
| "97": "94", | |
| "98": "95", | |
| "99": "96", | |
| "100": "97", | |
| "101": "98", | |
| "102": "99", | |
| "103": "100", | |
| "104": "101", | |
| "105": "102", | |
| "106": "103", | |
| "107": "104" | |
| }, | |
| "logit_scale_init_value": 2.6592, | |
| "model_type": "owlvit", | |
| "projection_dim": 512, | |
| "text_config": { | |
| "bos_token_id": 0, | |
| "dropout": 0.0, | |
| "eos_token_id": 2, | |
| "max_length": 16, | |
| "model_type": "owlvit_text_model", | |
| "pad_token_id": 1 | |
| }, | |
| "text_config_dict": null, | |
| "torch_dtype": "float32", | |
| "transformers_version": "4.38.2", | |
| "vision_config": { | |
| "dropout": 0.0, | |
| "model_type": "owlvit_vision_model" | |
| }, | |
| "vision_config_dict": null | |
| } | |