Spaces:

tmmdev
/

pattern-analysis

Runtime error

tmmdev commited on Feb 17

Commit

f4ebb84

verified ·

1 Parent(s): 5055efe

Update pattern_analyzer.py

Files changed (1) hide show

pattern_analyzer.py CHANGED Viewed

@@ -1,14 +1,20 @@
 import os
 os.environ['HF_HOME'] = '/tmp/huggingface'
-from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import json
 import pandas as pd
 from pattern_logic import PatternLogic
 class PatternAnalyzer:
     def __init__(self):
         model_kwargs = {
             "device_map": "auto",
             "torch_dtype": torch.float32,
@@ -18,18 +24,16 @@ class PatternAnalyzer:
                 "disk": "8GB"
             },
             "offload_folder": "/tmp/offload",
-            "load_in_8bit": True,
-            "revision": "main"
         }
         self.model = AutoModelForCausalLM.from_pretrained(
             "tmmdev/codellama-pattern-analysis",
             **model_kwargs,
-            use_safetensors=True,
-            trust_remote_code=True,
-            resume_download=True
         )
         self.tokenizer = AutoTokenizer.from_pretrained(
             "tmmdev/codellama-pattern-analysis",
             use_fast=True

 import os
 os.environ['HF_HOME'] = '/tmp/huggingface'
 import torch
 import json
 import pandas as pd
 from pattern_logic import PatternLogic
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 class PatternAnalyzer:
     def __init__(self):
+        quantization_config = BitsAndBytesConfig(
+            load_in_8bit=True,
+            llm_int8_threshold=6.0
+        )
         model_kwargs = {
             "device_map": "auto",
             "torch_dtype": torch.float32,
                 "disk": "8GB"
             },
             "offload_folder": "/tmp/offload",
+            "quantization_config": quantization_config
         }
         self.model = AutoModelForCausalLM.from_pretrained(
             "tmmdev/codellama-pattern-analysis",
             **model_kwargs,
+            trust_remote_code=True
         )
         self.tokenizer = AutoTokenizer.from_pretrained(
             "tmmdev/codellama-pattern-analysis",
             use_fast=True