Added compression configs for Llama-3.1-8B and Llama-3.1-8B-Instruct. (#904)

andreyanufr · web-flow · commit abfb4f4462a1 · 2024-09-18T18:26:40.000+04:00
* Added compression configs for Llama-3.1-8B and Llama-3.1-8B-Instruct.

* Removed unverified parameters.
diff --git a/optimum/intel/openvino/configuration.py b/optimum/intel/openvino/configuration.py
@@ -164,19 +164,19 @@ class OVQuantizationMethod(str, Enum):
         "dataset": "wikitext2",
         "scale_estimation": True,
     },
-    "meta-llama/Meta-Llama-3-8B-Instruct": {
+    "meta-llama/Meta-Llama-3.1-8B-Instruct": {
         "bits": 4,
         "sym": False,
         "group_size": 64,
-        "ratio": 0.9,
+        "ratio": 0.8,
         "dataset": "wikitext2",
         "scale_estimation": True,
     },
-    "meta-llama/Meta-Llama-3-8B": {
+    "meta-llama/Meta-Llama-3.1-8B": {
         "bits": 4,
         "sym": False,
         "group_size": 64,
-        "ratio": 0.9,
+        "ratio": 0.8,
         "dataset": "wikitext2",
         "scale_estimation": True,
     },