Spaces:

vikramvasudevan
/

sanatan_ai

Running on CPU Upgrade

App Files Files Community

vikramvasudevan commited on Sep 26

Commit

51db0fa

verified ·

1 Parent(s): 1f0c180

Upload folder using huggingface_hub

Browse files

Files changed (2) hide show

config.py +77 -1
copy_chromadb.py +5 -0

config.py CHANGED Viewed

@@ -953,6 +953,79 @@ class SanatanConfig:
             ],
             "llm_hints": [],
         },
     ]
     def get_scripture_by_collection(self, collection_name: str):
@@ -1080,7 +1153,10 @@ class SanatanConfig:
             canonical_doc["text"] = canonical_doc["document"]
             canonical_doc["document"] = "-"
         verse = resolve_field(config.get("unit_field", config.get("unit")))
-        canonical_doc["verse"] = int(verse) if verse else 0
         canonical_doc["id"] = resolve_field("id")
         canonical_doc["_global_index"] = resolve_field("_global_index")
         return canonical_doc

             ],
             "llm_hints": [],
         },
+        {
+            "name": "taitriya_samhitha",
+            "title": "Taitriya Samhitha",
+            "output_dir": "./output/taitriya_samhitha",
+            "collection_name": "taitriya_samhitha",
+            "collection_embedding_fn": "openai",
+            "unit": "panchadhi",
+            "unit_field": "panchadhi",
+            # "chapter_order": lambda: get_chapter_order_from_taitriya_samhitha(),
+            "field_mapping": {
+                "text": "sanskrit",
+                "unit_index": "panchadhi",
+                "transliteration": "transliteration",
+                "chapter_name": "prashnam_name",
+                "relative_path": lambda doc: f"{doc.get('kandam')}.{doc.get('prashnam')}.{doc.get('anuvakam')}.{doc.get('panchadhi')}",
+            },
+            "metadata_fields": [
+                {
+                    "name": "kandam",
+                    "datatype": "int",
+                    "label": "Kandam Number",
+                    "description": "Kandam Number",
+                    "show_as_filter": True,
+                    "is_unique": True,
+                },
+                {
+                    "name": "prashnam",
+                    "datatype": "int",
+                    "label": "Prashnam Number",
+                    "description": "Prashnam Number",
+                    "show_as_filter": True,
+                    "is_unique": True,
+                },
+                {
+                    "name": "anuvakam",
+                    "datatype": "int",
+                    "label": "Anuvakam Number",
+                    "description": "Anuvakam Number",
+                    "show_as_filter": True,
+                    "is_unique": True,
+                },
+                {
+                    "name": "panchadhi",
+                    "datatype": "int",
+                    "label": "Panchadhi Number",
+                    "description": "Panchadhi Number",
+                    "show_as_filter": True,
+                    "is_unique": True,
+                },
+                {
+                    "name": "sanskrit",
+                    "label": "Lyrics in sanskrit",
+                    "datatype": "str",
+                    "description": "The original sloka in sanskrit.",
+                },
+                {
+                    "name": "transliteration",
+                    "label": "Transliteration in english",
+                    "datatype": "str",
+                    "description": "The original sloka transliterated in English.",
+                },
+            ],
+            "pdf_path": "./data/taitriya_samhitha.pdf",
+            "source": "https://vignanam.org/english/shanti-panchakam.html",
+            "language": "san+eng",
+            "example_labels": [
+                "Taitriya Samhitha",
+            ],
+            "examples": [
+                "Show some verses from Taitriya Samhitha",
+            ],
+            "llm_hints": [],
+        },
     ]
     def get_scripture_by_collection(self, collection_name: str):
             canonical_doc["text"] = canonical_doc["document"]
             canonical_doc["document"] = "-"
         verse = resolve_field(config.get("unit_field", config.get("unit")))
+        if verse == "-":
+            canonical_doc["verse"] = -1
+        else:
+            canonical_doc["verse"] = int(verse) if verse else 0
         canonical_doc["id"] = resolve_field("id")
         canonical_doc["_global_index"] = resolve_field("_global_index")
         return canonical_doc

copy_chromadb.py CHANGED Viewed

@@ -38,6 +38,11 @@ db_config = {
         "source_collection_name": "shanthi_panchakam",
         "destination_collection_name": "shanthi_panchakam",
     },
 }
 parser = argparse.ArgumentParser(description="My app with database parameter")

         "source_collection_name": "shanthi_panchakam",
         "destination_collection_name": "shanthi_panchakam",
     },
+    "taitriya_samhitha": {
+        "source_db_path": "../taitriya_samhitha_ai/chromadb_store",
+        "source_collection_name": "taitriya_samhitha",
+        "destination_collection_name": "taitriya_samhitha",
+    },
 }
 parser = argparse.ArgumentParser(description="My app with database parameter")