Spaces:

rt4u
/

marker

Sleeping

App Files Files Community

denisshepelin commited on Mar 3

Commit

a6f6ed1

1 Parent(s): 23e68a6

Add OpenAI-like service

Browse files

Files changed (2) hide show

marker/services/openai.py +113 -0
pyproject.toml +1 -0

marker/services/openai.py ADDED Viewed

	@@ -0,0 +1,113 @@

+import base64
+import json
+import time
+from io import BytesIO
+from typing import Annotated, List, Union
+import openai
+import PIL
+from openai import APITimeoutError, RateLimitError
+from PIL import Image
+from pydantic import BaseModel
+from marker.schema.blocks import Block
+from marker.services import BaseService
+class OpenAIService(BaseService):
+    openai_base_url: Annotated[
+        str, "The base url to use for OpenAI-like models.  No trailing slash."
+    ] = "https://openrouter.ai/api/v1"
+    openai_model: Annotated[str, "The model name to use for OpenAI-like model."] = (
+        "openai/gpt-4o-mini"
+    )
+    openai_key: Annotated[str, "The API key to use for the OpenAI-like service."] = None
+    def image_to_base64(self, image: PIL.Image.Image):
+        image_bytes = BytesIO()
+        image.save(image_bytes, format="WEBP")
+        return base64.b64encode(image_bytes.getvalue()).decode("utf-8")
+    def prepare_images(
+        self, images: Union[Image.Image, List[Image.Image]]
+    ) -> List[dict]:
+        if isinstance(images, Image.Image):
+            images = [images]
+        return [
+            {
+                "type": "image_url",
+                "image_url": "data:image/webp;base64,{}".format(
+                    self.image_to_base64(img)
+                ),
+            }
+            for img in images
+        ]
+    def __call__(
+        self,
+        prompt: str,
+        image: PIL.Image.Image | List[PIL.Image.Image],
+        block: Block,
+        response_schema: type[BaseModel],
+        max_retries: int | None = None,
+        timeout: int | None = None,
+    ):
+        if max_retries is None:
+            max_retries = self.max_retries
+        if timeout is None:
+            timeout = self.timeout
+        if not isinstance(image, list):
+            image = [image]
+        client = self.get_client()
+        image_data = self.prepare_images(image)
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    *image_data,
+                    {"type": "text", "text": prompt},
+                ],
+            }
+        ]
+        tries = 0
+        while tries < max_retries:
+            try:
+                response = client.beta.chat.completions.parse(
+                    extra_headers={
+                        "X-Title": "Marker",
+                        "HTTP-Referer": "https://github.com/VikParuchuri/marker",
+                    },
+                    model=self.openai_model,
+                    messages=messages,
+                    timeout=timeout,
+                    response_format=response_schema,
+                )
+                response_text = (
+                    response.choices[0].message.content
+                )  # json string. In message.parsed you can find Pydantic object
+                # by default openai-like models respond with response.usage field
+                total_tokens = response.usage.total_tokens
+                block.update_metadata(llm_tokens_used=total_tokens, llm_request_count=1)
+                return json.loads(response_text)
+            except (APITimeoutError, RateLimitError) as e:
+                # Rate limit exceeded
+                tries += 1
+                wait_time = tries * 3
+                print(
+                    f"Rate limit error: {e}. Retrying in {wait_time} seconds... (Attempt {tries}/{max_retries})"
+                )
+                time.sleep(wait_time)
+            except Exception as e:
+                print(e)
+                break
+        return {}
+    def get_client(self) -> openai.OpenAI:
+        return openai.OpenAI(api_key=self.openai_key, base_url=self.openai_base_url)

pyproject.toml CHANGED Viewed

@@ -43,6 +43,7 @@ openpyxl = {version = "^3.1.5", optional = true}
 python-pptx = {version = "^1.0.2", optional = true}
 ebooklib = {version = "^0.18", optional = true}
 weasyprint = {version = "^63.1", optional = true}
 [tool.poetry.group.dev.dependencies]
 jupyter = "^1.0.0"

 python-pptx = {version = "^1.0.2", optional = true}
 ebooklib = {version = "^0.18", optional = true}
 weasyprint = {version = "^63.1", optional = true}
+openai = "^1.65.2"
 [tool.poetry.group.dev.dependencies]
 jupyter = "^1.0.0"