Spaces:
Sleeping
Sleeping
| import streamlit as st | |
| import pandas as pd | |
| import streamlit.components.v1 as components | |
| st.sidebar.image("images/logo.png", use_column_width=True) | |
| st.sidebar.write("Bunka Visualise & Explore l'nformation via des cartes utilisant des LLMs.") | |
| st.sidebar.title("Github Page") | |
| st.sidebar.write( | |
| "N'hésitez pas à découvrir notre package Github: https://github.com/charlesdedampierre/BunkaTopics" | |
| ) | |
| st.sidebar.title("Dataset") | |
| st.sidebar.write( | |
| "Nous avons scrappé tous les publications TTSO publiées en 2023, puis nous avons découpé chaque publication en articles. " | |
| ) | |
| st.title("Un an de TTSO, par où commencer ?") | |
| st.info( | |
| "Nous avons commencé par extraire tout le contenu des publications de TTSO en 2023. Voici un extrait:" | |
| ) | |
| df = pd.read_csv("data/ttso_cleaned_data.csv", names=["Date", "Contenu"]) | |
| df = df.head(300) | |
| st.dataframe(df, use_container_width=True, hide_index=True) | |
| st.title("A l'intérieur de TTSO") | |
| element = open("images/ttso_carte.html", "r", encoding="utf-8") | |
| st.info("Cette carte permet d'explorer les différents sujets abordés par TTSO en 2023, regroupés automatiquement par thème via la technologie de Bunka.") | |
| components.html(element.read(), height=900, width=900) | |
| st.info( | |
| "En un clin d'oeil, il est possible d'explorer les différents sujets abordés par TTSO. On constate le mélange d'actualité internationales, avec en haut de la carte les conflits israelo-palestiniens et la guerre en Ukraine, avec des actualités de plus en plus française lorsque l'on avance vers le bas de la carte." | |
| ) | |
| st.title("Des insights par sujet") | |
| df_info = pd.read_csv("data/topics_info.csv", index_col=[0]) | |
| df_info = df_info[["topic_name", "size", "percent"]] | |
| df_info["percent"] = df_info["percent"].apply(lambda x: str(int(x)) + "%") | |
| df_info = df_info.reset_index(drop=True) | |
| df_info.columns = ['Sujet', 'taille', 'Pourcentage d\'articles dans ce sujet' ] | |
| st.dataframe(df_info, use_container_width=True) | |
| st.title("L'architecture de Bunka") | |
| st.image( | |
| "images/pipeline.png", | |
| use_column_width=True, | |
| ) | |