Spaces:

j-higgins
/

KeyIntentNER-T

Sleeping

App Files Files Community

j-higgins commited on Jul 4, 2024

Commit

6d4f005

verified ·

1 Parent(s): 45e2fad

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -29

app.py CHANGED Viewed

@@ -192,9 +192,8 @@ def batch_process_keywords(keywords, batch_size=8):
         category_embeddings = compute_category_embeddings()
         for i in range(0, len(keywords), batch_size):
-            logger.info(f"Processing {len(keywords)} keywords")
             batch = keywords[i:i+batch_size]
-            logger.info(f"Processing batch {i//batch_size + 1}")
             batch_embeddings = sentence_model.encode(batch, batch_size=batch_size, show_progress_bar=False)
             intents = [sort_by_keyword_feature(kw) for kw in batch]
@@ -219,11 +218,10 @@ def batch_process_keywords(keywords, batch_size=8):
             processed_data['NER Entities'].extend(processed_entities)
             processed_data['Google Content Topics'].extend(Google_Content_Topics)
-            # Force garbage collection
             gc.collect()
         logger.info("Keyword processing completed successfully")
     except Exception as e:
-        logger.exception("An error occurred in batch_process_keywords")
     return processed_data
@@ -414,7 +412,7 @@ def combined_callback(loaded, n_clicks, keyword_input):
         else:
             return loaded, False, False, "", "success", None, '', False, ''
     except Exception as e:
-        logger.exception("An error occurred in combined_callback")
         return loaded, False, True, f"An error occurred: {str(e)}", "danger", None, '', False, ''
 def handle_model_loading(loaded):
@@ -442,14 +440,14 @@ def handle_keyword_processing(n_clicks, keyword_input):
 )
 def update_bar_chart(processed_data):
     logger.info("Updating bar chart")
-    if processed_data is None:
         logger.info("No processed data available")
         return {
             'data': [],
             'layout': {
                 'height': 0,
                 'annotations': [{
-                    'text': '',
                     'xref': 'paper',
                     'yref': 'paper',
                     'showarrow': False,
@@ -458,30 +456,46 @@ def update_bar_chart(processed_data):
             }
         }
-    df = pd.DataFrame(processed_data)
-    logger.info(f"Data shape: {df.shape}")
-    intent_counts = df['Intent'].value_counts().reset_index()
-    intent_counts.columns = ['Intent', 'Count']
-    fig = px.bar(intent_counts, x='Intent', y='Count', color='Intent',
-                 title='Keyword Intent Distribution',
-                 color_discrete_sequence=px.colors.qualitative.Dark2)
-    fig.update_layout(
-        plot_bgcolor='#222222',
-        paper_bgcolor='#222222',
-        font_color='white',
-        height=400,
-        legend=dict(
-            orientation="h",
-            yanchor="bottom",
-            y=1.02,
-            xanchor="right",
-            x=1
         )
-    )
-    return fig
 # Callback for updating the dropdown and download button
 @app.callback(

         category_embeddings = compute_category_embeddings()
         for i in range(0, len(keywords), batch_size):
+            logger.info(f"Processing batch {i//batch_size + 1} of {len(keywords)//batch_size + 1}")
             batch = keywords[i:i+batch_size]
             batch_embeddings = sentence_model.encode(batch, batch_size=batch_size, show_progress_bar=False)
             intents = [sort_by_keyword_feature(kw) for kw in batch]
             processed_data['NER Entities'].extend(processed_entities)
             processed_data['Google Content Topics'].extend(Google_Content_Topics)
             gc.collect()
         logger.info("Keyword processing completed successfully")
     except Exception as e:
+        logger.exception(f"An error occurred in batch_process_keywords: {str(e)}")
     return processed_data
         else:
             return loaded, False, False, "", "success", None, '', False, ''
     except Exception as e:
+        logger.exception(f"An error occurred in combined_callback: {str(e)}")
         return loaded, False, True, f"An error occurred: {str(e)}", "danger", None, '', False, ''
 def handle_model_loading(loaded):
 )
 def update_bar_chart(processed_data):
     logger.info("Updating bar chart")
+    if processed_data is None or not processed_data:
         logger.info("No processed data available")
         return {
             'data': [],
             'layout': {
                 'height': 0,
                 'annotations': [{
+                    'text': 'No data available',
                     'xref': 'paper',
                     'yref': 'paper',
                     'showarrow': False,
             }
         }
+    try:
+        df = pd.DataFrame(processed_data)
+        logger.info(f"Data shape: {df.shape}")
+        intent_counts = df['Intent'].value_counts().reset_index()
+        intent_counts.columns = ['Intent', 'Count']
+        fig = px.bar(intent_counts, x='Intent', y='Count', color='Intent',
+                     title='Keyword Intent Distribution',
+                     color_discrete_sequence=px.colors.qualitative.Dark2)
+        fig.update_layout(
+            plot_bgcolor='#222222',
+            paper_bgcolor='#222222',
+            font_color='white',
+            height=400,
+            legend=dict(
+                orientation="h",
+                yanchor="bottom",
+                y=1.02,
+                xanchor="right",
+                x=1
+            )
         )
+        return fig
+    except Exception as e:
+        logger.exception(f"Error in update_bar_chart: {str(e)}")
+        return {
+            'data': [],
+            'layout': {
+                'height': 0,
+                'annotations': [{
+                    'text': f'Error: {str(e)}',
+                    'xref': 'paper',
+                    'yref': 'paper',
+                    'showarrow': False,
+                    'font': {'size': 28}
+                }]
+            }
+        }
 # Callback for updating the dropdown and download button
 @app.callback(