Buenas!
Envío un resumen de lo que hablamos por la reunión sobre los entregables! Agrego un poco de información acerca de los posibles entregables relacionados al proyecto Trust.
Análisis Etiquetado Fuentes: Un camino es analizar y comparar la detección automática de fuentes actuales con las detecciones manuales realizadas. Para eso, en la respuesta de Posibles Entregables Finales van a encontrar el excel donde vamos a dejar registro de la comparación y comentarios. Además se encuentra subida la demo de Trust en https://trust-demo.streamlit.app/Sources que permite visualizar los textos con las etiquetas manuales y automáticas para cada una de las 200 noticias del corpus.
Análisis del Corpus: La herramienta Trust está pensada principalmente para analizar un artículo previo a su publicación. Igualmente permite el análisis de un corpus entero de artículos. De esta manera podemos obtener un dataset donde cada observación es un artículo, y cada columna un atributo. Los atributos pueden ser características propias del artículo como sección, autor, medio, largo del título, cantidad de palabras, ... y métricas calculadas por trust, cómo cantidad de personas nombradas, proporción de adjetivos, cantidad de referenciados, entre otros.
Para llevar adelante este entregable necesitamos:
1. Crear todas las métricas de interés que puedan servirnos.
2. Generar un dataset con las características descriptas (esto lo hago yo y estará disponible en el Drive).
Teniendo esto se podrá:
1. Obtener referencias generales del corpus para cada métrica para comparar valores puntuales.
2. Elegir las métricas más interesantes.
3. Pensar cual es la mejor manera de representar dichas métricas.
4. Explorar con gráficos el dataset para encontrar relaciones interesantes.
5. Generar un tablero visualizando distintas relaciones de los artículos del corpus.
Si se quiere avanzar un poco más, con ayuda de ChatGPT podemos hacer una aplicación usando Python o R para mostrar los resultados (en poco tienen una aplicación armada!). Les dejo algunas librerías que se podrían usar para hacer una app interactiva:
Dash (Python o R)
Principalmente usado en Python se complementa bien con la librería de gráficos interactivos Plotly.
https://dash.plotly.com/minimal-app
https://plotly.com/python/
Demos
https://www.youtube.com/@CharmingData/videos
Streamlit (Python)
Más simple pero más limitado que Dash. Es la librería usada para hacer la demo de Trust.https://streamlit.io/
Shiny (R o Python)
Librería más utilizada en R para hacer apps.
Cualquier duda o consulta pueden escribirme por acá o al mail.
Saludos,
Juan Cruz