Y hoy...¿Qué vemos?. Analizando Reviews de Películas con Python

By Rafa Haro

Elevator Pitch

Si eres usuario recurrente de cualquier servicio de Streaming multimedia y estás cansado de navegar por los títulos sin tener ni idea de que van y si te podrán gustar,no te preocupes por que en esta charla veremos como python nos puede ayudar a caracterizar películas mediante análisis de texto

Description

Cualquier usuario concurrente de servicios de Streaming multimedia termina por hacerse la misma pregunta: y hoy…¿qué vemos?. Más allá de los avanzados sistemas de recomendación adaptados a los perfiles de cada usuario que estos servicios suelen integrar, se ofrece escasa información al usuario acerca de la temática de los títulos, su acogida por el público, en que destacan, etcétera. En esta charla, podremos ver como haciendo uso de herramientas de Procesamiento de Lenguaje Natural, modelado de tópicos y Análisis de Sentimiento en python es posible programar un Profiler sencillo de películas y series mediante el análisis de críticas textuales procedentes de sitios como IMDB o Film Affinity. El objetivo del análisis es encontrar, de forma automática, los principales tópicos o temáticas relacionadas con cada título y como se posiciona la crítica sobre cada uno de ellos. De esta forma, los amantes de un género o temática concreto pueden filtrar más fácilmente lo que les gustaría ver en cada momento.

Notes

A nivel técnico, la charla se centrará por un lado en el uso de herramientas de PLN en python para preprocesar el texto de las críticas, filtrando todo lo innecesario y construyendo modelos de representación adecuados para ser usados por el profiler. Posteriormente, nos centraremos en el uso de la librería gensim para generar Modelos de Tópicos como LDA y modelos de word embedding como Word2Vec que nos permitan capturar conjuntos de palabras relacionadas a nivel semántico que puedan describir grupos similares de críticas, lo que permitirá agrupar títulos similares. Por último, veremos distintas herramientas de análisis de sentimiento en python para poder valorar las críticas con respecto a cada una de las temáticas