Automatic sentiment analysis in Honduran political tweets
| dc.creator | Rodríguez Alcántara, Nicole | |
| dc.creator | Falck Durán, Angella | |
| dc.creator | Suazo Barahona, Sergio Antonio | |
| dc.date | 2024-04-29 | |
| dc.date.accessioned | 2025-11-05T16:21:40Z | |
| dc.date.available | 2025-11-05T16:21:40Z | |
| dc.description | Introduction. Twitter has become a medium for citizens to express in politics, transmitting feelings and opinions of users through tweets. Analyzing this data allows to discover trends and turning points in political criteria. The study aim was to develop an automatic sentiment analysis process in Honduran political tweets, through supervised machine learning techniques. Methods. A collection of 1,800 Honduran political tweets was carried out through filters based in users and hashtags in the period from January to September 2022, followed by a manual tweet tagging. The following techniques of natural language processing were applied: Bag of Words (BOW) and term frequency-inverse document frequency (TF-IDF). The considered methods were: linear SVM, logistic regression and multinomial Naïve Bayes (MNB). The performance metrics used to compare classifiers were a term frequency (F1-score), accuracy and time (training and validation). Results. The selected model was the MNB due to its higher F1-score (62.48%) and shorter training time, while linear SVM obtained 61.80% and logistic regression 61.34%. The final performance of the MNB with new tweets was an F1-score of 63.37%. Conclusion. For the data set presented, it was found that the best classifier was MNB. However, the performance gap between classifiers is small, which implies that preprocessing optimizations and larger scale data collection should be considered. | en-US |
| dc.description | Introducción. Twitter se ha convertido en un medio de expresión política ciudadana, transmitiendo sentimientos y opiniones de los usuarios mediante tuits. Analizar estos datos permite conocer tendencias y puntos de inflexión en los criterios políticos. El objetivo del estudio fue desarrollar un proceso de análisis automático de sentimiento en tuits de política de Honduras, mediante técnicas de aprendizaje de máquina supervisado. Métodos. Se efectuó una recolección de 1,800 tuits de política hondureña mediante filtros basados en usuarios y hashtags en un periodo de enero a septiembre de 2022, seguido de un etiquetado manual de tuits. Se aplicaron las técnicas de procesamiento de lenguaje natural: Bolsa de Palabras (BOW, siglas en inglés) y frecuencia de término-frecuencia inversa de documento (TF-IDF, siglas en inglés). Los métodos considerados fueron SVM lineal, regresión logística y Naive Bayes multinomial (MNB). Las métricas de rendimiento para la comparación de clasificadores fueron el valor-F (F1), la exactitud y los tiempos de entrenamiento y de validación. Resultados. El modelo seleccionado fue el MNB por su mayor frecuencia de término (F1) (62.48%) y menor tiempo de entrenamiento. Mientras que SVM lineal obtuvo 61.80% y regresión logística 61.34%. El rendimiento final del MNB con tuits nuevos fue de 63.37% de F1. Conclusión. Para el conjunto de datos presentado, se obtuvo que el mejor clasificador fue MNB. Sin embargo, la brecha de rendimiento entre clasificadores es reducida, lo que implica que optimizaciones de preprocesamiento y debe considerarse una colección de datos a mayor escala. | es-ES |
| dc.format | text/html | |
| dc.format | application/pdf | |
| dc.identifier | https://revistas.unitec.edu/innovare/article/view/243 | |
| dc.identifier.uri | https://repositorio.unitec.edu//handle/123456789/13962 | |
| dc.language | spa | |
| dc.publisher | Universidad Tecnológica Centroamericana | es-ES |
| dc.relation | https://revistas.unitec.edu/innovare/article/view/243/267 | |
| dc.relation | https://revistas.unitec.edu/innovare/article/view/243/268 | |
| dc.rights | https://creativecommons.org/licenses/by-nc-nd/4.0 | es-ES |
| dc.source | Innovare Revista de ciencia y tecnología; Vol. 11 No. 3 (2022); 158-165 | en-US |
| dc.source | Innovare Revista de ciencia y tecnología; Vol. 11 Núm. 3 (2022); 158-165 | es-ES |
| dc.source | 2310-290X | |
| dc.subject | Análisis de sentimiento | es-ES |
| dc.subject | Aprendizaje de maquina supervisado | es-ES |
| dc.subject | Política de Honduras | es-ES |
| dc.subject | Procesamiento de lenguaje natural | es-ES |
| dc.subject | es-ES | |
| dc.subject | Sentiment analysis | en-US |
| dc.subject | Supervised machine learning | en-US |
| dc.subject | Honduran politics | en-US |
| dc.subject | Natural language processing | en-US |
| dc.subject | en-US | |
| dc.title | Automatic sentiment analysis in Honduran political tweets | en-US |
| dc.title | Análisis automático de sentimiento en tuits de política de Honduras | es-ES |
| dc.type | info:eu-repo/semantics/article | |
| dc.type | info:eu-repo/semantics/publishedVersion |
