Repository logo
 

Automatic sentiment analysis in Honduran political tweets

dc.creatorRodríguez Alcántara, Nicole
dc.creatorFalck Durán, Angella
dc.creatorSuazo Barahona, Sergio Antonio
dc.date2024-04-29
dc.date.accessioned2025-11-05T16:21:40Z
dc.date.available2025-11-05T16:21:40Z
dc.descriptionIntroduction. Twitter has become a medium for citizens to express in politics, transmitting feelings and opinions of users through tweets. Analyzing this data allows to discover trends and turning points in political criteria. The study aim was to develop an automatic sentiment analysis process in Honduran political tweets, through supervised machine learning techniques. Methods. A collection of 1,800 Honduran political tweets was carried out through filters based in users and hashtags in the period from January to September 2022, followed by a manual tweet tagging. The following techniques of natural language processing were applied: Bag of Words (BOW) and term frequency-inverse document frequency (TF-IDF). The considered methods were: linear SVM, logistic regression and multinomial Naïve Bayes (MNB). The performance metrics used to compare classifiers were a term frequency (F1-score), accuracy and time (training and validation). Results. The selected model was the MNB due to its higher F1-score (62.48%) and shorter training time, while linear SVM obtained 61.80% and logistic regression 61.34%. The final performance of the MNB with new tweets was an F1-score of 63.37%. Conclusion. For the data set presented, it was found that the best classifier was MNB. However, the performance gap between classifiers is small, which implies that preprocessing optimizations and larger scale data collection should be considered.en-US
dc.descriptionIntroducción. Twitter se ha convertido en un medio de expresión política ciudadana, transmitiendo sentimientos y opiniones de los usuarios mediante tuits. Analizar estos datos permite conocer tendencias y puntos de inflexión en los criterios políticos. El objetivo del estudio fue desarrollar un proceso de análisis automático de sentimiento en tuits de política de Honduras, mediante técnicas de aprendizaje de máquina supervisado. Métodos. Se efectuó una recolección de 1,800 tuits de política hondureña mediante filtros basados en usuarios y hashtags en un periodo de enero a septiembre de 2022, seguido de un etiquetado manual de tuits. Se aplicaron las técnicas de procesamiento de lenguaje natural: Bolsa de Palabras (BOW, siglas en inglés) y frecuencia de término-frecuencia inversa de documento (TF-IDF, siglas en inglés). Los métodos considerados fueron SVM lineal, regresión logística y Naive Bayes multinomial (MNB). Las métricas de rendimiento para la comparación de clasificadores fueron el valor-F (F1), la exactitud y los tiempos de entrenamiento y de validación. Resultados. El modelo seleccionado fue el MNB por su mayor frecuencia de término (F1) (62.48%) y menor tiempo de entrenamiento. Mientras que SVM lineal obtuvo 61.80% y regresión logística 61.34%. El rendimiento final del MNB con tuits nuevos fue de 63.37% de F1. Conclusión. Para el conjunto de datos presentado, se obtuvo que el mejor clasificador fue MNB. Sin embargo, la brecha de rendimiento entre clasificadores es reducida, lo que implica que optimizaciones de preprocesamiento y debe considerarse una colección de datos a mayor escala.es-ES
dc.formattext/html
dc.formatapplication/pdf
dc.identifierhttps://revistas.unitec.edu/innovare/article/view/243
dc.identifier.urihttps://repositorio.unitec.edu//handle/123456789/13962
dc.languagespa
dc.publisherUniversidad Tecnológica Centroamericanaes-ES
dc.relationhttps://revistas.unitec.edu/innovare/article/view/243/267
dc.relationhttps://revistas.unitec.edu/innovare/article/view/243/268
dc.rightshttps://creativecommons.org/licenses/by-nc-nd/4.0es-ES
dc.sourceInnovare Revista de ciencia y tecnología; Vol. 11 No. 3 (2022); 158-165en-US
dc.sourceInnovare Revista de ciencia y tecnología; Vol. 11 Núm. 3 (2022); 158-165es-ES
dc.source2310-290X
dc.subjectAnálisis de sentimientoes-ES
dc.subjectAprendizaje de maquina supervisadoes-ES
dc.subjectPolítica de Hondurases-ES
dc.subjectProcesamiento de lenguaje naturales-ES
dc.subjectTwitteres-ES
dc.subjectSentiment analysisen-US
dc.subjectSupervised machine learningen-US
dc.subjectHonduran politicsen-US
dc.subjectNatural language processingen-US
dc.subjectTwitteren-US
dc.titleAutomatic sentiment analysis in Honduran political tweetsen-US
dc.titleAnálisis automático de sentimiento en tuits de política de Hondurases-ES
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion

Files

Collections