Detectarán mensajes de acoso en twitter con sistema politécnico

Fecha:

CIUDAD DE MÉXICO, 25 de enero (AlmomentoMX).- Ante el incremento de las incidencias de ciberacoso en redes sociales, servicios de mensajería instantánea y correo electrónico, el estudiante Juan Carlos Ramos Márquez desarrolló un programa de cómputo que detecta los tuit con contenido ofensivo, y de esa forma contribuye a reducir los casos de hostigamiento en el país.

La investigación, efectuada en el Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN), analiza el contenido de los mensajes de Twitter, únicamente en español. Con la asociación de algoritmos que, por medio de técnicas de procesamiento de lenguaje natural, verifican si los tuit son de ciberacoso.

El sistema desarrollado por el politécnico de maestría tiene 69 por ciento de efectividad en la detección de tuit con contenido ofensivo. Y sólo debe iniciarse en la computadora para que analice los mensajes y los etiquete como de acoso o no.

El proceso de elaboración del programa requirió en primera instancia de la adquisición de datos, un corpus con palabras consideradas ofensivas, coordenadas geográficas para delimitar a México, emoticones y el símbolo “@” para identificar al usuario.

Con esta información se realizó el entrenamiento con tres sistemas de clasificadores, los cuales se encargan del análisis y, basado en los elementos que contenga el tuit,  juzgará si es de acoso y después determinará el porcentaje del contenido ofensivo.

Los mensajes deben contener al menos dos referencias para hacer el estudio, ya que está basado en el sistema binario, el cual sólo tiene dos opciones: ofensivo o no. Los resultados mostraron que una mayor cantidad de tuit de hostigamiento tiene emoticones, explicó Ramos Márquez.

El hostigamiento tiene otras clasificaciones como peleas en línea, exclusión de usuarios, revelación o compartición de datos, fotos o videos personales sin autorización, y suplantación o robo de identidad.

Para la tesis, de la cual fue asesor Francisco Hiram Calvo Castro del CIC, se crearon técnicas de Ngramas sintácticos, los cuales se emplean comúnmente en el diseño de núcleos que permiten a los algoritmos automáticos de aprendizaje la extracción de datos, a partir de cadenas de texto, en este caso los tuit, además detectan palabras mal escritas.

El siguiente paso del trabajo sería incrementar el tamaño del corpus del programa y utilizar la información inherente a los mensajes como imágenes en formatos JPG y GIF, así como links, además, se quiere procesar los enunciados que conlleven un tono sarcástico, burlón o estén escritos con palabras deformadas, como las que sustituyen la letra “Q”, por la “K”.

AM.MX/fm

Compartir

Popular

Artículos relacionados
Related

La diabetes y el neumococo: un binomio que puede perjudicar tu salud

Sin embargo, hay un riesgo que muchas veces pasa desapercibido y esto se debe a las infecciones causadas por la bacteria Streptococcus pneumoniae, mejor conocida como neumococo.

Profeco y Condusef orientan a personas adultas mayores para protegerse de estafas

Es importante que las personas adultas mayores aprendan a usar tecnología para evitar ser víctimas de fraudes

Tzompantli de Gustavo Monroy llega a San Ildefonso como un canto a la memoria y la resistencia

El Colegio de San Ildefonso presenta Tzompantli, monumental obra de Gustavo Monroy que une arte, memoria y resistencia, reafirmando el legado del muralismo mexicano como reflejo de la historia y las heridas del presente.

El 80% de la rotación laboral se origina en la selección: la neurociencia ayuda a elegir al candidato correcto

Además, 45% de esas malas contrataciones se atribuye a fallas en el proceso de selección; ante ello, soluciones de neurociencia aplicada al reclutamiento como Pandapé Genoma ayudan a predecir el éxito del candidato desde la selección. Con esta tendencia es posible evaluar habilidades cognitivas, rasgos de personalidad y encaje cultural para anticipar desempeño y permanencia.