Detectarán mensajes de acoso en twitter con sistema politécnico

Fecha:

CIUDAD DE MÉXICO, 25 de enero (AlmomentoMX).- Ante el incremento de las incidencias de ciberacoso en redes sociales, servicios de mensajería instantánea y correo electrónico, el estudiante Juan Carlos Ramos Márquez desarrolló un programa de cómputo que detecta los tuit con contenido ofensivo, y de esa forma contribuye a reducir los casos de hostigamiento en el país.

La investigación, efectuada en el Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN), analiza el contenido de los mensajes de Twitter, únicamente en español. Con la asociación de algoritmos que, por medio de técnicas de procesamiento de lenguaje natural, verifican si los tuit son de ciberacoso.

El sistema desarrollado por el politécnico de maestría tiene 69 por ciento de efectividad en la detección de tuit con contenido ofensivo. Y sólo debe iniciarse en la computadora para que analice los mensajes y los etiquete como de acoso o no.

El proceso de elaboración del programa requirió en primera instancia de la adquisición de datos, un corpus con palabras consideradas ofensivas, coordenadas geográficas para delimitar a México, emoticones y el símbolo “@” para identificar al usuario.

Con esta información se realizó el entrenamiento con tres sistemas de clasificadores, los cuales se encargan del análisis y, basado en los elementos que contenga el tuit,  juzgará si es de acoso y después determinará el porcentaje del contenido ofensivo.

Los mensajes deben contener al menos dos referencias para hacer el estudio, ya que está basado en el sistema binario, el cual sólo tiene dos opciones: ofensivo o no. Los resultados mostraron que una mayor cantidad de tuit de hostigamiento tiene emoticones, explicó Ramos Márquez.

El hostigamiento tiene otras clasificaciones como peleas en línea, exclusión de usuarios, revelación o compartición de datos, fotos o videos personales sin autorización, y suplantación o robo de identidad.

Para la tesis, de la cual fue asesor Francisco Hiram Calvo Castro del CIC, se crearon técnicas de Ngramas sintácticos, los cuales se emplean comúnmente en el diseño de núcleos que permiten a los algoritmos automáticos de aprendizaje la extracción de datos, a partir de cadenas de texto, en este caso los tuit, además detectan palabras mal escritas.

El siguiente paso del trabajo sería incrementar el tamaño del corpus del programa y utilizar la información inherente a los mensajes como imágenes en formatos JPG y GIF, así como links, además, se quiere procesar los enunciados que conlleven un tono sarcástico, burlón o estén escritos con palabras deformadas, como las que sustituyen la letra “Q”, por la “K”.

AM.MX/fm

Compartir

Popular

Artículos relacionados
Related

Nuevo León envía víveres y rescatistas a Veracruz

El convoy partió con equipo especializado, vehículos, helicópteros y toneladas de víveres recolectados por la sociedad neoleonesa.

Drones, el nuevo motor de competitividad para las empresas mexicanas: Drone Industry Insights

Aunque el mercado mexicano de drones crecerá en la próxima década, la mayoría de las empresas aún no sabe cómo integrarlos en su operación. Drone Academy celebrará 10 años cerrando esa brecha; no solo enseñando a volar drones, sino a usarlos con criterio técnico, enfoque normativo y visión operativa. El 75 % usa drones con fines profesionales y el 25 % por interés personal, pero con responsabilidad. Hoy son clave en construcción, energía y agricultura.

Mujeres de Santa Martha crean con cartonería la escenografía del concierto de Vivir Quintana

Dieciséis mujeres privadas de la libertad en Santa Martha Acatitla elaboraron con técnica de cartonería la escenografía del concierto “Fuimos Todas” de Vivir Quintana, impulsado por la Fundación IKAL BEJ y la Secretaría de Seguridad Ciudadana.

Productores del Istmo bloquean carretera para exigir apoyo al campo

Esta acción se enmarca dentro del Paro Nacional Agropecuario, en el que participan productores de diversas entidades del país.