Comprensión de textos mediante similaridad semántica de strings.

La Similaridad semántica Textual (STS) mide el grado en el que dos oraciones son sistematicamente equivalentes. dicha información es la base de muchos sistemas de comprensión de lenguaje natural como los que construimos dentro de Owly, ya que permite entender si dos frases se encuentran vinculadas (Bentivogli et al., 2016; Bowman et al., 2015; Dagan et al., 2010), semánticamente relacionadas, (Bentivogli et al., 2016) o son una parafrasis de la otra (Xu et al., 2015; Ganitkevitch et al., 2013; Dolan et al., 2004).

En general, STS trata de encontrar relaciones entre dos conjuntos de texto, en forma de

M:(Texto1 , Texto2 ) = > R

Un ejemplo de esta relación sería

J(A,B) = (A ∩ B / A ∪ B),

Dicha relación, pese a ser bastante útil genera problemas al ser altamente sensible a sinónimos y parafrasis, como podemos ver en estos ejemplos:

El uso de STS mantiene, por sobre los métodos de realción semántica y de parafrasis, la ventaja de permitir la captura de gradaciones de sobreposición de significados, en lugar de generar clasificaciones binarias de relaciones particulares. un ejemplo de esto sería, dentro de una nube de significados coherente, el que existe una relación muy cercana entre las palabras "orden" y "caos", cuestión que podría arrojar puntajes muy altos de relacionamiento sin que exista en realidad una similaridad entre los dos conceptos. hay que entender entonces que, aunque muchas palabras se encuentren relativamente cerca en un espacio vectorial, su significado puede variar ampliamente (Hershcovich, Toledo, Halfon y Slonim, 2019)

achine translation (MT), summarization, generation, question answering (QA), short answer grading, semantic search, dialog and conversational systems. The STS shared task is a venue for assessing the current state-of-the-art. The 2017 task focuses on multilingual and cross-lingual pairs with one sub-track exploring MT quality estimation (MTQE) data. The task obtained strong participation from 31 teams, with 17 parti

es un problema abierto en las ciencias de la computación (Cera et al. 2017)

En el presente articulo discutiremos la definición de la tarea de similaridad semántica, el modelo base a implementar para lograr una comprensión de textos mediante dicha técnica, y propondremos algunos ajustes al modelo que permitan

Cera et al. (2015) Multilingual and Cross-lingual Focused Evaluation.

Buscar este blog

The Owly Team Blog

Comprensión de textos mediante similaridad semántica de strings.

Comentarios

Publicar un comentario

Entradas más populares de este blog

Desarrollando una conversación emocional con Deep Learning. Parte 1: Planeación