Comprensión de textos mediante similaridad semántica de strings.
La Similaridad semántica Textual (STS) mide el grado en el que dos oraciones son sistematicamente equivalentes. dicha información es la base de muchos sistemas de comprensión de lenguaje natural como los que construimos dentro de Owly, ya que permite entender si dos frases se encuentran vinculadas (Bentivogli et al., 2016; Bowman et al., 2015; Dagan et al., 2010), semánticamente relacionadas, (Bentivogli et al., 2016) o son una parafrasis de la otra (Xu et al., 2015; Ganitkevitch et al., 2013; Dolan et al., 2004).
En general, STS trata de encontrar relaciones entre dos conjuntos de texto, en forma de
M:(Texto1 , Texto2 ) = > R
Un ejemplo de esta relación sería
J(A,B) = (A ∩ B / A ∪ B),
Dicha relación, pese a ser bastante útil genera problemas al ser altamente sensible a sinónimos y parafrasis, como podemos ver en estos ejemplos:
El uso de STS mantiene, por sobre los métodos de realción semántica y de parafrasis, la ventaja de permitir la captura de gradaciones de sobreposición de significados, en lugar de generar clasificaciones binarias de relaciones particulares. un ejemplo de esto sería, dentro de una nube de significados coherente, el que existe una relación muy cercana entre las palabras "orden" y "caos", cuestión que podría arrojar puntajes muy altos de relacionamiento sin que exista en realidad una similaridad entre los dos conceptos. hay que entender entonces que, aunque muchas palabras se encuentren relativamente cerca en un espacio vectorial, su significado puede variar ampliamente (Hershcovich, Toledo, Halfon y Slonim, 2019)
achine translation
(MT), summarization, generation, question
answering (QA), short answer grading, semantic search, dialog and conversational
systems. The STS shared task is a venue
for assessing the current state-of-the-art.
The 2017 task focuses on multilingual and
cross-lingual pairs with one sub-track exploring MT quality estimation (MTQE)
data. The task obtained strong participation from 31 teams, with 17 parti
es un problema abierto en las ciencias de la computación (Cera et al. 2017)
En el presente articulo discutiremos la definición de la tarea de similaridad semántica, el modelo base a implementar para lograr una comprensión de textos mediante dicha técnica, y propondremos algunos ajustes al modelo que permitan
Cera et al. (2015) Multilingual and Cross-lingual Focused Evaluation.
Comentarios
Publicar un comentario