Skip to content
¡LO LOGRAMOS!, somos parte del cambio. Ahora iNBest está certificado bajo la norma NMX 025.

    ¿Qué es un sistema Question Answering?

    ¿Qué es un sistema Question Answering?

    La búsqueda del conocimiento es una tarea enteramente humana, no existe ninguna otra especie que vea de tal manera su existencia como lo hace un ser humano. En la actualidad existen una infinidad de fuentes de información a las cuales se puede tener acceso mediante internet y todos nos hemos visto envueltos en la gran hazaña de resolver una duda usando nuestro navegador favorito.

    No es de extrañarse que los expertos en inteligencia artificial y algoritmos de aprendizaje automático se planteen la enorme meta de hacer un sistema con la misma capacidad de un humano para encontrar información, es decir, la evolución de los buscadores y en realidad esta herramienta tiene un sin fin de usos que a continuación revisaremos.

     

    ¿Qué es un sistema QA?

    Es una forma de recuperación o desglose de información que dada una cierta cantidad de documentos (tales como World Wide Web) o usando como base un sistema experto, el sistema debería ser capaz de recuperar respuestas a preguntas planteadas en lenguaje natural.

    Estos sistemas se suelen ver como el siguiente paso en la tecnología del buscador que, en lugar de recibir un sitio relacionado a tu búsqueda, un sistema QA entrega una respuesta concreta a la pregunta dada.

     

    Nuevo llamado a la acción

     

    Historia:

    Los primeros sistemas QA fueron desarrollados alrededor de los 60’s los cuales eran utilizados como interfaces para sistemas expertos, estos sistemas proporcionaban personalidad a un software con la capacidad de simular el conocimiento de alguna profesión humana. Algunos de los primeros sistemas de inteligencia artificial eran de tipo QA y dos de los sistemas más famosos eran Baseball y lunar desarrollados en los 60’s. El primero respondía preguntas sobre béisbol mientras que el segundo se encargaba de responder preguntas sobre geología en el estudio de las rocas usado en el apoyo en su viaje a la luna. LUNAR era capaz de responder al 90% de las preguntas correctamente. Varios sistemas de question-answering de dominio cerrado se construyeron en los años posteriores, cuya funcionalidad común era que tenían núcleo basado en las bases de datos de conocimiento escritas por expertos.

    En las décadas de los 70 y 80 se apreció el desarrollo de las teorías de comprensión en lingüística computacional, lo cual permitió el desarrollo de proyectos de comprensión de texto y question-answering. Un ejemplo de estos sistemas es el Unix Consultant (UC), que respondía preguntas referentes a sistema operativo Unix.

    A finales de los 90 la conferencia anual Text Retrieval Conference (TREC) incluía un sistema de question-answering que sigue ejecutando hoy en día. Los sistemas que participan en esta competición deben de responder cuestiones sobre un tema buscando un trozo de texto que varía de un año para otro. Esta competición encaminó la búsqueda y desarrollo del question-answering en dominio abierto. Los mejores sistemas del año 2004 lograron un 77% de las preguntas correctas. Un creciente número de sistemas incluyen la web como uno de los cuerpos de texto. Actualmente hay un gran crecimiento en el interés de la integración de sistemas de questión-answering en la Web. Ask.com es un ejemplo reciente, y Google y Microsoft han empezado a integrar las facilidades del question-answering en sus buscadores Web.

    El MIT desde 1993 desarrolla un proyecto llamado START el primer sistema QA basado en web el cual pretende responder todas las preguntas utilizando como base de conocimiento internet.

     

    Métodos:

    Los grandes retos y paradigmas que se plantean actualmente para sistemas QA dependen enormemente de un buen motor de búsqueda, es decir, un sistema que se encargue de seleccionar documentos que sean candidatos a tener la respuesta. Parece lógico que grandes colecciones de documentos tiendan a producir mejores respuestas lo cual significa que es probable que parte de la información esté en varios sitios, contextos y documentos distintos. Esto tiene dos beneficios, se reduce la carga de los sistemas de procesamiento de lenguaje natural, y que podemos considerar las respuestas correctas como aquellas que aparecen más veces.

    Podemos hacer una diferenciación entre dos métodos distintos profundidad o anchura:

    En profundidad se utilizan varios métodos para localizar fragmentos de texto de documentos para después filtrarlos basándose en la presencia de la respuesta deseada. Finalmente, esas respuestas se ordenan basándose en diferentes criterios.

    Sin embargo, en los casos en los que la reformulación de la pregunta no es suficiente, se debe realizar un análisis semántico y contextual. Estos sistemas suelen incluir sistema de gestión del conocimiento representados en ontologías, como WordNet o SUMO.

     

    Aplicaciones:

    Debido a que en los últimos años han ocurrido grandes avances en la detección de intenciones en un texto, varias empresas como Amazon WS han desarrollado herramientas para la creación de Chat Bots a través del Machine Learning, los cuales ayudan a la detección de intenciones dentro de una conversación en chats como Facebook Messenger, Skype o Whatsapp. Adicionalmente, los desarrolladores con ayuda de las intenciones extraídas, pueden entregar una respuesta en base a un banco de datos, ya sea internet o un árbol de decisiones. Estos sistemas pueden servir desde algo como encargar comida, hasta sistemas que apoyen a el proceso de marketing agregándoles discurso acerca de la empresa en cuestión o inclusive sistemas que den soporte y sirvan como una forma de ofrecer solución a los clientes sin intervención humana.

     

    Nuevo llamado a la acción