Guía docente de Representación de la Información en la Web: Xml y Recuperación de Información (M12/56/1/50)

Curso 2024/2025
Fecha de aprobación por la Comisión Académica 28/06/2024

Máster

Máster Universitario en Información y Comunicación Científica

Módulo

Recuperación de la Información

Rama

Ciencias Sociales y Jurídicas

Centro Responsable del título

International School for Postgraduate Studies

Semestre

Primero

Créditos

3

Tipo

Optativa

Tipo de enseñanza

Semipresencial

Profesorado

  • Eduardo Peis Redondo

Tutorías

Eduardo Peis Redondo

Email
Anual
  • Lunes 11:00 a 13:00 (Despacho Decanato)
  • Miercoles 11:00 a 13:00 (Despacho Decanato)
  • Miércoles 11:00 a 13:00 (Despacho Decanato)
  • Jueves 11:00 a 13:00 (Despacho Decanato)

Breve descripción de contenidos (Según memoria de verificación del Máster)

  • Problemas de la recuperación de información en la Web y posibilidades de mejora en cuanto a la representación de recursos.
  • Familia de especificaciones XML.
  • Aplicaciones, desarrollos, viabilidad e impacto futuro.

 

Prerrequisitos y/o Recomendaciones

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Resultados de aprendizaje (Objetivos)

El alumno sabrá/comprenderá:

  • Las posibilidades de mejora de la representación de recursos en la Web. Las limitaciones de HTML.
  • La especificación XML (eXtensible Markup Language) y sus posibilidades de aplicación.
  • La "familia" de especificaciones XML.
  • Un vocabulario para la recuperación de información estructurada: NEXI
  • RDF (Resource Description Framework) para la lógica semántica.
  • Las posibles aplicaciones de las tecnologías en su conjunto: la Web Semantica y la Web de Datos.

El alumno será capaz de:

  • Desarrollar una página Web XML con la ayuda de CSS y HTML sin utilizar editores
  • Aplicar XSLT para modificar la salida de documentos estructurados XML
  • Recuperar información estructurada utilizando NEXI
  • Crear una proposición lógica utilizando RDF
  • Mejorar las posibilidades de recuperación de información Web utilizando estas tecnologías

Programa de contenidos Teóricos y Prácticos

Teórico

BLOQUE I  Problemas de la recuperación de informaciónen la Web y posibilidades de mejora en cuanto a la representación de recursos.

  1. Recuperación de la Información en la Web: problemas y posibilidades de mejora.
  2. Lenguajes de codificación descriptiva para la representación de la información.
  3. La edición electrónica. Los orígenes de SGML.
  4. La norma ISO 8879, SGML (Standard Generalized Markup Language).
  • Gramática y sintaxis SGML.
  • Estructuras SGML.
  • Modelos de documento.
  • Definición del Tipo de Documento (DTD).

BLOQUE II XML.

  1. La adaptación: XML (eXtensible Markup Language).
  2. Validación: DTDs y XML Schemas.
  3. El formato. La convivencia: XML, HTML y CSS2.

BLOQUE III. Recuperación de Documentos Estructurados (XML)

  1. La recuperación en los documentos estructurados.
  • Conceptos básicos de XPath.
  • Procesos.
  • Indexación.
  • Consulta.
  1. NEXI (Narrowed Extended XPath).
  • Recuperación.

BLOQUE IV. "Familia" de especificaciones XML

  1. Especificaciones complementarias
  2. La semántica (RDF-Resources Description Framework).

 
BLOQUE V La tecnología funcionando en conjunto

  1. El proyecto Web Semántica
  2. Viabilidad
  3. Aplicaciones a  servicios Web
  4. Un Sistema Recomendación Semántico
  5. Conclusiones

 

Práctico

Coincidiendo con el  contenido temático de la sesión, se realizarán las siguientes tareas prácticas. Todas las tareas prácticas consisten en progresos secuenciales de un proyecto de partida.

Práctica 0:  Desarrollo de un DTD SGML y un modelo de documentos correspondiente.

Práctica 1: Diseño de nuestro primer XML y comprobación de XML well formed.

Práctica 2: Diseño de un artículo científico en XML.

Práctica 3: Mejoras de estilo con CSS2 y HTML

Práctica 4: Expresiones NEXI para la consulta de documentos XML

Práctica 5: Ejercicio RDF

Práctica 6  Diseño conceptual (con sus componentes RDF), de un Sistema de Recomendación Semántico

Bibliografía

Bibliografía fundamental

 

  • Berners-Lee, T. (1998 [B]). "Semantic Web Road Map".  http://www.w3.org/DesignIssues/Semantic.html  (La "hoja de ruta" de la Web Semántica de Berners-Lee)
  • Berners-Lee, T.; Hendler, J.; Lassila, O. (2001) “The Semantic Web: A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities". Scientific American, May (Avance hacia la Web de datos)
  • Feigenbaum, L.; Herman, I.; Hongsermeier, T.; Neumann, E.; Stephens, S. (2007). "The Semantic Web in Action". Scientific American, 297(6), pp. 90-97 (Desarrollos sobre la Web Semántica)
  • Fernández-Luna, J.M.; Huete-Guadix, J.F. (2001). "Recuperación XML". En: Cacheda, et. al. [eds]. Recuperación de Información. Un enfoque práctico y multidisciplinar. Madrid: RA-MA, 415-453 (Trabajo fuente del bloque de recuperación estructurada).
  • Guha, R.; McCool, R.; Miller, E. (2003). "Semantic search". 12th International World Wide Web Conference (WWW2003), Budapest, Hungary 2003. pp. 700 - 709 (Recuperación de información en la Web Semántica).
  • Hendler, J. (2001). "Agents and the Semantic Web". IEEE Intelligent Systems 2001, marzo/abril, pp. 30-37 (El "padre" de la actuación de los agentes en la Web Semántica)
  • Hendler, J. (2002). "Ontologies on the Semantic Web". IEEE Inteligent Systems 2002, marzo-abril, pp.73-74 (El "centro" semántico de la Web Semántica, las Ontologías)
  • Herrera-Viedma, E.; Peis, E.; Olvera, M. D. et al. "Evaluating the Informative Quality of Web Sites by Fuzzy Computing with Words". En: Lecture Notes in Artificial Inteligence, 2003, 2663, pp.62-72 (Aplicación tecnologías Web Semántica y fuzzy logic).
  • Javed, U., Shaukat, K., Hameed, I. A., Iqbal, F., Alam, T. M., & Luo, S. (2021). A review of content-based and context-based recommendation systems. International Journal of Emerging Technologies in Learning (iJET), 16(3), 274-306.
  • Lassila, O.; Swick, R. (1999). "Resource Description Framework (RDF) Model and Syntax Specification: W3C Recommendation". http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/ (Todo sobre RDF)
  • Patel, A.; Jain, S. (2021). Present and future of semantic web technologies: a research statement. International Journal of Computers and Applications, 43(5), 413-422.
  • Peis, E.; Herrera-Viedma, E.; Morales-del-Castillo, J. M. (2007). "Aproximación a la web semántica desde la perspectiva de la Documentación". Investigación bibliotecológica, 21(43), 47-71 (Muy útil para conocer la base tecnológica de la Web Semántica y discutir sobre su importancia para los profesionales de la información).
  • Peis, E.; Herrera-Viedma, E.; Hassan, Y.; Herrera, J. C. (2003). "Análisis de la web semántica: estado actual y requisitos futuros". El Profesional de la Información, 12(5), 368-376 (Análisis de las tecnologías básicas de la Web Semántica).
  • Peis, E.; Herrera-Viedma, E.; Hassan, Y.; Herrera, J. C. "Ontologías, Metadatos y Agentes: Recuperación Semántica de la Información". En: III Jornadas de Tratamiento y Recuperación de Información (JOTRI’2003). Madrid, 8 y 9 de septiembre, 2003 (Análisis de la "capa lógica" de la Web Semántica)
  • Peis, E.; Morales-Del-Castillo, J.; Delgado-López, J. (2008). "Semantic Recommender Systems - Analysis of the State of the Topic". Hipertextnet, 6, 1-5.
  • Peis, E.; Morales-del-Castillo, J.M.; Herrera-Viedma, E. (2011). "Tecnologías Web Semántica y Recuperación de Información". En: Cacheda, et. al. [eds]. Recuperación de Información. Un Enfoque Práctico y Multidisciplinar. Madrid: RA-MA, 641-673 (SPARQL y otras tecnologías para la recuperación en la Web Semántica)
  • Tejeda-Lorente, A.; Porcel, C.; Peis, E.; Sanz, R. and Herrera-Viedma, Enrique. (2014). "A quality based recommender system to disseminate information in a university digital library". Information Sciences, 261, pp. 52-69.

Bibliografía complementaria

  • Antinou, G.; van Harmelen, F. (2004). "A Semantic Web Primer". MIT Press (Monografía básica sobre Web Semántica)
  • Bikakis, A., Hyvönen, E., Jean, S., Markhoff, B., & Mosca, A. (2021). Special issue on Semantic Web for Cultural Heritage. Semantic Web, 12(2), 163-167.
  • Bray, T.; Hollander, D.; Laymaná, A. (eds.) (1999). "Namespaces in XML". http://www. w3. org/TR/REC-xml-names (Aclaración sobre los Espacios de Nombre)
  • Martín Quetglás, G.; Martín Benítez, I. (2005). "Curso de XML: Introducción al Lenguaje de la Web". Madrid: Pearson Alhambra (Monografía básica sobre XML).
  • McGuinness, D. L.; van Harmelen, F. (2004). "OWL Web Ontology Language Overview. W3C Recommendation. 10 February 2004". http://www.w3.org/TR/2004/REC-owl-features-20040210/ (El lenguaje para la construcción de ontologías en la Web Semántica)
  • Ristoski, P., Rosati, J., Di Noia, T., De Leone, R., & Paulheim, H. (2019). RDF2Vec: RDF graph embeddings and their applications. Semantic Web, 10(4), 721-752.  
  • Shadbolt, N.; Hall, W.; Berners-Lee, T. (2006). "The Semantic Web Revisited". IEEE Intelligent Systems. May-June (Reformulación de los principios iniciales de la Web Semántica)

Enlaces recomendados

Metodología docente

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

  • Evaluación continua e interactiva de las tareas propuestas por el profesor: 80%
  • Pruebas escritas: 10%
  • Aportaciones del alumno en sesiones de discusión y actitud del alumno en las diferentes actividades desarrolladas: 10%

Las propuestas tendrán una fecha aconsejada de carga en la plataforma y una fecha límite.

El 80% correspondiente a la evaluación continua de las tareas propuestas por el profesor vendrá determinado por la media ponderada de todas las tareas realizadas por el estudiantado.

Evaluación Extraordinaria

La convocatoria extraordinaria se evaluará mediante el envío al profesor de la resolución de todas las tareas propuestas durante la impartición de la asignatura. Su calificación, conjunta, supondrá el 100% de la calificación final.

Evaluación única final

El profesor propondrá la realización de un proyecto, en el ordenador, en el que el estudiantado tenga que emplear la mayoría de las tecnologías estudiadas en la asignatura.

El estudiantado dispondrá de un tiempo limitado de 120 minutos para el desarrollo del proyecto.

Su calificación supondrá el 100% de la calificación final.

Información adicional

Información sobre el Plagio (artículo 15 de la Normativa de Evaluación y de Calificación de los Estudiantes de la Universidad de Granada).

  1. La Universidad de Granada fomentará el respeto a la propiedad intelectual y transmitirá a los estudiantes que el plagio es una práctica contraria a los principios que rigen la formación universitaria. Para ello procederá a reconocer la autoría de los trabajos y su protección de acuerdo con la propiedad intelectual según establezca la legislación vigente.
  2. El plagio, entendido como la presentación de un trabajo u obra hecho por otra persona como propio o la copia de textos sin citar su procedencia y dándolos como de elaboración propia, conllevará automáticamente la calificación numérica de cero en la asignatura en la que se hubiera detectado, independientemente del resto de las calificaciones que el estudiante hubiera obtenido. Esta consecuencia debe entenderse sin perjuicio de las responsabilidades disciplinarias en las que pudieran incurrir los estudiantes que plagien.
  3. Los trabajos y materiales entregados por parte de los estudiantes tendrán que ir firmados con una declaración explícita en la que se asume la originalidad del trabajo, entendida en el sentido de que no ha utilizado fuentes sin citarlas debidamente.