Un tesauro es una estructura de datos que organiza términos conceptuales mediante relaciones semánticas precisas, funcionando como un índice jerárquico y asociativo utilizado para mejorar la recuperación de información. A diferencia de una simple lista de palabras clave o de un diccionario tradicional, un tesauro establece conexiones lógicas entre los conceptos, permitiendo a los usuarios navegar desde términos generales hasta específicos o encontrar sinónimos controlados.
Estas herramientas son fundamentales en la organización del conocimiento, ya que reducen la ambigüedad del lenguaje natural. Al estandarizar la terminología, los tesauros permiten que documentos con vocabularios distintos sean agrupados bajo un mismo concepto, optimizando la búsqueda en bases de datos bibliográficas, catálogos de museos y repositorios digitales.
Definición y concepto
Un tesauro es una estructura jerárquica de términos que representa el conocimiento dentro de un dominio específico, diseñado para optimizar la indexación y la recuperación de información. A diferencia de una lista lineal, organiza los conceptos mediante relaciones semánticas precisas, permitiendo que sistemas informáticos y usuarios humanos comprendan cómo se conectan las ideas. Esta herramienta es fundamental en la ciencia de la información, ya que traduce el lenguaje natural, a menudo ambiguo, en un vocabulario controlado.
Debate actual: La inteligencia artificial y el aprendizaje automático amenazan con convertir los tesauros tradicionales en estructuras estáticas, obligando a la comunidad científica a decidir entre la precisión semántica manual y la flexibilidad de las etiquetas dinámicas.
Diferencias con el diccionario simple
Un diccionario convencional define palabras aisladas, enfocándose en el significado léxico. Un tesauro, en cambio, se centra en las relaciones entre los términos. Mientras un diccionario responde a "qué significa esta palabra", un tesauro responde a "cómo se relaciona este concepto con otros". Esta distinción es crítica para la búsqueda eficiente. Por ejemplo, al buscar información sobre qué son sismos, un diccionario ofrece la definición física del fenómeno. Un tesauro, sin embargo, vinculará "sismo" con términos relacionados como "terremoto", "magnitud" o "epicentro", y los jerarquizará bajo "geología". Esta estructura evita que documentos relevantes se pierdan por usar sinónimos distintos o términos más generales.
Componentes básicos: descriptores y sinónimos
La unidad fundamental de un tesauro es el descriptor, también conocido como término preferido. Es la palabra elegida para representar un concepto específico dentro del sistema. Los sinónimos son términos que comparten significado pero no han sido seleccionados como principales; se mapean hacia el descriptor para unificar la búsqueda. Por ejemplo, "automóvil" podría ser el descriptor, mientras que "coche" y "carro" serían sinónimos que redirigen a él. Esto garantiza que, independientemente del término que ingrese el usuario, el sistema recupera los mismos documentos indexados.
Aplicación en investigación y bases de datos
Los tesauros facilitan la localización de variables cuantitativas y cualitativas en bases de datos académicas. En la investigación cuantitativa experimental, los investigadores deben identificar variables continuas o discretas con precisión. Un tesauro ayuda a encontrar artículos que midan estas variables usando diferentes nombres. Del mismo modo, en la investigación cualitativa narrativa, permite agrupar estudios que utilizan términos como "entrevista en profundidad" o "historia de vida" bajo un descriptor común. Esto es esencial para realizar revisiones sistemáticas, donde la exhaustividad depende de capturar todas las variantes terminológicas de un concepto. Herramientas como Zotero gestor bibliográfico suelen integrar o conectarse con tesauros para mejorar la etiquetado de referencias, permitiendo filtrar resultados según investigación cuantitativa tipos o tipos de muestreo en estadística con mayor precisión que una simple búsqueda por palabras clave. La integración de estos conceptos en el método científico experimental asegura que la revisión de la literatura sea robusta y reproducible.
Estructura y relaciones semánticas
Los tesauros organizan el conocimiento mediante un sistema de relaciones semánticas que permiten navegar entre conceptos de forma estructurada y lógica. A diferencia de una lista lineal, estas herramientas establecen conexiones precisas que facilitan la recuperación de información y la clasificación de datos en diversas disciplinas académicas. Las tres relaciones fundamentales son la jerárquica, la de equivalencia y la asociativa.
Relaciones jerárquicas y de equivalencia
La relación jerárquica organiza los términos en niveles de abstracción. La relación "más amplio que" (superordenado) conecta un concepto general con uno más específico ("más específico que" o subordinado). Por ejemplo, en una estructura de clasificación científica, "método científico" es un término más amplio que "método científico experimental". Esta distinción es crucial cuando se analizan los diferentes tipos de investigación cuantitativa o cualitativa, ya que permite diferenciar entre el marco teórico general y sus aplicaciones prácticas específicas.
La relación de equivalencia agrupa términos que comparten significado en un contexto dado, aunque no sean sinónimos perfectos. Se denota comúnmente como "véase también" o "término preferido". Un ejemplo claro es la relación entre "sismo" y "terremoto". Aunque en el lenguaje cotidiano son casi intercambiables, un tesauro puede designar uno como término preferido para estandarizar la búsqueda de información sobre qué son sismos, vinculándolo al otro como sinónimo. Esto evita la dispersión de datos al buscar información técnica.
Relaciones asociativas y estructura no lineal
La relación asociativa conecta conceptos que están relacionados por significado pero no por jerarquía ni equivalencia directa. Esta relación permite descubrir conexiones laterales. Por ejemplo, al estudiar "variables cuantitativas y cualitativas", un tesauro puede asociar "variables continuas" con "tipos de muestreo en estadística", ya que la naturaleza de la variable influye en la elección del muestreo. Estas asociaciones son vitales para integrar conocimientos dispersos.
Esta estructura no lineal es fundamental para la gestión de la información académica. Herramientas como el gestor bibliográfico Zotero utilizan metadatos y etiquetas que funcionan bajo principios tesauros para organizar referencias. Al etiquetar una fuente sobre "investigación cualitativa narrativa", el sistema puede sugerir automáticamente artículos relacionados con "investigación cuantitativa tipos" si existen vínculos temáticos definidos. Esta capacidad de asociación mejora la eficiencia en la revisión de literatura y la organización de datos complejos, permitiendo a los investigadores visualizar cómo se interconectan conceptos como las 10 ejemplos de investigación cuantitativa con metodologías específicas.
Historia y evolución
El término tesauro proviene del griego thesauros, que significa "tesoro" o "almacén". En el contexto de la organización del conocimiento, hace referencia a un conjunto estructurado de términos descriptivos que permiten recuperar información de manera más precisa que una simple lista de palabras clave. La evolución de estos sistemas refleja el esfuerzo humano por imponer orden sobre la creciente cantidad de datos disponibles.
Orígenes y Paul Otlet
Los fundamentos modernos de los tesauros se consolidaron a finales del siglo XIX y principios del siglo XX, impulsados por visionarios como Paul Otlet. Otlet, cofundador de la Biblioteca Internacional de la Paz en Bruselas, desarrolló el Sistema Decimal Universal (SDU). Su objetivo era crear una red global de conocimiento donde cada concepto tuviera una dirección única. Esta visión anticipó la estructura de la información en la era digital, estableciendo que la clasificación no era estática, sino una herramienta dinámica para la recuperación de datos.
De las listas de palabras clave a los estándares ISO
Inicialmente, la organización de la información dependía de listas simples de palabras clave, donde cada término funcionaba de forma aislada. Esto generaba redundancias y ambigüedades. Con el avance de la investigación cuantitativa, la necesidad de clasificar datos con mayor precisión llevó al desarrollo de sistemas más complejos. Los tesauros introdujeron relaciones jerárquicas (más amplio/más específico) y asociativas (relacionado con) entre los términos.
Esta evolución culminó en la estandarización internacional. La norma ISO 2788 estableció los requisitos técnicos para la estructura y el contenido de los tesauros, asegurando la interoperabilidad entre diferentes bases de datos. Esto resultó crucial para la gestión de variables cuantitativas y cualitativas en estudios científicos, permitiendo que los datos fueran comparables a través de distintas disciplinas y regiones geográficas.
Impacto en la investigación científica
La precisión en la clasificación es fundamental para el método científico experimental. Al definir correctamente los términos, los investigadores pueden seleccionar tipos de muestreo en estadística más adecuados y analizar variables continuas con mayor fiabilidad. Los tesauros facilitan la organización de grandes volúmenes de información, algo esencial en proyectos que requieren revisar múltiples fuentes, similar a como funcionan los gestores bibliográficos como Zotero.
Esta estructura organizada permite diferenciar claramente entre investigación cualitativa narrativa y estudios cuantitativos. Por ejemplo, al buscar información sobre fenómenos específicos, como qué son sismos, un tesauro permite distinguir entre la magnitud del evento (dato cuantitativo) y el impacto social (dato cualitativo). Esta capacidad de filtrado y relación entre conceptos es la base de la eficiencia en la investigación moderna, permitiendo abordar los diversos tipos de investigación cuantitativa con rigor metodológico.
Uso en la investigación científica
En la fase de revisión de literatura, los tesauros funcionan como herramientas de precisión que reducen la subjetividad en la selección de fuentes. Permiten a los investigadores identificar sinónimos, términos jerárquicos y relaciones conceptuales que, de no ser por ellos, quedarían dispersas en bases de datos académicas. Esta estructuración es fundamental para garantizar que una revisión sistemática abarque toda la evidencia disponible, evitando que estudios clave se pierdan por la variabilidad lingüística de los autores.
Definición de variables y estandarización terminológica
La claridad en la definición de variables es el pilar de cualquier estudio empírico. Los tesauros ayudan a delimitar el alcance de las variables cuantitativas y cualitativas al proporcionar definiciones operativas estandarizadas. Por ejemplo, al trabajar con variables continuas, un tesauro puede distinguir entre medidas absolutas y relativas, asegurando que los datos recopilados sean comparables. En el contexto de la investigación cuantitativa experimental, esta precisión es vital para reducir el error aleatorio y sistemático, permitiendo que los resultados sean replicables. La estandarización de términos en artículos científicos facilita la lectura crítica y la integración de hallazgos en metanálisis posteriores.
Integración en metodologías mixtas y comparación de datos
La investigación cualitativa cuantitativa, o métodos mixtos, requiere una traducción cuidadosa entre datos numéricos y narrativos. Los tesauros permiten mapear conceptos de la investigación cualitativa narrativa hacia categorías medibles en estudios cuantitativos. Esto facilita la comparación entre diferentes tipos de investigación cuantitativa, permitiendo cruzar datos de estudios descriptivos con resultados de diseños experimentales. Al utilizar gestores bibliográficos como Zotero, los investigadores pueden etiquetar referencias con términos de un tesauro común, lo que agiliza la organización y el análisis de grandes volúmenes de información. Esta integración no solo mejora la coherencia interna del estudio, sino que también enriquece la interpretación de los datos al combinar la profundidad de la observación cualitativa con la generalización estadística.
Aplicaciones prácticas en la recolección de datos
La selección adecuada de tipos de muestreo en estadística depende directamente de cómo se han definido las variables mediante tesauros. Un muestreo estratificado, por ejemplo, requiere categorías claras y mutuamente excluyentes, que los tesauros ayudan a establecer. Esto es aplicable en diversos campos, desde estudios sobre qué son sismos y su impacto geofísico, hasta análisis sociales complejos. La estructura jerárquica de un tesauro permite desglosar conceptos amplios en subcategorías manejables, facilitando la codificación de datos tanto en estudios de investigación cuantitativa tipos transversales como longitudinales. Esta metodología rigurosa asegura que las conclusiones se basen en datos bien definidos y comparables, elevando la calidad general de la producción científica.
Tesauros y gestión bibliográfica
La integración de tesauros en gestores bibliográficos transforma la organización de la información de un proceso subjetivo a uno estructurado. Herramientas como Zotero permiten asociar metadatos estandarizados a cada referencia, facilitando la recuperación precisa durante las etapas avanzadas de la investigación. Esta práctica es fundamental para estudiantes que deben procesar grandes volúmenes de datos, ya que reduce la ambigüedad en la búsqueda de fuentes clave.
Etiquetado con descriptores estandarizados
El uso de términos controlados mejora la consistencia en la biblioteca personal. En lugar de depender de palabras clave aisladas, se aplican descriptores definidos en un tesauro específico de la disciplina. Por ejemplo, en estudios sobre investigación cuantitativa tipos, es esencial diferenciar entre variables continuas y discretas mediante etiquetas precisas. Esto permite filtrar referencias sobre variables cuantitativas sin confundirlas con conceptos relacionados pero distintos.
Al organizar una biblioteca, se deben evitar etiquetas redundantes. Un tesauro establece relaciones jerárquicas (más amplio que, más específico que) y asociativas (relacionado con). Esto ayuda a estructurar la información sobre investigación cualitativa cuantitativa de manera coherente, permitiendo cruzar datos de diferentes metodologías sin perder el hilo argumental.
Aplicación en proyectos de investigación
La gestión eficiente de referencias es crítica al manejar 10 ejemplos de investigación cuantitativa o estudios complejos. Un estudiante que trabaja con investigación cuantitativa experimental debe poder recuperar rápidamente artículos sobre método científico experimental y tipos de muestreo en estadística. El etiquetado con tesauros permite agrupar estas fuentes bajo categorías lógicas, como "Muestreo Aleatorio" o "Variables Dependientes", facilitando la revisión de literatura.
En el ámbito de la investigación cualitativa narrativa, los tesauros ayudan a categorizar temas emergentes. Aunque los datos son más fluidos, la estandarización de etiquetas permite identificar patrones recurrentes en las fuentes. Esto es igualmente aplicable en ciencias naturales, donde la organización de datos sobre fenómenos como qué son sismos requiere precisión terminológica para vincular estudios geofísicos con informes de impacto social.
Beneficios para el análisis de datos
La precisión en la gestión bibliográfica impacta directamente en el análisis de variables cuantitativas y cualitativas. Una biblioteca bien etiquetada permite extraer datos específicos para cálculos estadísticos o síntesis teórica. Por ejemplo, al analizar la relación entre dos variables, es crucial tener acceso inmediato a las fuentes que definen esas variables continuas y sus escalas de medición.
La estructura de un tesauro también apoya la validación de resultados. Al poder rastrear el origen de cada concepto a través de etiquetas consistentes, se reduce el error humano en la selección de fuentes. Esto es especialmente útil en trabajos que combinan múltiples enfoques metodológicos, asegurando que cada referencia contribuya de manera clara y verificable al cuerpo general del conocimiento.
Aplicaciones en análisis de datos
Los tesauros funcionan como estructuras de control de vocabulario que organizan conceptos mediante relaciones jerárquicas y asociativas. En el análisis de datos, esta organización permite transformar información cruda en categorías lógicas, facilitando tanto la codificación cualitativa como la cuantificación estadística. La precisión en la definición de términos reduce la ambigüedad en la interpretación de los resultados de investigación.
Codificación en investigación cualitativa
En estudios de investigación cualitativa narrativa o etnográfica, los tesauros sirven para estandarizar las etiquetas asignadas a fragmentos de texto o observaciones. Al analizar entrevistas o diarios de campo, el investigador utiliza el tesauro para agrupar conceptos similares bajo un descriptor principal. Esto permite identificar patrones recurrentes sin perder el matiz contextual. Herramientas como el gestor bibliográfico Zotero pueden integrarse con tesauros personalizados para etiquetar fuentes primarias, facilitando la recuperación de citas relacionadas con un concepto específico durante la redacción.
Influencia en el muestreo estadístico
La estructura jerárquica de un tesauro influye directamente en la selección de tipos de muestreo en estadística. Cuando los conceptos están organizados en niveles (de lo general a lo específico), los investigadores pueden definir estratos claros para un muestreo estratificado. Por ejemplo, si un tesauro de ciencias de la tierra clasifica los fenómenos sísmicos, la distinción entre "qué son sismos" por magnitud o profundidad permite dividir la población de datos en subgrupos homogéneos. Esta división asegura que cada subpoblación esté representada adecuadamente, reduciendo el error de muestreo en estudios cuantitativos amplios.
Definición de variables en estudios experimentales
En la investigación cuantitativa experimental, basada en el método científico experimental, los tesauros ayudan a operacionalizar variables continuas. Al definir una variable, el tesauro establece los límites y las unidades de medida aceptadas. Esto es crucial para garantizar que los datos recopilados sean comparables. La distinción entre variables cuantitativas y cualitativas se aclara al asignar cada concepto a su categoría correspondiente en el tesauro. Por ejemplo, en un estudio sobre rendimiento académico, el tesauro puede definir "nota final" como una variable continua con un rango específico, permitiendo aplicar pruebas estadísticas precisas. Esta estructuración es fundamental para validar los resultados en cualquier tipo de investigación cuantitativa, asegurando que las conclusiones se basen en datos medibles y coherentes.
Creación de un tesauro básico
La construcción de un tesauro requiere una metodología estructurada que garantice la consistencia semántica de los conceptos. Este proceso es fundamental para organizar la información en proyectos académicos, permitiendo recuperar datos con mayor precisión que mediante búsquedas lineales simples. A continuación, se detalla el procedimiento para desarrollar un tesauro básico, utilizando como ejemplo práctico la investigación científica.
Identificación de conceptos clave
El primer paso consiste en extraer los términos centrales del dominio de estudio. Se recomienda analizar fuentes primarias y secundarias para detectar la frecuencia de aparición de las palabras. En un estudio sobre el método científico experimental, los conceptos nucleares podrían incluir "hipótesis", "variable dependiente", "muestra" y "dato". Es crucial distinguir entre términos generales y específicos. Por ejemplo, al trabajar con variables cuantitativas y cualitativas, es necesario decidir si se utiliza el término genérico "dato" o se especifica "dato numérico" y "dato categórico". Esta distinción evita la ambigüedad durante la indexación.
Establecimiento de relaciones jerárquicas
Una vez identificados los términos, se deben organizar en una estructura jerárquica basada en la relación de género-especie (superordenado-subordenado). Esta relación se denota comúnmente como "es un tipo de". En el contexto de la investigación cuantitativa experimental, "variable" sería el término superior, mientras que "variable continua" y "variable discreta" serían sus subordinados. De manera similar, "muestreo" es el concepto padre de los tipos de muestreo en estadística, como el muestreo aleatorio simple o el estratificado. Esta jerarquía permite navegar desde lo general hacia lo específico, facilitando la recuperación de información tanto para lectores expertos como para estudiantes de secundaria.
Definición de sinónimos y términos relacionados
Las relaciones no jerárquicas son esenciales para capturar la riqueza del lenguaje. Se deben identificar los sinónimos exactos (término preferido y términos alternativos) y las asociaciones temáticas. Por ejemplo, "experimento" puede tener como sinónimo "prueba empírica". Las relaciones de asociación conectan conceptos que no están en la misma rama jerárquica pero que suelen aparecer juntos. En un proyecto que analice qué son sismos mediante datos geofísicos, existiría una relación de asociación entre "magnitud" y "frecuencia". Asimismo, al comparar la investigación cualitativa narrativa con la cuantitativa, se pueden vincular términos como "entrevista" y "escala de Likert" para mostrar contrastes metodológicos. Esta etapa mejora la flexibilidad de búsqueda, ya que al buscar un término, el sistema puede sugerir los asociados.
Validación del tesauro
La validación asegura que el tesauro refleje la realidad del campo de estudio. Se recomienda realizar pruebas con pares o expertos en la materia. Estos revisores deben verificar si las relaciones establecidas son lógicas y si no faltan conceptos clave. Una métrica útil para evaluar la cobertura inicial es calcular la densidad de términos en un corpus de referencia. Si se dispone de datos numéricos sobre la frecuencia de términos, se puede utilizar una medida básica de centralización, aunque los tesauros son principalmente estructuras cualitativas. La revisión por pares permite detectar ambigüedades, como la confusión entre variables cuantitativas y variables continuas (esta última es un subtipo de la primera). Finalmente, la integración con herramientas como zotero gestor bibliográfico permite probar el tesauro en la práctica, asignando etiquetas a las referencias bibliográficas y observando cómo se agrupan automáticamente los artículos según los términos definidos.
Ejercicios resueltos
Ejercicio 1: Estructuración jerárquica de conceptos de investigación
El primer ejercicio consiste en organizar jerárquicamente el concepto de investigación cuantitativa tipos. En un tesauro, las relaciones jerárquicas se establecen mediante los descriptores genéricos (G) y específicos (E). Para este caso, partimos de que la investigación cuantitativa es un subtipo de investigación científica. A su vez, dentro de la investigación cuantitativa, existen subcategorías como la investigación cuantitativa experimental y la investigación cuantitativa no experimental.
La estructura correcta en formato tesauro sería:
- Investigación científica (Término Genérico)
- └─ Investigación cuantitativa (Término Específico)
- └─ Investigación cuantitativa experimental (Término Específico)
- └─ Investigación cuantitativa no experimental (Término Específico)
Esta jerarquía permite a los usuarios navegar desde lo general hacia lo particular. Es fundamental distinguir estos tipos porque cada uno emplea un método científico experimental distinto, lo que afecta directamente la recolección de datos y el análisis estadístico.
Ejercicio 2: Identificación de sinónimos y términos relacionados
El segundo ejercicio requiere identificar sinónimos (Usar, U) y términos relacionados (Ver también, VT) para el descriptor variables cuantitativas. Las variables cuantitativas son aquellas que pueden medirse numéricamente, a diferencia de las variables cuantitativas y cualitativas que se miden por atributos.
Los sinónimos directos podrían incluir datos numéricos o magnitudes medibles. Sin embargo, en un tesauro académico, es más preciso usar variable continua y variable discreta como términos relacionados, ya que son subtipos. No son sinónimos perfectos porque una variable cuantitativa puede ser discreta (ej. número de hijos) o continua (ej. peso).
La entrada del tesauro quedaría así:
Variables cuantitativas
USAR: Datos numéricos (si se prefiere un término más amplio)
VER TAMBIÉN: Variables continuas; Variables discretas; Estadística descriptiva
Esta distinción es crucial al usar herramientas como zotero gestor bibliográfico, donde las etiquetas deben reflejar con precisión el contenido del artículo para facilitar la recuperación de información.
Ejercicio 3: Diseño de una red de conceptos sobre sismos
El tercer ejercicio consiste en diseñar una pequeña red de conceptos para un estudio sobre qué son sismos. Un tesauro no solo tiene jerarquías, sino también relaciones asociativas (A). Para el término Sismos, debemos identificar conceptos que no sean necesariamente superiores o inferiores, pero que aparezcan frecuentemente juntos en la literatura científica.
Los conceptos clave incluyen epicentro, magnitud y escala de Richter. Además, al analizar los datos de los sismos, se utilizan variables cuantitativas como la profundidad del foco y la duración. No se trata de investigación cualitativa narrativa, sino de mediciones precisas.
La estructura de la red sería:
- Sismos
- RELACIONADO CON: Epicentro; Magnitud; Escala de Richter; Ondas sísmicas
- ESPECIFICACIÓN DE: Fenómeno geológico
Al crear esta red, se facilita la búsqueda de artículos que, aunque no tengan "sismos" en el título, mencionen "magnitud" y "ondas sísmicas". Esto mejora la recuperación de información en bases de datos académicas, permitiendo filtrar estudios que utilicen tipos de muestreo en estadística adecuados para el análisis de datos geofísicos. La precisión en la selección de descriptores asegura que la investigación sea accesible y contextualizada correctamente dentro del ámbito científico.
Preguntas frecuentes
¿Cuál es la diferencia entre un tesauro y un diccionario?
Un diccionario define el significado de las palabras y su ortografía, mientras que un tesauro organiza los conceptos y muestra cómo se relacionan entre sí (por ejemplo, qué es más general, qué es más específico o qué es similar). El diccionario responde "¿qué significa?", el tesauro responde "¿cómo se relaciona con otros conceptos?".
¿Qué significan las siglas HT y BT en un tesauro?
Estas siglas provienen del inglés y describen relaciones jerárquicas. HT significa "Hierarchical Term" o Término Genérico (el padre), y BT significa "Broader Term" o Término Específico (el hijo). Por ejemplo, "Vehículo" es el HT de "Automóvil", y "Automóvil" es el BT de "Sedán".
¿Se utilizan los tesauros solo en bibliotecas?
No. Aunque nacieron en la biblioteconomía, hoy se usan ampliamente en informática (para mejorar el SEO y la búsqueda web), en gestión empresarial (para organizar documentos internos), en museografía (para catalogar obras de arte) y en inteligencia artificial (para ayudar a las máquinas a entender el contexto).
¿Puede un término tener más de un sinónimo en un tesauro?
Sí. Un tesauro suele tener un término preferido (el que se usa para indexar) y varios términos alternativos o sinónimos. Por ejemplo, el término preferido podría ser "Ordenador", con los sinónimos "Computadora" y "PC" asociados a él para capturar todas las variantes del lenguaje.
¿Cómo se crea un tesauro desde cero?
Se inicia recopilando todas las palabras clave relevantes de un conjunto de documentos, se eliminan duplicados, se agrupan por significado (sinónimos) y luego se organizan en jerarquías (de lo general a lo específico) y asociaciones (relaciones laterales). Requiere revisión constante para mantener su precisión.
Resumen
Los tesauros son sistemas de organización del conocimiento que estructuran términos mediante relaciones jerárquicas (genérico-específico) y asociativas (sinónimos y afines). Su implementación mejora significativamente la precisión y el alcance de las búsquedas de información al reducir la ambigüedad del lenguaje natural.
Desde su origen en la biblioteconomía hasta su aplicación actual en ciencia de datos y gestión documental, los tesauros siguen siendo esenciales para la interoperabilidad de la información. Dominar su estructura permite a investigadores y profesionales recuperar datos de manera más eficiente y crear bases de datos más inteligentes.
Referencias
- «Tesauros en la investigación científica» en Wikipedia en español
- What is a Thesaurus? - Library of Congress
- ISO 25964:2011 - Information and documentation — Thesauri and interoperability with other vocabularies
- The Role of Thesauri in Scientific Information Retrieval - PubMed
- Controlled Vocabularies and Thesauri in Research - Nature Scitable