Noticias
Nueva suscripción para 2022: Sketch Engine
Herramienta de gestión múltiple de corpus lingüísticos y análisis de texto en 13 idiomas diferentes
Biblioteca/CRAI - 05/04/2022
Sketch Engine es una herramienta online de gestión de corpus y análisis de texto. A partir del 1 de abril los usuarios de la Universidad Pablo de Olavide pueden acceder a esta herramienta a través de a través de Eureka o Biblioteca Digital
Sketch Engine ofrece la posibilidad de utilizar diversos corpus de texto producidos por usuarios reales, conteniendo miles de millones de palabras en 13 idiomas distintos: alemán, árabe, chino, coreano, español, francés, holandés, inglés, italiano, japonés, polaco, portugués y ruso. Pensada para lingüistas, lexicógrafos, expertos en humanidades en general, científicos sociales, investigadores del procesamiento de lenguaje natural, entre otros muchos campos, con el objetivo de analizar cómo se usan las palabras, frases y el idioma en general. Tras seleccionar, en primer lugar, uno o varios corpus de texto con los que trabajar, podemos:
- Buscar locuciones y combinaciones usuales de palabras (Word Sketch: Collocations and word comnbinations): esta función recopila información de miles y millones de ejemplos de uso y proporciona un resumen de una página de colocaciones categorizadas con enlaces a ejemplos. Una mirada a la página le dirá cómo se usa la palabra.
- Buscar diferencias o comparaciones entre locuciones y combinaciones usuales de palabras (Word Sketch Difference: Compare collocations of two words): es una extensión de la Word Sketch. Genera bocetos para dos palabras y las compara, lo que hace que sea muy fácil observar las diferencias en el uso. Es una característica especialmente útil para sinónimos cercanos, antónimos y palabras del mismo campo semántico.
- Buscar sinónimos y palabras similares (Thesaurus: Synonymns and similar words): Ofrece un diccionario de sinónimos que se genera automáticamente mediante algoritmos que analizan corpus de miles de millones de palabras, llegando a generar un diccionario de sinónimos para casi cualquier palabra del idioma (siempre que el corpus sea lo suficientemente grande).
- Construir corpus desde la web: Skecth Engine permite crear automáticamente un corpus específico sobre un tema a nuestra elección, buscando en Internet diversos textos, para luego descargarlos, analizarlos y extraer los términos que lo conformarán.
- Extracción de términos y palabras clave (Keywords: Terminology extraction): En Sketch Engine se definen las palabras clave y los términos como palabras y frases típicas de cierto corpus porque aparecen en el mismo con más frecuencia que en el lenguaje general. Se pueden utilizar para definir o comprender el tema principal del corpus. Sketch Engine combina métodos estadísticos con criterios lingüísticos para extraer palabras clave y términos.
- Buscar ejemplos del uso de palabras o frases en un contexto determinado (Concordance: Examples of use in context): esta función se utiliza para encontrar ejemplos de una palabra, frase, etiqueta o incluso una estructura gramatical o léxica compleja.
- Creación de listas de frecuencia (Wordlist: Frequency word lists): La herramienta Wordlist se utiliza para generar listas de frecuencia de todo tipo: listas de palabras, sustantivos, verbos, etiquetas, palabras que contienen o no ciertos caracteres, etc.
Nota: las funciones Parallel Concordance (Translation search), Trends (Diachronic analysis, neologisms) y Bilingual terms (Bilingual terminology extraction), no están disponibles en la suscripción a la herramienta.
Para más información, pueden contactar a través del correo electrónico alfin@upo.es