Rodríguez Díaz, Carlos Alberto (2018) Dialectonos: búsqueda de fronteras dialectrales estadísticamente significativas usando corpus léxicos geolocalizados. Masters thesis, Instituto Caro y Cuervo.
2018-3230740.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.
Download (46MB)
Abstract
Esta tesis presenta un método dialectométrico inspirado en el concepto ecológico "ecotono": zona de tensión/cambio entre ecosistemas. Utiliza corpus léxicos geolocalizados para detectar y cartografiar zonas de tensión dialectal (dialectonos). Pretende solucionar la dependencia a parámetros variables de los métodos dialectométricos tradicionales, señalada en 2007 por Nerbonne y Kleiweg en el artículo Toward a dialectological yardstick, en Journal of Quantitative Linguistics.
En lugar de utilizar alternancias predefinidas, como se hace tradicionalmente en dialectometría, utilizamos el Criterio de independencia de Hilbert-Schmidt (HSIC) para seleccionar características lingüísticas geográficamente relevantes directamente en el corpus. El listado de características así obtenido es comparado entre pares de localidades mediante la Prueba de Rangos con Signo de Wilcoxon (WSRT) para medir su divergencia. Los valores de correlación de ranking de WSRT son representados en un mapa relacionándolos al grosor de la línea que divide cada pareja de localidades (llamamos glosotono a esa línea). Como ni HSIC ni WSRT requieren parámetros, el método es no paramétrico. Ambas pruebas reportan la significancia estadística de los resultados.
En este trabajo aplicamos el método propuesto a un corpus de Twitter compuesto por más de 20 millones de tweets geolocalizados de 237 localidades de Colombia, producidos entre los años 2009 y 2016. Como resultados se ofrecen: un mapa de glosotonos de Colombia y un listado de correlaciones de ranking correspondientes a cada pareja de localidades adyacentes.
Este trabajo aporta el primer método dialectométrico basado en corpus que compara a nivel léxico dos localizaciones mediante dos pruebas estadísticas no paramétricas.
Item Type: | Thesis (Masters) |
---|---|
Additional Information: | Tesis laureada |
Uncontrolled Keywords: | Dialectología ; Dialectometría basada en corpus ; Métodos no paramétricos ; Criterio de independencia de Hilbert-Smith ; Prueba de rangos con signos Wilcoxon ; Ecotonos |
Subjects: | 400 Lenguas > 410 Ligüística |
Divisions: | Facultad Seminario Andrés Bello > Maestría en Lingüistica |
Depositing User: | Clara Inés Culma Estévez |
Date Deposited: | 02 Sep 2022 18:14 |
Last Modified: | 02 Sep 2022 18:14 |
URI: | https://bibliotecadigital.caroycuervo.gov.co/id/eprint/1757 |