Para el proyecto
de análisis lexicométrico he elegido un
tema de actualidad de temática deportiva o ¿quizás socio-política? El tema en
cuestión trata de la pitada o xiulada
acontecida el pasado día 30 de mayo en la final de la Copa del Rey entre
el Atlético de Bilbao y el Fútbol Club Barcelona.
Para ello he
buscado blogs deportivos y noticias, indiferentemente en castellano o en
catalán, con el objetivo de comparar la particular visión y la publicación de
la noticia que cada uno recoge más afín a su ideología. Para realizar el
análisis he considerado oportuno transcribir el titular de cada post,
con el fin de entender la intención de cada noticia.
BLOGCS ANALIZADOS y sus TITULARES
|
Vergonzosa pitada al himno
|
|
Culés, leones y una fotografía
controvertida
|
|
Xiulada massiva a l'himne espanyol
abans de la final de la Copa del Rei
|
|
El tribunal consideró que los
silbidos "no propugnan el odio" ni el "ultraje a la
nación", tras una protesta en una final de Copa Athletic-Barça en Valencia
en 2009 similar a la del sábado en el Camp Nou.
|
|
CATALUNYA
ACCIÓ ANIMA A UNA GRAN XIULADA A FAVOR DE LA DECLARACIÓ D’INDEPENDÈNCIA DE
CATALUNYA (DUI) DURANT LA FINAL DE LA COPA DEL REI ESPANYOL
|
|
Tebas, a favor de suspender la
final de Copa si se pita al himno o al Rey
|
|
Per una gran
xiulada a la Copa del Borbó
|
|
Insulto a España
|
|
Aguirre pide suspender la final de
Copa del Rey ante la pitada al himno
|
|
Fernández Díaz: "La pitada fue
una incitación al odio que no debe quedar impune
|
|
Ada Colau, a favor de la xiulada a
l'himne espanyol
|
|
Repartirán
15.000 silbatos para pitar el himno
|
PROCEDIMIENTO
a) He buscado noticias con la extensión del texto lo más
parecida posible y primeramente he generado una tabla en "sucio" con
la herramienta Word list para valorar
la riqueza léxica de cada post.
|
Word types
|
Word tokens
|
Ratio
|
|
Word types
|
Word tokens
|
Ratio
|
|
188
|
378
|
0,49
|
|
343
|
772
|
0,44
|
|
296
|
662
|
0,44
|
|
309
|
772
|
0,40
|
|
75
|
133
|
0,56
|
|
207
|
444
|
0,46
|
|
178
|
346
|
0,51
|
|
211
|
475
|
0,44
|
|
150
|
340
|
0,44
|
|
114
|
184
|
0,61
|
|
94
|
167
|
0,56
|
|
132
|
295
|
0,44
|
Seguidamente he aplicado la fórmula (types/tokens) que sirve para determinar la cantidad de palabras
repetidas que hay en cada texto. Cuanto más se acerca el valor extraído al 1,
su riqueza léxica será mayor.
b) Para desarrollar el análisis del corpus, he calculado
la frecuencia utilizando de nuevo la herramienta Word
list en cada uno de los post. Con la herramienta Tool preferences he añadido una lista de exclusión (que he generado
yo misma con el bloc de notas) con las palabras denominadas "ruido" o
" cuyo significado no nos dicen nada (de, que, la, y, el .....).
Word types
|
Word tokens
|
Word types
|
Word tokens
|
|||
60
|
217
|
42
|
309
|
|||
84
|
392
|
87
|
455
|
|||
19
|
57
|
81
|
282
|
|||
50
|
193
|
77
|
283
|
|||
27
|
138
|
26
|
78
|
|||
47
|
114
|
46
|
173
|
Nota: Comparamos con la tabla anterior "sucia"
el resultado de los types y tokens, una vez añadida la lista de exclusión.
c) El siguiente
paso ha sido escoger una serie de palabras que me parecen significativas
para este análisis. Las he agrupado por su significado léxico, y las he
extraído con la herramienta Concordance, aplicando la función Treat
all data lowercase (Tool preferences / Keiword list) con el fin de
que AntConc no haga distinción entre mayúsculas y minúsculas.
Independència /
independenciagood bye spain /
secesionistas / separatistas
La misma función pero de una manera gráfica de la palabra
himno, himne:
d) Después de extraer la lista de concordance, me he dado cuenta de que no me reconocía algunas de
las palabras y me las cambiaba por signos. He ido a Global Settings y he cambiado el lenguaje en current encondin. El que venía por defecto era (UNICODE UTF-8) y he
escogido Central Europe, y se ha solucionado:
Libertad,
Con UNICODE
UTF-8
Con Central Europe
Pitada, xiulada,
xiular, xiulet,
e) Me
ha dado cuenta de la existencia de variaciones morfológicas de una misma raíz,
y para no tener que ir buscando la Concordance de cada palabra, he
decidido crear una lista (que también la he creado con el bloc de notas)*
de "lematización" (Tool preferences /lema list) y he
vuelto a generar las frecuencias:
* La
lista de lematización, se genera de la siguiente manera:
libertad->llibertat,libres,lliures
xiulin->xiulada,xiulet,xiulades,xiular
y así sucesivamente...
f) De esta forma he podido agrupar las palabras
más rápidamente en todas sus formas flexionadas:
Cataluña, Catalunya
|
24
|
Constitución
|
6
|
contra
|
18
|
delito
|
6
|
derecho, dret
|
8
|
Espanya, España, españoles
|
44
|
expressió expresión
|
4
|
himno, himne
|
47
|
libertad, llibertat
|
6
|
imponer
|
4
|
pitos, xiulets, pitades
|
23
|
querella
|
2
|
Nacional, nació, nación,nacionalistas
|
26
|
violencia
|
5
|
calumniosos, injuriosos, difamatorios, sometidos, anticatalanistas,
antideportivos. etc.
|
1
|
CONCLUSIONES:
He empezado el procedimiento comparando la
riqueza léxica con la herramienta type-token-ration para
determinar la cantidad de palabras diferentes que forma cada texto
independientemente uno de otro.
Teniendo en cuenta el tamaño del texto he comparado
el blog de “josepmariavall” (0,44) y el de “la razón”
(0,40). El primero tiene más riqueza léxica que el segundo, es decir el primero
estarla formado por más cantidad de palabras diferentes y con poca repetición.
He constatado que la palabra independencia
y sus variaciones morfológicas, sólo se utiliza dentro de los
siguientes blogs:
Igualmente la palabra separatista, sólo las utilizan
estos blogs:
Hay palabras comunes a todos los blogs, pero cada uno la utiliza dentro de su propio contexto, como por ejemplo la palabra contra:
Desde una posición objetiva en los blogs analizados, se
aprecia una fuerte evidencia del eje nacionalismo catalán Vs nacionalismo español. He encontrado diferencias significativas
en los vocabularios que utilizan y como cada uno recurre a unas palabras
determinadas para dar un significado particular de su posición.
Así, los blogs como Ara,
Catalunya acció, josepmariavall, negocios, naciodigital, de tendencia
nacionalista catalana, encontramos una
coincidencia en el uso de las siguientes palabras:
Independencia, libertad de expresión, imponer, sometidos,
opresor…….
Mientras que encontramos estas otras palabras significativas
en los blogs de abc, el mundo, la razón, antonioaramayona, libertad digital, que
evidencian la tendencia nacionalista española:
Separatistas, secesionistas, España, bandera, Constitución,
nacional…....
Curiosamente de todos los post, el más hipertextual ha
sido el abc, lo que me ha permitido
moverme entre los hipervínculos y ampliar la noticia. También se puede apreciar que entre los textos de nacionalismo catalán Vs nacionalismo español, no hay apenas coincidencias entre ellos.
La herramientas
del programa Antcont me han servido para realizar un estudio en profundidad de
un texto, he evaluado su contenido léxico, he buscado las concordancias de cada palabra con el fin de comparar el carácter
ideológico, y he extraído los patrones
relevantes de cada uno de los post analizados. En definitiva, me ha permitido
analizar el uso que hacen las noticias con las palabras claves, con el de provocar
una reacción específica en el lector.
No hay comentarios:
Publicar un comentario