CIBERCULTURA : ANÁLISIS LEXICOMÉTRICO

Para el proyecto de análisis lexicométrico he elegido un tema de actualidad de temática deportiva o ¿quizás socio-política? El tema en cuestión trata de la pitada o xiulada acontecida el pasado día 30 de mayo en la final de la Copa del Rey entre el Atlético de Bilbao y el Fútbol Club Barcelona.

Para ello he buscado blogs deportivos y noticias, indiferentemente en castellano o en catalán, con el objetivo de comparar la particular visión y la publicación de la noticia que cada uno recoge más afín a su ideología. Para realizar el análisis he considerado oportuno transcribir el titular de cada post, con el fin de entender la intención de cada noticia.

BLOGCS ANALIZADOS y sus TITULARES

Abc	Vergonzosa pitada al himno
Antonioaramayona	Culés, leones y una fotografía controvertida
Ara	Xiulada massiva a l'himne espanyol abans de la final de la Copa del Rei
Athletic correo	El tribunal consideró que los silbidos "no propugnan el odio" ni el "ultraje a la nación", tras una protesta en una final de Copa Athletic-Barça en Valencia en 2009 similar a la del sábado en el Camp Nou.
Catalunya Acció	CATALUNYA ACCIÓ ANIMA A UNA GRAN XIULADA A FAVOR DE LA DECLARACIÓ D’INDEPENDÈNCIA DE CATALUNYA (DUI) DURANT LA FINAL DE LA COPA DEL REI ESPANYOL
El mundo	Tebas, a favor de suspender la final de Copa si se pita al himno o al Rey
josepmariavall	Per una gran xiulada a la Copa del Borbó
La Razón	Insulto a España
Libertad digital	Aguirre pide suspender la final de Copa del Rey ante la pitada al himno
Marca	Fernández Díaz: "La pitada fue una incitación al odio que no debe quedar impune
Naciodigital	Ada Colau, a favor de la xiulada a l'himne espanyol
Negocios	Repartirán 15.000 silbatos para pitar el himno

PROCEDIMIENTO

a) He buscado noticias con la extensión del texto lo más parecida posible y primeramente he generado una tabla en "sucio" con la herramienta Word list para valorar la riqueza léxica de cada post.

	Word types	Word tokens	Ratio		Word types	Word tokens	Ratio
Abc	188	378	0,49	josepmariavall	343	772	0,44
Antonioaramayona	296	662	0,44	La Razón	309	772	0,40
Ara	75	133	0,56	Libertad digital	207	444	0,46
Athletic correo	178	346	0,51	Marca	211	475	0,44
Catalunya Acció	150	340	0,44	Naciodigital	114	184	0,61
El mundo	94	167	0,56	Negocios	132	295	0,44

Seguidamente he aplicado la fórmula (types/tokens) que sirve para determinar la cantidad de palabras repetidas que hay en cada texto. Cuanto más se acerca el valor extraído al 1, su riqueza léxica será mayor.

b) Para desarrollar el análisis del corpus, he calculado la frecuencia utilizando de nuevo la herramienta Word list en cada uno de los post. Con la herramienta Tool preferences he añadido una lista de exclusión (que he generado yo misma con el bloc de notas) con las palabras denominadas "ruido" o " cuyo significado no nos dicen nada (de, que, la, y, el .....).

	Word types	Word tokens		Word types	Word tokens
Abc	60	217	josepmariavall	42	309
Antonioaramayona	84	392	La Razón	87	455
Ara	19	57	Libertad digital	81	282
Athletic correo	50	193	Marca	77	283
Catalunya Acció	27	138	Naciodigital	26	78
El mundo	47	114	Negocios	46	173

Nota: Comparamos con la tabla anterior "sucia" el resultado de los types y tokens, una vez añadida la lista de exclusión.

c) El siguiente paso ha sido escoger una serie de palabras que me parecen significativas para este análisis. Las he agrupado por su significado léxico, y las he extraído con la herramienta Concordance, aplicando la función Treat all data lowercase (Tool preferences / Keiword list) con el fin de que AntConc no haga distinción entre mayúsculas y minúsculas.

Independència / independenciagood bye spain /

secesionistas / separatistas

La misma función pero de una manera gráfica de la palabra himno, himne:

d) Después de extraer la lista de concordance, me he dado cuenta de que no me reconocía algunas de las palabras y me las cambiaba por signos. He ido a Global Settings y he cambiado el lenguaje en current encondin. El que venía por defecto era (UNICODE UTF-8) y he escogido Central Europe, y se ha solucionado:

Libertad,

Con UNICODE UTF-8

Con Central Europe

Pitada, xiulada, xiular, xiulet,

e) Me ha dado cuenta de la existencia de variaciones morfológicas de una misma raíz, y para no tener que ir buscando la Concordance de cada palabra, he decidido crear una lista (que también la he creado con el bloc de notas)* de "lematización" (Tool preferences /lema list) y he vuelto a generar las frecuencias:

* La lista de lematización, se genera de la siguiente manera:

libertad->llibertat,libres,lliures

xiulin->xiulada,xiulet,xiulades,xiular

y así sucesivamente...

f) De esta forma he podido agrupar las palabras más rápidamente en todas sus formas flexionadas:

Cataluña, Catalunya	24
Constitución	6
contra	18
delito	6
derecho, dret	8
Espanya, España, españoles	44
expressió expresión	4
himno, himne	47
libertad, llibertat	6
imponer	4
pitos, xiulets, pitades	23
querella	2
Nacional, nació, nación,nacionalistas	26
violencia	5
calumniosos, injuriosos, difamatorios, sometidos, anticatalanistas, antideportivos. etc.	1

CONCLUSIONES:

He empezado el procedimiento comparando la riqueza léxica con la herramienta type-token-ration para determinar la cantidad de palabras diferentes que forma cada texto independientemente uno de otro.

Teniendo en cuenta el tamaño del texto he comparado el blog de “josepmariavall” (0,44) y el de “la razón” (0,40). El primero tiene más riqueza léxica que el segundo, es decir el primero estarla formado por más cantidad de palabras diferentes y con poca repetición.

He constatado que la palabra independencia y sus variaciones morfológicas, sólo se utiliza dentro de los siguientes blogs:

Igualmente la palabra separatista, sólo las utilizan estos blogs:

Hay palabras comunes a todos los blogs, pero cada uno la utiliza dentro de su propio contexto, como por ejemplo la palabra contra:

Desde una posición objetiva en los blogs analizados, se aprecia una fuerte evidencia del eje nacionalismo catalán Vs nacionalismo español. He encontrado diferencias significativas en los vocabularios que utilizan y como cada uno recurre a unas palabras determinadas para dar un significado particular de su posición.

Así, los blogs como Ara, Catalunya acció, josepmariavall, negocios, naciodigital, de tendencia nacionalista catalana, encontramos una coincidencia en el uso de las siguientes palabras:

Independencia, libertad de expresión, imponer, sometidos, opresor…….

Mientras que encontramos estas otras palabras significativas en los blogs de abc, el mundo, la razón, antonioaramayona, libertad digital, que evidencian la tendencia nacionalista española:

Separatistas, secesionistas, España, bandera, Constitución, nacional…....

Curiosamente de todos los post, el más hipertextual ha sido el abc, lo que me ha permitido moverme entre los hipervínculos y ampliar la noticia. También se puede apreciar que entre los textos de nacionalismo catalán Vs nacionalismo español, no hay apenas coincidencias entre ellos.

La herramientas del programa Antcont me han servido para realizar un estudio en profundidad de un texto, he evaluado su contenido léxico, he buscado las concordancias de cada palabra con el fin de comparar el carácter ideológico, y he extraído los patrones relevantes de cada uno de los post analizados. En definitiva, me ha permitido analizar el uso que hacen las noticias con las palabras claves, con el de provocar una reacción específica en el lector.

CIBERCULTURA

martes, 9 de junio de 2015

ANÁLISIS LEXICOMÉTRICO

No hay comentarios:

Publicar un comentario

De todo un poco.....

Archivo del blog

.

Blogs de Compañeros