martes, 9 de junio de 2015

Si no tienes un blog, no eres nadie


Está de actualidad la frase "si no tienes un blog, no eres nadie".

Hoy en día cualquier persona con un poco de habilidad puede entrar en una plataforma y crear, uno, dos, tres.... la cantidad de blogs que se quiera, de una manera gratuita y con unas nociones básicas.

Hace apenas unos cinco años, en España habia un centenar de blogs, hoy en día según el National Institute for Technology and LiberalEducation (NITLE) ha puesto en marcha el Blog Census que se encarga de censar el número de blogs activos que existen y en sus respectivos idiomas. Calcula que existen en el mundo 2.869.632 bitácoras debidamente validadas, de las cuales 80.509 (2,8%) estarían en Español.

Los blogs son el área de internet que más está creciendo actualmente, especialmente como herramienta educativa y en el marketing. Según los datos que aporta el profesor Julio Cabero citando a Villa, en su libro "Diseño y producción de  TIC para la formación", afirma que el 31% de los estadounidenses que tienen weblog publican varios post semanales, los iraníes se encuentran entre los más activos del blogging, y los catalanes vencen a los japoneses en número de weblogs.

Otro dato curioso elaborado por algunos estadistas aseguran, que en España  las mujeres sólo suponen el 30% de los blogueros, respecto a los 46 % de Estados Unidos, pero a la larga son más constantes actualizando su contenido.
Yo por si acaso ya he creado el mío  ......................     

ANÁLISIS LEXICOMÉTRICO

Para el proyecto de análisis lexicométrico he elegido  un tema de actualidad de temática deportiva o ¿quizás socio-política? El tema en cuestión trata de la pitada o  xiulada acontecida el pasado  día  30 de mayo en la final de la Copa del Rey entre el Atlético de Bilbao y el Fútbol Club Barcelona.
Para ello he buscado blogs deportivos y noticias, indiferentemente en castellano o en catalán, con el objetivo de comparar la particular visión y la publicación de la noticia que cada uno recoge más afín a su ideología. Para realizar el análisis  he considerado oportuno transcribir el titular de cada post, con el fin de entender la intención de cada noticia.
BLOGCS ANALIZADOS  y sus TITULARES
 



Vergonzosa pitada al himno

 


Culés, leones y una fotografía controvertida


Xiulada massiva a l'himne espanyol abans de la final de la Copa del Rei


El tribunal consideró que los silbidos "no propugnan el odio" ni el "ultraje a la nación", tras una protesta en una final de Copa Athletic-Barça en Valencia en 2009 similar a la del sábado en el Camp Nou.


CATALUNYA ACCIÓ ANIMA A UNA GRAN XIULADA A FAVOR DE LA DECLARACIÓ D’INDEPENDÈNCIA DE CATALUNYA (DUI) DURANT LA FINAL DE LA COPA DEL REI ESPANYOL


Tebas, a favor de suspender la final de Copa si se pita al himno o al Rey

 


Per una gran xiulada a la Copa del Borbó


Insulto a España

 


Aguirre pide suspender la final de Copa del Rey ante la pitada al himno

 


Fernández Díaz: "La pitada fue una incitación al odio que no debe quedar impune


Ada Colau, a favor de la xiulada a l'himne espanyol

 


Repartirán 15.000 silbatos para pitar el himno

 

PROCEDIMIENTO


a) He buscado noticias con la extensión del texto lo más parecida posible y primeramente he generado una tabla en "sucio" con la herramienta Word list para valorar la riqueza léxica de cada post.


 

 

Word types

Word tokens

Ratio

 

Word types

Word tokens

Ratio


188

378

0,49


343

772

0,44


296

662

0,44


309

772

0,40


75

133

0,56


207

444

0,46


178

346

0,51


211

475

0,44


150

340

0,44


114

184

0,61


94

167

0,56


132

295

0,44

Seguidamente he aplicado la fórmula (types/tokens) que sirve para determinar la cantidad de palabras repetidas que hay en cada texto. Cuanto más se acerca el valor extraído al 1, su riqueza léxica será mayor.
b) Para desarrollar el análisis del corpus, he calculado la frecuencia utilizando de nuevo la herramienta  Word list en cada uno de los post. Con la herramienta Tool preferences he añadido una lista de exclusión (que he generado yo misma con el bloc de notas) con las palabras denominadas "ruido" o " cuyo significado no nos dicen nada (de, que, la, y, el .....).
 
 
Word types
Word tokens
 
Word types
Word tokens
60
217
42
309
 
84
392
87
455
 
19
57
81
282
 
50
193
77
283
 
27
138
26
78
 
47
114
46
173
 
Nota: Comparamos con la tabla anterior "sucia" el resultado de los types y tokens, una vez añadida la lista de exclusión.
c) El siguiente paso ha sido escoger una serie de palabras que me parecen significativas para este análisis. Las he agrupado por su significado léxico, y las he extraído con la herramienta Concordance, aplicando  la función Treat all data lowercase (Tool preferences / Keiword list) con el fin de que AntConc no haga distinción entre  mayúsculas y  minúsculas.
 
 Independència / independenciagood bye spain /
 
 
secesionistas / separatistas
 

 
 
La misma función pero de una manera gráfica de la palabra himno, himne:

 
d) Después de extraer la lista de concordance, me he dado cuenta de que no me reconocía algunas de las palabras y me las cambiaba por signos. He ido a Global Settings y he cambiado el lenguaje en current encondin. El que venía por defecto era (UNICODE UTF-8) y he escogido  Central Europe, y se ha solucionado:
 
Libertad,
 
 Con UNICODE UTF-8
 
Con Central Europe
 Pitada, xiulada, xiular, xiulet,


 
e) Me ha dado cuenta de la existencia de variaciones morfológicas de una misma raíz, y para no tener que ir buscando la Concordance de cada palabra,  he decidido crear una lista (que también la he creado con el bloc de notas)* de "lematización" (Tool preferences /lema list) y he vuelto a generar las frecuencias:
 
* La lista de lematización, se genera de la siguiente manera:
     libertad->llibertat,libres,lliures
xiulin->xiulada,xiulet,xiulades,xiular
y así sucesivamente...
 
f) De esta forma he podido agrupar las palabras más rápidamente en todas sus formas flexionadas:




Cataluña, Catalunya
24
Constitución
6
contra
18
delito
6
derecho, dret
8
Espanya,  España, españoles
44
expressió expresión
4
himno, himne
47
libertad, llibertat
6
imponer
4
pitos, xiulets, pitades
23
querella
2
Nacional, nació, nación,nacionalistas
26
violencia
5
calumniosos, injuriosos, difamatorios, sometidos, anticatalanistas, antideportivos. etc.
1

 
 
 
 
 
 





CONCLUSIONES:
 He empezado el procedimiento comparando la riqueza léxica  con la herramienta type-token-ration para determinar la cantidad de palabras diferentes que forma cada texto independientemente uno de otro.
Teniendo en cuenta el tamaño del texto he  comparado el blog de “josepmariavall” (0,44) y el de  “la razón” (0,40). El primero tiene más riqueza léxica que el segundo, es decir el primero estarla formado por más cantidad de palabras diferentes y con poca repetición.
He constatado que la  palabra independencia  y sus variaciones  morfológicas, sólo se utiliza dentro de los siguientes blogs:


Igualmente la palabra separatista, sólo las utilizan estos blogs:
 

 
Hay palabras comunes a todos los blogs, pero cada uno la utiliza dentro de su propio contexto, como por ejemplo la palabra contra:
 
 
 
Desde una posición objetiva en los blogs analizados, se aprecia una fuerte evidencia del eje nacionalismo catalán Vs nacionalismo español. He encontrado diferencias significativas en los vocabularios que utilizan y como cada uno recurre a unas palabras determinadas para dar un significado particular de su posición.
Así, los blogs como Ara, Catalunya acció, josepmariavall, negocios, naciodigital, de tendencia nacionalista catalana,  encontramos una coincidencia en el uso de las siguientes palabras:
Independencia, libertad de expresión, imponer, sometidos, opresor…….
Mientras que encontramos estas otras palabras significativas en los blogs de abc, el mundo, la razón,  antonioaramayona, libertad digital, que evidencian la tendencia nacionalista española:
Separatistas, secesionistas, España, bandera, Constitución, nacional…....
Curiosamente de todos los post, el más hipertextual ha sido el abc, lo que me ha permitido moverme entre los hipervínculos y ampliar la noticia. También se puede apreciar que entre los textos de nacionalismo catalán Vs nacionalismo español, no hay apenas coincidencias entre ellos.
 La herramientas del programa Antcont me han servido para realizar un estudio en profundidad de un texto, he evaluado su contenido léxico, he buscado las concordancias de cada palabra con el fin de comparar el carácter ideológico,  y he extraído los patrones relevantes de cada uno de los post analizados. En definitiva, me ha permitido analizar el uso que hacen las noticias con las palabras claves, con el de provocar una reacción específica en el lector.