Muchas cosas deben haberte aturdido, pero la ley de Zipf es un paso más arriba. La ley establece que si elige cualquier texto, la frecuencia de cualquier palabra es inversamente proporcional a su rango en la tabla de frecuencias. Entonces, la frecuencia de la palabra más alta será el doble que la de la segunda palabra más alta. Algo como esto:
La misma ley forma una lÃnea recta cuando se traza en la escala logarÃtmica:
En cualquier texto en inglés, las palabras más frecuentes son, el, y, de, ser, a, en, yo, y ese. Hay muchas otras palabras en el texto que no aparecen con tanta frecuencia. Vincular todo esto en la tabla de frecuencias demuestra la curva de la ley de Zipf. Según un estudio fascinante en Oxford, estas palabras representan el 25% de todo el texto.
De todo lo que hablamos, la palabra ‘the’ constituye casi el 6% y es la palabra más frecuente. En el segundo lugar de la escala de frecuencia, viene ‘de’, que es precisamente el 3% de todo lo que decimos. La relación se mantiene y la palabra que ocupa el tercer lugar en la tabla de frecuencias forma aproximadamente el 1.5% de nuestra conversación.
Italki demostró la ley de Zipf utilizando 140 de sus artÃculos de aprendizaje de inglés. Recopilando los 140 artÃculos en un documento grande, seleccionaron las 20 palabras más frecuentes para hacer predicciones de acuerdo con la ley de Zipf. El siguiente gráfico muestra cuán diferentes son la realidad y las predicciones.
Mente alucinante, ¿verdad? Puedes usar este mismo artÃculo y obtener un programa para trazar la curva de Zipf por usted, y obtendrá el mismo resultado.
La ley de Zipf no solo predice la aparición de palabras en un texto o una conversación, sino que también predice otras cosas como la tasa a la que las megaciudades están creciendo en su población. La ley se aplica a animales, naciones, planetas, montañas e incluso al contenido de azúcar de varias galletas.
¿Le gustarÃa trazar la curva de Zipf usted mismo? ¡Comenta abajo!