La prometida Guía 6. Son dos ejercicios. El primero, muy simple, acerca del principio de Landauer. El segundo ejercicio, de índole cabalístico, es mitad un repaso de probabilidad y procesos de Markov, y mitad un ejercicio de análisis estadístico de texto para hacer en la computadora; espero que resulte divertido.
El texto a analizar es Moby Dick. Los archivos necesarios se bajan [aquí]. Ustedes también pueden hacer pruebas con sus propios archivos. En principio, los dos ejercicios son para entregar. Si es necesario, puedo subir algunos ejemplos de funciones en el Mathematica.
Una referencia útil es esta página, que da las frecuencias de grupos de letras (sin incluir el espacio en blanco) en varios idiomas; para hacer comparaciones será necesario que eliminen los espacios en blanco de sus textos.
La Guía es bastante explicativa. Como lecturas complementarias y entretenidas están los dos trabajos de Shannon [1] y [2]. (Al margen de esto, mientras dábamos ayer la clase de práctica se publicaba este artículo [3].) El tema aparece también en el cuento El escarabajo de oro, de Poe, y en varios artículos de Borges (El idioma analítico de John Wilkins, Una vindicación de la Cabala, por citar dos.)
Edit: publicada la Guía, busco en el Google la frase “entropy of Moby Dick”, para encontrar un artículo y una tesis que tratan sobre eso.