En este artículo se va a utilizar la programación del clásico juego de adivinación de un número, para repasar conceptos básicos de programación en el lenguaje m de MATLAB y Octave.
El programa seleccionará un número entero aleatorio entre 0 y 100 y pedirá al usuario que lo adivine. En cada intento, el programa informará al usuario si el número que ha tecleado es demasiado alto o demasiado bajo respecto al elegido por el ordenador. Cuando el usuario acierte el número, el ordenador le informará de ello.
El programa es relativamente sencillo, pero permite afianzar los conocimientos acerca de:
- Generación de números aleatorios
- Entrada de datos por teclado
- Validación de las entradas de datos
- Asignación de variables
- Bucles while
- Sentencias break y continue
- Bifurcaciones if
- Salidas simples por pantalla
A continuación se muestra el listado de la primera versión del programa. Se analizará cada apartado y, posteriormente, se indicará cómo mejorar algunos aspectos del programa:
En esta versión del programa, en primer lugar se hace un clear, para borrar la memoria, y a continuación se genera un número entero aleatorio en el intervalo cerrado [1, 100]. La figura siguiente resume las dos fórmulas usuales para generar números aleatorios: la primera genera un número decimal aleatorio en el intervalo abierto (A, B). La segunda fórmula genera un número entero aleatorio en el intervalo cerrado [A, B]:
El programa sigue con un bucle while de los denominados infinitos: al hacer while 1, el bucle se ejecutará de manera indefinida hasta que encuentre una sentencia break, que fuerce la salida del bucle.
Dentro del bucle, en cada iteración, el programa solicita un número al usuario mediante una sentencia input(), y se lo asigna a la variable x. A continuación se utiliza una bifurcación del tipo if…elseif…else…end para determinar la respuesta del programa al usuario. Si el número tecleado por el usuario no es el correcto, se le informa si es demasiado alto o demasiado bajo. Si el usuario acierta, se le informa de ello, y se sale del bucle con la sentencia break, alcanzando el final del programa.
El lector debe observar que, para informar de número alto o bajo, es suficiente utilizar una sentencia disp(), mostrando en pantalla una cadena de caracteres. En cambio, para informar del acierto, como se quiere utilizar una cadena de caracteres junto con el valor de la variable n, se utiliza la sentencia fprintf().
El programa funciona, como puede comprobar el lector. Pero, ¿qué pasa si el usuario no teclea un número cuando se le solicita, y se limita a pulsar la tecla INTRO? El lector puede comprobar que, en ese caso, el programa da el resultado como correcto e informa de que se ha acertado, mostrando además el número correcto.
¿Por qué pasa esto? Si se analiza en detalle la sentencia if, se puede comprobar que si el número no es mayor ni es menor que el elegido por el ordenador, la respuesta se da por buena. En este caso, al no teclear ningún número, la variable x está vacía, y no es mayor ni menor que el resultado, con lo que se sale del bucle por la rama else.
Este tipo de circunstancias es habitual en los programas, por lo que siempre que hay una entrada de datos a un programa es muy importante hacer la comprobación de que la entrada de datos ha sido correcta.
Para comprobar si el usuario ha dejado la respuesta vacía, se puede utilizar la función isempty(), que devuelve un 1 (verdadero), si la variable está vacía. Con esto, se podría forzar al programa a repetir el input(), si la variable respuesta está vacía:
Si el usuario deja la variable x vacía, la sentencia continue fuerza que se vuelva al inicio del bucle while, iniciando otra iteración, y volviendo a ejecutar la sentencia input(). El lector puede corregir el programa y comprobar que se resuelve el problema de respuesta vacía.
La respuesta vacía no es la única respuesta incorrecta. El usuario, por error o por malicia, podría teclear un número que no fuera entero, por ejemplo un número decimal. Para detectar esta circunstancia se puede utilizar la función fix(), que devuelve la parte entera de un número decimal. Si la expresión fix(x) no es igual a x, entonces el valor tecleado no es entero. En ese caso, se puede hacer como antes, y forzar el reinicio del bucle. El código corregido quedaría así:
Se podría forzar al usuario a teclear un número no menor que 1 ni mayor que 100, aunque en este caso no se ha considerado que sea importante.
¿Y qué sucede si el usuario teclea una cadena de caracteres, en vez de teclear un número? En ese caso, Octave o MATLAB interpretarán la cadena de caracteres como el nombre de una variable o como una instrucción válida. Si el nombre de variable es correcto, por ejemplo, si se responde ‘PI‘, el programa interpretará la respuesta como un número decimal y actuará en consecuencia, volviendo a pedir el valor x. También se podría teclear una operación válida, por ejemplo, 20+10. En ese caso, se ejecutará la operación y se asignará el resultado a la variable x. Si se teclea una cadena que no se corresponda con un nombre de variable existente, o una instrucción válida, el programa fallará.
Una manera de gestionar esto es leer el dato del usuario como si fuera una cadena de caracteres, y luego convertirlo en número, de la siguiente forma:
Observe el lector que se añade un segundo parámetro ‘s‘ al input(), para forzar la lectura como cadena de caracteres, y luego se convierte dicha cadena en numero mediante la función str2num(). De esta forma, si la cadena no da lugar a un número, la variable x quedará vacía y se volverá a pedir el valor.
El problema puede ser si se teclea un comando válido. De hecho, en las entradas de datos, suelen estar algunos de los agujeros de seguridad más importantes que suelen aprovechar los hackers. Como muestra,el lector puede probar a teclear como respuesta clear, o surf(peaks), o, en plan hacker, pruebe a teclear exit(). Estas tres respuestas son relativamente inocuas, pero si nuestro programa se llama, por ejemplo, adivina1.m y respondemos con delete(‘adivina1.m’), el programa se borrará del directorio y perderemos todo el trabajo. Si el lector quiere probarlo, es conveniente hacer primero una copia del programa con otro nombre, para no perder el trabajo. Se podrían hacer cosas mucho más graves que simplemente borrar un fichero. Estas respuestas en forma de instrucciones a ejecutar por el software se conocen como ‘code injection‘, y es un bug realmente peligroso. El lector puede consultar el artículo al respecto de la Wikipedia:
https://en.wikipedia.org/wiki/Code_injectionLa función str2num() evalua la expresión entrecomillada, antes de asignarla a la variable x. Si la expresión tecleada es maliciosa, se produce el problema. Se puede utilizar la función str2double(), que no evalua la expresión tecleada, y es por tanto segura frente al problema del code injection, aunque también nos impide teclear expresiones válidas. El código sería el siguiente:
Si el lector ha llegado hasta aquí, habrá podido comprobar que la codificación de programas aparentemente simples admite muchos matices. También será consciente de lo importante que es el checking de las entradas de datos en todos los programas.
Dada la fecha en la que va a aparecer publicado este artículo, no puedo por menos que desear feliz navidad a todos los lectores.
Nota: Estos problemas de code injection en sentencias de asignación directa o con str2num(), están parcialmente filtrados en MATLAB. No así en Octave. En cualquier caso, se puede probar a responder en MATLAB system(‘del adivina1.m’), que en Windows borrará el fichero en cuestión. A través de la instrucción system() que ejecuta directamente órdenes del sistema operativo se pueden introducir todo tipo de códigos maliciosos.
(Santiago Higuera. 23 diciembre 2020)