1 Optimización de consultas

1.1 Índices

Si quisiéramos buscar un valor específico en la columna de una tabla y la columna sobre la que queremos buscar no tuviese un índice, tendríamos que recorrer toda la tabla comparando fila a fila hasta encontrar el valor que coincide con el valor buscado. Para tablas con pocas filas puede que esto no sea un problema, pero imagina las operaciones de comparación que tendría que realizar sobre una tabla con millones de filas.

La mejor forma de optimizar el rendimiento de una consulta es creando índices sobre las columnas que se utilizan en la cláusula WHERE. Los índices se comportan como punteros sobre las filas de la tabla y nos permiten determinar rápidamente cuáles son las filas que cumplen la condición de la cláusula WHERE.

Todos los tipos de datos de MySQL pueden ser indexados, pero tenga en cuenta que no es conveniente crear un índice para cada una de las columnas de una tabla, ya que el exceso de índices innecesarios pueden provocar un incremento del espacio de almacenamiento y un aumento del tiempo para MySQL a la hora de decidir qué índices necesita utilizar. Los índices además añaden una sobrecarga a las operaciones de inserción, actualización y borrado, porque cada índice tiene que ser actualizado después de realizar cada una de estas operaciones.

Debe tratar de buscar un equilibrio entre el número de índices y el tiempo de respuesta de su consulta, de modo que pueda reducir el tiempo de respuesta de su consulta utilizando el menor número de índices posible.

1.1.1 Tipos de índices

Los sistemas gestores de bases de datos utilizan diferentes tipos de índices, algunos de los más utilizados son los siguientes:

Índices de clave primaria. Identifican de forma única una fila dentro de una tabla y no admiten valores nulos.
Índices de clave ajena. Este índice hace referencia a una columna que es clave primaria en otra tabla.
Índices únicos. Garantiza que los valores de una columna son únicos. Son similares a los índices de clave primaria, pero permiten valores nulos.
Índices con valores repetidos. Permiten optimizar búsquedas sobre columnas que contienen valores repetidos.
Índices de múltiples columnas. Utilizan varias columnas en lugar de una sola.
Índices de texto completo. Se utilizan para optimizar las búsquedas en campos de texto.
Índices funcionales. A partir de la versión 8.0.13 de MySQL es posible crear índices sobre el resultado de una expresión o una función.

1.1.2 Índices en MySQL

La mayoría de los índices que se utilizan en MySQL son almacenados en árboles B (B-trees). Los árboles B son unas estructuras de datos que se utilizan para almacenar datos de forma ordenada, y permiten realizar operaciones de búsqueda, inserción y borrado de forma eficiente. Estas estructuras mejoran el rendimiento de las consultas en las bases de datos.

Algunos índices de MySQL que utilizan árboles B son:

PRIMARY KEY
UNIQUE
INDEX
FULLTEXT

Ejemplo de un árbol B (B-tree):

Imagen: Ejemplo de un árbol B. B-tree. Nagae. 2007. Wikipedia.

Los índices que se utilizan sobre datos espaciales se almacenan en Árboles R (R-trees).

SPATIAL

Ejemplo de un árbol R (R-tree):

Imagen: Ejemplo de un árbol R. R-tree. Skinkie. 2010. Wikipedia.

Y por último, las tablas almacenadas en memoria utilizan índices hash.

MEMORY

Ejemplo de índices hash:

Imagen: Ejemplo de índices hash. Emil Drkušić. 2016.

1.1.3 Gestión de índices

1.1.3.1 Crear índices

1.1.3.1.1 `CREATE INDEX`

La sintaxis para crear índices en MySQL es la siguiente:

CREATE [ONLINE|OFFLINE] [UNIQUE|FULLTEXT|SPATIAL] INDEX index_name
    [index_type]
    ON tbl_name (index_col_name,...)
    [index_option] ...

index_col_name:
    col_name [(length)] [ASC | DESC]

index_option:
    KEY_BLOCK_SIZE [=] value
  | index_type
  | WITH PARSER parser_name
  | COMMENT 'string'

index_type:
    USING {BTREE | HASH}

Puede encontrar más información sobre la creación de índices en MySQL en la documentación oficial.

Ejemplo 1: Uso de INDEX

El siguiente ejemplo crea un índice con el nombre idx_pais sobre la columna pais de la tabla cliente.

CREATE INDEX idx_pais ON cliente(pais);

Ejemplo 2: Uso de UNIQUE INDEX

El siguiente ejemplo crea un índice de tipo UNIQUE con el nombre idx_email sobre la columna email de la tabla empleado.

CREATE UNIQUE INDEX idx_email ON empleado(email);

Ejemplo 3: Uso de INDEX con varias columnas

El siguiente ejemplo crea un índice de tipo INDEX con el nombre idx_apellido_nombre compuesto por las columnas apellido_contacto y nombre_contacto de la tabla cliente.

CREATE INDEX idx_apellido_nombre ON cliente(apellido_contacto, nombre_contacto);

Este índice será útil en las consultas donde se realicen búsquedas por el apellido y el nombre del cliente, o solamente por el apellido, pero no será útil en aquellas consultas donde sólo se utilice el nombre, ya que tendría que recorrer toda la tabla para encontrarlo.

Ejemplo 4: Uso de INDEX con el prefijo de una columna

En este ejemplo vamos a crear un índice sobre un prefijo de la columna nombre_cliente de la tabla cliente. La columna nombre_cliente está definida como un VARHCAR(50), pero en este caso vamos a crear un índice de sólo 25 caracteres.

El uso de índices sobre un prefijo de una columna, es útil para reducir el tamaño que ocuparán los índices y optimizar así su almacenamiento, pero para que las búsquedas sobre los índices sigan siendo eficientes, habrá que buscar un tamaño de índice adecuado que nos permita diferenciarlos con el menor número de bytes posibles.

CREATE INDEX idx_nombre_cliente ON cliente(nombre_cliente(25));

Ejemplo 5: Uso de FULLTEXT INDEX

En este ejemplo vamos a crear un índice de tipo FULLTEXT compuesto por las columnas nombre y descripcion de la tabla producto, para poder realizar búsquedas más eficientes sobre esas columnas.

CREATE FULLTEXT INDEX idx_nombre_descripcion ON producto(nombre, descripcion);

Una vez creado el índice ejecutamos la consulta haciendo uso de MATCH y AGAINST.

SELECT *
FROM producto
WHERE MATCH(nombre, descripcion) AGAINST ('acero');

A continuación, se muestra cuál es la sintaxis para realizar una búsqueda con el operador MATCH() AGAINST() sobre un índice de tipo FULLTEXT INDEX:

MATCH (col1,col2,...) AGAINST (expr [search_modifier])

search_modifier:
  {
       IN NATURAL LANGUAGE MODE
     | IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION
     | IN BOOLEAN MODE
     | WITH QUERY EXPANSION
  }

Dependiendo del modificador, podemos utilizar tres tipos de búsqueda sobre los índices de tipo FULLTEXT INDEX:

IN NATURAL LANGUAGE MODE: Esta es la opción que se utiliza por defecto cuando no se indica de forma explícita un tipo de búsqueda. En este modo de búsqueda no se pueden utilizar operadores booleanos. Ejemplo: Si buscamos árbol mediano en primer lugar mostrará todas las filas que contengan ambas palabras y luego mostrará aquellas filas que contengan alguna de las dos palabras.
IN BOOLEAN MODE: Con esta opción podemos utilizar operadores booleanos en la búsqueda. Algunos de los operadores son: - + para indicar que la palabra tiene que aparecer en el resultado. Ejemplo: +árbol +mediano buscará todas las filas que contengan las palabras árbol y mediano. - - para indicar que la palabra no tiene que aparecer en el resultado. Ejemplo: +árbol -mediano buscará todas las filas que contengan la palabra árbol pero no la palabra mediano. - * para indicar que se pueden buscar palabras que empiecen por una determinada cadena de caracteres. Ejemplo: fruta* buscará todas las filas que contengan palabras que empiecen por fruta como frutas, frutales, etc. - " para buscar una frase exacta. Ejemplo: "el limonero" buscará todas las filas que contengan exactamente las palabras "el limonero".
- Puede encontrar más información sobre los operadores en la documentación oficial de MySQL.
WITH QUERY EXPANSION: Esta opción se utiliza para ampliar los resultados de búsqueda mostrando contenidos relacionados.

Ejemplo 6: Creación de índices funcionales

A partir de la versión 8.0.13 de MySQL es posible crear índices sobre el resultado de una expresión o una función.

En este ejemplo vamos a crear un índice al resultado que obtenemos al ejecutar la función YEAR sobre la columna fecha_pago de la tabla pago.

CREATE INDEX idx_year_functional_index ON pago ((YEAR(fecha_pago)));

Puede encontrar más información en la documentación oficial de MySQL.

1.1.3.1.2 `ALTER TABLE`

También es posible crear índices con la sentencia ALTER TABLE. A continuación se muestra una versión reducida de la sintaxis de la sintaxis ALTER TABLE para añadir índices y restricciones a una tabla en MySQL.

ALTER TABLE tbl_name
    [alter_option [, alter_option] ...]

alter_option: {
  | ADD {INDEX | KEY} [index_name]
        [index_type] (key_part,...) [index_option] ...
  | ADD {FULLTEXT | SPATIAL} [INDEX | KEY] [index_name]
        (key_part,...) [index_option] ...
  | ADD [CONSTRAINT [symbol]] PRIMARY KEY
        [index_type] (key_part,...)
        [index_option] ...
  | ADD [CONSTRAINT [symbol]] UNIQUE [INDEX | KEY]
        [index_name] [index_type] (key_part,...)
        [index_option] ...
  | ADD [CONSTRAINT [symbol]] FOREIGN KEY
        [index_name] (col_name,...)
        reference_definition

key_part: {col_name [(length)] | (expr)} [ASC | DESC]

index_type:
    USING {BTREE | HASH}

index_option: {
    KEY_BLOCK_SIZE [=] value
  | index_type
  | WITH PARSER parser_name
  | COMMENT 'string'
  | {VISIBLE | INVISIBLE}
}

Puede encontrar más información sobre la creación de índices en MySQL con la sentencia ALTER TABLE en la documentación oficial.

Ejemplo 1: Uso de INDEX

El siguiente ejemplo crea un índice con el nombre idx_nombre sobre la columna nombre de la tabla cliente.

ALTER TABLE cliente ADD INDEX idx_nombre (nombre);