La version 9.5 de PostgreSQL sortie en Janvier 2016 propose un nouveau type d’index : les Index BRIN pour Bloc Range INdex. Ces derniers sont recommandés pour les tables volumineuses et corrélées avec leur emplacement. J’ai décidé de consacrer une série d’article sur ces index :

Pour information, je serai présent au PGDay France à Lille le mardi 31 mai pour présenter cet index. Il y aura également plein d’autres conférences intéressantes!

Dans ce troisième article nous verrons pourquoi la corrélation des données avec leur emplacement est importante pour les index BRIN.

Données corrélées

Ces premiers exemples étaient volontairement simples voire simplistes afin de faciliter la compréhension. Les enregistrements avaient une particularité importante : les valeurs étaient croissantes.

Ce qui signifie qu’il y a une forte corrélation entre les enregistrements et leur emplacement.

Pour information, le moteur stocke des statistiques sur les tables afin de choisir le meilleur plan d’exécution. Lançons un ANALYSE sur notre table brin_demo et consultons la vue pg_stats, notamment la colonne « correlation » :

1SELECT tablename,attname,correlation from pg_stats where tablename='brin_demo';
2 tablename | attname | correlation
3-----------+---------+-------------
4 brin_demo | c1 | 1

Essayons avec des données aléatoires :

1CREATE TABLE brin_random (c1 INT);
2INSERT INTO brin_random SELECT trunc(random() * 90 + 1) AS i FROM generate_series(1,100000);
3CREATE INDEX brin_random_brin_idx_16 ON brin_random USING brin (c1) WITH (pages_per_range = 16);
4ANALYZE brin_random;
5SELECT tablename,attname,correlation from pg_stats where tablename='brin_random';
6 tablename | attname | correlation
7-------------+---------+-------------
8 brin_random | c1 | 0.0063248

=> La vue pg_stats nous indique que les données ne sont pas corrélées avec leur emplacement.

Que contient notre index?

 1SELECT * FROM brin_page_items(get_raw_page('brin_random_brin_idx_16', 2), 'brin_random_brin_idx_16');
 2 itemoffset | blknum | attnum | allnulls | hasnulls | placeholder | value
 3------------+--------+--------+----------+----------+-------------+-----------
 4 1 | 0 | 1 | f | f | f | {1 .. 90}
 5 2 | 16 | 1 | f | f | f | {1 .. 90}
 6 3 | 32 | 1 | f | f | f | {1 .. 90}
 7 4 | 48 | 1 | f | f | f | {1 .. 90}
 8 5 | 64 | 1 | f | f | f | {1 .. 90}
 9 6 | 80 | 1 | f | f | f | {1 .. 90}
10 7 | 96 | 1 | f | f | f | {1 .. 90}
11 8 | 112 | 1 | f | f | f | {1 .. 90}
12 9 | 128 | 1 | f | f | f | {1 .. 90}
13 10 | 144 | 1 | f | f | f | {1 .. 90}
14 11 | 160 | 1 | f | f | f | {1 .. 90}
15 12 | 176 | 1 | f | f | f | {1 .. 90}
16 13 | 192 | 1 | f | f | f | {1 .. 90}
17 14 | 208 | 1 | f | f | f | {1 .. 90}
18 15 | 224 | 1 | f | f | f | {1 .. 90}
19 16 | 240 | 1 | f | f | f | {1 .. 90}
20 17 | 256 | 1 | f | f | f | {1 .. 90}
21 18 | 272 | 1 | f | f | f | {1 .. 90}
22 19 | 288 | 1 | f | f | f | {1 .. 90}
23 20 | 304 | 1 | f | f | f | {1 .. 90}
24 21 | 320 | 1 | f | f | f | {1 .. 90}
25 22 | 336 | 1 | f | f | f | {1 .. 90}
26 23 | 352 | 1 | f | f | f | {1 .. 90}
27 24 | 368 | 1 | f | f | f | {1 .. 90}
28 25 | 384 | 1 | f | f | f | {1 .. 90}
29 26 | 400 | 1 | f | f | f | {1 .. 90}
30 27 | 416 | 1 | f | f | f | {1 .. 90}
31 28 | 432 | 1 | f | f | f | {1 .. 90}
32(28 lignes)

L’index nous indique que tous les blocs contiennent des valeurs comprises entre 1 et 90.

Que donne une recherche des valeurs comprises entre 10 et 20?

 1EXPLAIN (ANALYZE,BUFFERS,VERBOSE) SELECT c1 FROM brin_random WHERE c1> 10 AND c1<20;
 2 QUERY PLAN
 3-----------------------------------------------------------------------------------------------------------------------------------------
 4 Bitmap Heap Scan on public.brin_random (cost=118.46..717.27 rows=10387 width=4) (actual time=0.068..10.241 rows=10240 loops=1)
 5 Output: c1
 6 Recheck Cond: ((brin_random.c1 > 10) AND (brin_random.c1 < 20))
 7 Rows Removed by Index Recheck: 89760
 8 Heap Blocks: lossy=443
 9 Buffers: shared hit=445
10 -> Bitmap Index Scan on brin_random_brin_idx_16 (cost=0.00..115.87 rows=10387 width=0) (actual time=0.052..0.052 rows=4480 loops=1)
11 Index Cond: ((brin_random.c1 > 10) AND (brin_random.c1 < 20))
12 Buffers: shared hit=2

=> Le moteur lit l’intégralité de la table ainsi que 2 blocs d’index.

Il est légitime de se demander quel est l’intérêt d’utiliser l’index si on sait que les données ne sont pas corrélées. Et qu’au final le moteur sera contraint de lire toute la table.

Allons faire un tour dans le code source. Plus précisément à la ligne 7568 du fichier src/backend/utils/adt/selfuncs.c :

 1/*
 2 * BRIN indexes are always read in full; use that as startup cost.
 3 *
 4 * XXX maybe only include revmap pages here?
 5 */
 6 *indexStartupCost = spc_seq_page_cost * numPages * loop_count;
 7
 8 /*
 9 * To read a BRIN index there might be a bit of back and forth over
10 * regular pages, as revmap might point to them out of sequential order;
11 * calculate this as reading the whole index in random order.
12 */
13 *indexTotalCost = spc_random_page_cost * numPages * loop_count;
14
15 *indexSelectivity =
16 clauselist_selectivity(root, indexQuals,
17 path->indexinfo->rel->relid,
18 JOIN_INNER, NULL);
19 *indexCorrelation = 1;
20
21 /*
22 * Add on index qual eval costs, much as in genericcostestimate.
23 */
24 qual_arg_cost = other_operands_eval_cost(root, qinfos) +
25 orderby_operands_eval_cost(root, path);
26 qual_op_cost = cpu_operator_cost *
27 (list_length(indexQuals) + list_length(indexOrderBys));
28
29 *indexStartupCost += qual_arg_cost;
30 *indexTotalCost += qual_arg_cost;
31 *indexTotalCost += (numTuples * *indexSelectivity) * (cpu_index_tuple_cost + qual_op_cost);

On peut voir « *indexCorrelation = 1; ». En réalité le moteur ignore la corrélation… pour le moment. Une discussion est en cours pour prendre en compte la corrélation dans le coût de l’index : http://www.postgresql.org/message-id/20151116135239.GV614468@alvherre.pgsql

Trions notre table en utilisant l’ordre CLUSTER et un index b-tree :

1CREATE INDEX brin_random_btree_idx ON brin_random USING btree (c1);
2CLUSTER brin_random USING brin_random_btree_idx;
3DROP INDEX brin_random_btree_idx ;
4ANALYZE brin_random ;

Vérifions la corrélation :

1SELECT tablename,correlation FROM pg_stats WHERE tablename='brin_random';
2 tablename | correlation
3-------------+-------------
4 brin_random | 1
5(1 ligne)

Rejouons notre requête :

 1EXPLAIN (ANALYZE,BUFFERS,VERBOSE) SELECT c1 FROM brin_random WHERE c1> 10 AND c1<20;
 2 QUERY PLAN
 3----------------------------------------------------------------------------------------------------------------------------------------
 4 Bitmap Heap Scan on public.brin_random (cost=115.08..708.94 rows=10057 width=4) (actual time=0.113..3.166 rows=9999 loops=1)
 5 Output: c1
 6 Recheck Cond: ((brin_random.c1 > 10) AND (brin_random.c1 < 20))
 7 Rows Removed by Index Recheck: 849
 8 Heap Blocks: lossy=48
 9 Buffers: shared hit=50
10 -> Bitmap Index Scan on brin_random_brin_idx_16 (cost=0.00..112.57 rows=10057 width=0) (actual time=0.053..0.053 rows=480 loops=1)
11 Index Cond: ((brin_random.c1 > 10) AND (brin_random.c1 < 20))
12 Buffers: shared hit=2
13 Planning time: 0.086 ms
14 Execution time: 3.849 ms

Cette fois le moteur a lu moins de blocs, regardons ce que contient notre index :

 1SELECT * FROM brin_page_items(get_raw_page('brin_random_brin_idx_16', 2), 'brin_random_brin_idx_16');
 2 itemoffset | blknum | attnum | allnulls | hasnulls | placeholder | value
 3------------+--------+--------+----------+----------+-------------+------------
 4 1 | 0 | 1 | f | f | f | {1 .. 4}
 5 2 | 16 | 1 | f | f | f | {4 .. 7}
 6 3 | 32 | 1 | f | f | f | {7 .. 10}
 7 4 | 48 | 1 | f | f | f | {10 .. 14}
 8 5 | 64 | 1 | f | f | f | {14 .. 17}
 9 6 | 80 | 1 | f | f | f | {17 .. 20}
10 7 | 96 | 1 | f | f | f | {20 .. 23}
11 8 | 112 | 1 | f | f | f | {23 .. 27}
12 9 | 128 | 1 | f | f | f | {27 .. 30}
13 10 | 144 | 1 | f | f | f | {30 .. 33}
14 11 | 160 | 1 | f | f | f | {33 .. 36}
15 12 | 176 | 1 | f | f | f | {36 .. 39}
16 13 | 192 | 1 | f | f | f | {39 .. 43}
17 14 | 208 | 1 | f | f | f | {43 .. 46}
18 15 | 224 | 1 | f | f | f | {46 .. 49}
19 16 | 240 | 1 | f | f | f | {49 .. 52}
20 17 | 256 | 1 | f | f | f | {52 .. 56}
21 18 | 272 | 1 | f | f | f | {56 .. 59}
22 19 | 288 | 1 | f | f | f | {59 .. 62}
23 20 | 304 | 1 | f | f | f | {62 .. 65}
24 21 | 320 | 1 | f | f | f | {65 .. 69}
25 22 | 336 | 1 | f | f | f | {69 .. 72}
26 23 | 352 | 1 | f | f | f | {72 .. 75}
27 24 | 368 | 1 | f | f | f | {75 .. 78}
28 25 | 384 | 1 | f | f | f | {78 .. 82}
29 26 | 400 | 1 | f | f | f | {82 .. 85}
30 27 | 416 | 1 | f | f | f | {85 .. 88}
31 28 | 432 | 1 | f | f | f | {88 .. 90}

Cette fois le moteur savait qu’il n’avait à parcourir que les blocs de 48 à 96.

Brin Index Postgres

Auteurs

Adrien Nayrat (he/him)

Expert DBA PostgreSQL

J’ai occupé pendant 7 ans divers postes d’ingénieur système et réseau. Et c’est à partir de 2013 que j’ai commencé à mettre les doigts dans PostgreSQL. J’ai occupé des postes de consultant, formateur, mais également DBA de production (Doctolib, Peopledoc).

Ce blog me permet de partager mes connaissances et trouvailles, ainsi que mes interventions et conférences.

← Index BRIN – Performances avr. 21, 2016

Index BRIN – Fonctionnement avr. 20, 2016 →

No results found

Index BRIN – Corrélation

Données corrélées

Sur le même sujet