NAS-Speicher mit einer Kapazität von einigen Dutzend Terabyte, wie sie sich für mittelständische Anwender eignen, nimmt die ADMIN-Redaktion in der Ausgabe ... (mehr)

Reorganisieren ohne Lock

Natürlich könnte der Index einfach gelöscht und neu erstellt werden, aber »CREATE INDEX« lockt die Tabelle und kann lange dauern. Daneben gilt, während »CREATE INDEX« läuft, müssen Schreibzugriffe auf die Tabelle warten. Eine weitere Möglichkeit wäre »REINDEX« . Aber auch »REINDEX« blockiert Schreibzugriffe. Eine weitaus bessere Lösung bietet das Feature »CREATE INDEX CONCURRENTLY« . Es können zwar nicht mehrere solcher Pozesse zeitgleich laufen, sondern immer nur einer pro Tabelle, aber dafür wird nichts gelockt, und es kann auf der Tabelle weiterhin geschrieben werden. Zum Reorganisieren des Index legt man ihn mit »CREATE INDEX CONCURRENTLY« nochmal mit anderem Namen an. Anschließend kann der entartete Index mit »DROP INDEX« gelöscht werden, wonach auch der alte Name wieder für den neuen Index benutzt werden kann: »ALTER INDEX name_neu_angelegter RENAME TO name_alter« .

Bereinigt man die Indexe aus dem vorherigen Beispiel auf diese Weise, wird ein ziemlicher Unterschied erkennbar:

relname | relpages | reltuples
------------------+----------+-----------
 t_tabelle | 87 | 19457
 index_ff_50 | 99 | 19457
 index_ff_100 | 50 | 19457
 index_ff_default | 56 | 19457

Es ist einiges an Speicherplatz frei geworden und die Indexe können erstmal wieder eine Zeitlang vor sich hin wachsen.

Ist zu erwarten, dass viele Daten mit Werten dazukommen, die in der Mitte des Indexes angesiedelt werden, so ist es sinnvoll, einen kleineren Fillfactor zu verwenden, da dann Pages nicht so schnell geteilt werden. Ein Fillfactor von 100 Prozent ist nur dann sinnvoll, wenn wirklich sichergestellt werden kann, dass nicht in der Mitte eingefügt wird, sondern immer nur linear rechts.

Tiefe Einblicke

Mithilfe des PostgreSQL-Contrib-Moduls »pageinspect« lässt sich tiefer und genauer in die Indexpages schauen. Nach der Installation kann das Modul in PostgreSQL 9.1 mit :

CREATE EXTENSION pageinspect;

eingespielt werden. In älteren PostgreSQL-Versionen stellen die Co ntrib-Module nach der Installation eine SQL-Datei zur Verfügung, die hochgeladen werden muss.

Um nicht nur Nullen in der Metapage zu sehen, wird ein Blick in die Metapage eines Indexes über eine Integer-Spalte mit 110 000 Datensätzen geworfen:

SELECT root, level FROM bt_metap('hunderttausender_index');
-[ RECORD 1 ]-----
root | 290
level | 2

Die Spalte »level« gibt an, wie tief der Baum ist. Der Beispielbaum hat also eine Tiefe von 3 (Ebene 0, 1 und 2). Die Spalte »root« gibt an, in welcher Pagenummer sich die Wurzel befindet. Sie befindet sich in Page 290. Die Metapage ist Page 0, die erste Page des Baumes ist Page 1. Anhand der Statistik von Page 290 lässt sich noch mehr herausfinden (Listing 3): In »blkno« ist die Pagenummer 290 gespeichert. Der »type« gibt an, ob es eine Root- (Wurzel-) oder eine Leave-Page (Blattpage) oder eine Page zwischen Wurzel- und Blattebene ist. Die Ebenen dazwischen bekommen die Abkürzung »i« für innerer Knoten. Page 290 hat Typ »r« für Root. Mit »live« - beziehungsweise »dead-items« wird angegeben, wie viele lebende oder tote Einträge die Page enthält. Die Page enthält also zwei Einträge und aus »free_size« geht hervor, dass noch 8116 Byte in der Page frei sind. Die Abkürzung »btpo« steht für B-Tree-Position. In der Spalte »btpo« ist angegeben, auf welcher Ebene sich die Page befindet. Sie ist auf Ebene 2, also auf der höchsten Ebene. In »btpo_prev« steht, welche Page sich links und in »btpo_next« welche Page sich rechts neben dieser Page befindet. Der Wert » « bedeutet hier, es gibt weder eine linke noch eine rechte Nachbarin. Da es immer nur genau eine Rootpage geben sollte, hat sie natürlich keine Nachbarinnen. Was steht denn in der Page?

Listing 3

Page-Details

01 SELECT blkno, type, live_items, dead_items, free_size,
02 btpo_prev, btpo_next, btpo
03 FROM bt_page_stats('hunderttausender_index',3);
04
05 -[ RECORD 1 ]----
06 blkno      | 3
07 type       | i
08 live_items | 285
09 dead_items | 0
10 free_size  | 2456
11 btpo_prev  | 0
12 btpo_next  | 289
13 btpo       | 1
SELECT itemoffset, ctid, data
FROM bt_page_items('hunderttausender_index',290);
 itemoffset | ctid | data
------------+---------+------------------
 1 | (3,1) |
 2 | (289,1) | 09 96 01 00 00 00

Der »itemoffset« zählt einfach die Einträge der Reihe nach durch. Da die Page eine Rootpage ist, sind die Datenwerte in »data« Schlüsselwerte. Der erste Wert in »data« ist leer und der zweite ist umgerechnet die Zahl 69928. Aus der Spalte »ctid« (Current Tuple ID) lässt sich entnehmen, dass alles kleiner gleich 69928 in Page 3 beginnend mit dem ersten Datensatz und alles größer gleich in Page 289 beginnend beim ersten Datensatz zu finden ist. Ein Blick in die Statistik von Page 3 verät noch mehr: Der Typ besagt, dass Page 3 ein innerer Knoten ist. Die Page beinhaltet 285 Datensätze, und es sind noch 2456 Byte frei. Die Page liegt auf Ebene 1. Ihre rechte Nachbarin ist Page 289. Da sie eine rechte Nachbarin hat, ist sie nicht die Wurzel, sondern ein innerer Knoten. Da sie keine linke Nachbarin hat und auf Ebene 1 liegt (Ebene 0 sind die Blätter), ist sie die Wurzel des Unterbaumes ganz links außen. Auch die einzelnen Einträge lassen sich mit »pageinspect« einsehen. Die Ausgabe kann lang sein. Page 3 hat 285 Einträge. Hier sind die obersten fünf Zeilen aus Page 3 (Listing 4).

Listing 4

Einblick mit pageinspect

01 SELECT itemoffset, ctid, data
02 FROM bt_page_items('hunderttausender_index',3) LIMIT 5;
03  itemoffset |  ctid   |          data
04 ------------+---------+-------------------------
05           1 | (286,1) | 09 96 01 00 00 00 00 00
06           2 | (1,1)   |
07           3 | (2,1)   | 6f 01 00 00 00 00 00 00
08           4 | (4,1)   | dd 02 00 00 00 00 00 00
09           5 | (5,1)   | 4b 04 00 00 00 00 00 00
comments powered by Disqus

Artikel der Woche

OpenSSL

Als Protokoll ist SSL/TLS täglich im Einsatz. Mozilla und Google haben kürzlich erklärt, dass mehr als 50 Prozent der HTTP-Verbindungen verschlüsselt aufgebaut werden. Googles Chrome soll ab 2017 sogar vor unverschlüsselten Verbindungen warnen, wenn Sie dort sensible Daten eingeben können. In unserem Security-Tipp werfen wir einen Blick hinter die Kulissen von OpenSSL und zeigen dessen vielfältige Möglichkeiten auf. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Linux-Distro

Welche Linux-Distribution setzen Sie vorwiegend auf dem Server ein?

  • Arch Linux
  • CentOS
  • Debian
  • Fedora
  • openSUSE
  • Oracle Linux
  • Red Hat Enterprise Linux
  • SUSE Linux Enterprise Server
  • Ubuntu
  • andere Linux-Distribution
  • FreeBSD
  • OpenBSD

Google+

Ausgabe /2017

Microsite