Btree, GIN, GIST indexes bloat

source: https://stackoverflow.com/questions/56704625/index-bloat-on-gin-index-for-insert-only-table
see also: https://wiki.postgresql.org/wiki/Show_database_bloat

WITH constants AS (
  SELECT current_setting('block_size')::numeric AS bs, 23 AS hdr, 4 AS ma
), bloat_info AS (
  SELECT
    ma,bs,schemaname,tablename,
    (datawidth+(hdr+ma-(case when hdr%ma=0 THEN ma ELSE hdr%ma END)))::numeric AS datahdr,
    (maxfracsum*(nullhdr+ma-(case when nullhdr%ma=0 THEN ma ELSE nullhdr%ma END))) AS nullhdr2
  FROM (
    SELECT
      schemaname, tablename, hdr, ma, bs,
      SUM((1-null_frac)*avg_width) AS datawidth,
      MAX(null_frac) AS maxfracsum,
      hdr+(
        SELECT 1+count(*)/8
        FROM pg_stats s2
        WHERE null_frac<>0 AND s2.schemaname = s.schemaname AND s2.tablename = s.tablename
      ) AS nullhdr
    FROM pg_stats s, constants
    GROUP BY 1,2,3,4,5
  ) AS foo
), table_bloat AS (
  SELECT
    schemaname, tablename, cc.relpages, bs,
    CEIL((cc.reltuples*((datahdr+ma-
      (CASE WHEN datahdr%ma=0 THEN ma ELSE datahdr%ma END))+nullhdr2+4))/(bs-20::float)) AS otta
  FROM bloat_info
  JOIN pg_class cc ON cc.relname = bloat_info.tablename
  JOIN pg_namespace nn ON cc.relnamespace = nn.oid AND nn.nspname = bloat_info.schemaname AND nn.nspname <> 'information_schema'
), index_bloat AS (
  SELECT
    schemaname, tablename, bs,
    COALESCE(c2.relname,'?') AS iname, COALESCE(c2.reltuples,0) AS ituples, COALESCE(c2.relpages,0) AS ipages,
    COALESCE(CEIL((c2.reltuples*(datahdr-12))/(bs-20::float)),0) AS iotta -- very rough approximation, assumes all cols
  FROM bloat_info
  JOIN pg_class cc ON cc.relname = bloat_info.tablename
  JOIN pg_namespace nn ON cc.relnamespace = nn.oid AND nn.nspname = bloat_info.schemaname AND nn.nspname <> 'information_schema'
  JOIN pg_index i ON indrelid = cc.oid
  JOIN pg_class c2 ON c2.oid = i.indexrelid
)
SELECT
  type, schemaname, object_name, bloat, pg_size_pretty(raw_waste) as waste
FROM
(SELECT
  'table' as type,
  schemaname,
  tablename as object_name,
  ROUND(CASE WHEN otta=0 THEN 0.0 ELSE table_bloat.relpages/otta::numeric END,1) AS bloat,
  CASE WHEN relpages < otta THEN '0' ELSE (bs*(table_bloat.relpages-otta)::bigint)::bigint END AS raw_waste
FROM
  table_bloat
    UNION
SELECT
  'index' as type,
  schemaname,
  tablename || '::' || iname as object_name,
  ROUND(CASE WHEN iotta=0 OR ipages=0 THEN 0.0 ELSE ipages/iotta::numeric END,1) AS bloat,
  CASE WHEN ipages < iotta THEN '0' ELSE (bs*(ipages-iotta))::bigint END AS raw_waste
FROM
  index_bloat) bloat_summary
ORDER BY raw_waste DESC, bloat DESC

MySQL to PostgreSQL

https://stackoverflow.com/questions/1309624/simulating-mysqls-order-by-field-in-postgresql
https://postgres.cz/wiki/PostgreSQL_SQL_Tricks_III#MySQL_function_group_concat_in_PostgreSQL

UPDATE/DELETE million rows ideas

LOOP
  UPDATE table SET flag=0 
  WHERE id IN (
      SELECT id 
      FROM table 
      WHERE flag <> 0 
      LIMIT 50000
      FOR UPDATE OF table SKIP LOCKED
  );
   
  IF NOT FOUND THEN
      UPDATE table SET flag=0 
      WHERE id IN (
          SELECT id 
          FROM table 
          WHERE flag <> 0 
          LIMIT 50000
          --FOR UPDATE OF table SKIP LOCKED
      );
  END IF;

  EXIT WHEN NOT FOUND;

  VACUUM ANALYSE table;
END LOOP;

-- FOR UPDATE of t -- пытаемся заблокировать строки таблицы от изменения в параллельных транзакциях (при этом читать строки можно)
-- NOWAIT -- если строки заблокировать не удалось, выдаём ошибку, а не ждём (строки уже заблокированы в параллельных транзакциях)
-- SKIP LOCKED -- если строки заблокировать не удалось, пропускаем их (они уже заблокированы в параллельных транзакциях)

https://postgrespro.ru/docs/postgresql/11/logical-replication
https://blog.codacy.com/how-to-update-large-tables-in-postgresql/
https://m.habr.com/en/company/lanit/blog/351160/ - PostgreSQL. Ускоряем деплой в семь раз с помощью «многопоточки»
https://habr.com/ru/post/481610/ - PostgreSQL Antipatterns: обновляем большую таблицу под нагрузкой

Как получить дату из поля типа timestamp

-- медленее:
SELECT to_char(last_event_at, 'YYYY-MM-DD') as calls_date, COUNT(*) AS cnt
FROM cts__cdr
WHERE last_event_at > '2021-01-01'
GROUP BY calls_date
ORDER BY calls_date ASC
limit 100;

--быстрее:
SELECT last_event_at::date as calls_date, COUNT(*) AS cnt
FROM cts__cdr
WHERE last_event_at > '2021-01-01'
GROUP BY calls_date
ORDER BY calls_date ASC
limit 100;

Как защитить БД от внезапных нагрузок, создаваемых приложениями? Например, в периодически запускаемых фоновых (background) задачах.

Предполагаемое решение — измерять скорость выполнения каждого запроса (SELECT или DML) в приложении. Если оно превышает N секунд, значит ресурсов БД нехватает и после выполнения запроса приложение нужно замедлить, т.е. "поспать" некоторое время. Это даст "продохнуть" БД и адаптироваться под её нагрузку. Длительность сна можно высчитывать по формуле, отталкиваясь от длительности выполнения запроса. См. распределение значений запросом

with t as (
    select exec_time,
           round(greatest(sqrt(exec_time * 1) - 1, 0), 2) as sleep_time1,
           round(greatest(sqrt(exec_time * 2) - 2, 0), 2) as sleep_time2,
           round(greatest(sqrt(exec_time * 3) - 3, 0), 2) as sleep_time3
    from generate_series(0.1, 60, 0.1) as exec_time
)
select exec_time,
       sleep_time1, round(sleep_time1 * 100 / exec_time, 0) as percent1,
       sleep_time2, round(sleep_time2 * 100 / exec_time, 0) as percent2,
       sleep_time3, round(sleep_time3 * 100 / exec_time, 0) as percent3
from t

Битовый тип годится только для хранения > 64 вариантов значений (битов)

Обоснование:

select pg_column_size(0::smallint), --2 байта
       pg_column_size(0::int), --4
       pg_column_size(0::bigint), --8
       pg_column_size(0::bit(8)), --9
       pg_column_size(0::bit(16)) --10

Как быстро получить первые N уникальных значений из колонки таблицы без использования индексов (как я ускорял запрос)

-- было так
explain -- Limit  (cost=3293253.59..3293254.09 rows=100 width=1037)
select distinct history
from cts__cdr
limit 100;
--execution: > 30m ? (недождался)

explain  -- Limit  (cost=1113569.59..1113582.82 rows=100 width=1069)
select min(history)
from cts__cdr
group by history
limit 100;
--execution: 10 m 6 s

explain --Limit  (cost=1125020.27..1125034.43 rows=100 width=48)
select min(history)
from cts__cdr
group by md5(history)::uuid
limit 100;
--execution: 1 m 20 s


explain -- Limit  (cost=968190.32..968224.11 rows=100 width=1037)
select history
from cts__cdr as t
where not exists(select
                 from cts__cdr as d
                 where d.history = t.history
                   and d.ctid < t.ctid
                   --and d.history is not null
                 )
--and history is not null
limit 100;
--execution: 36 s

-- стало так
-- быстрое решение, но с большим расходом по памяти для больших N
explain --Limit  (cost=1.91..2.02 rows=11 width=32)
with recursive t (ctid, value, values) as (
    (select ctid, history, array[md5(history::text)::uuid]
     from cts__cdr
     limit 1)
    union all
    (select p.ctid, p.history, t.values || md5(p.history::text)::uuid
     from cts__cdr p
     inner join t on p.ctid > t.ctid and md5(p.history::text)::uuid != all(t.values)
     limit 1)
)
select value from t limit 100
--execution: 85 ms
/*
Можно было бы обойтись без колонки values и искать дубликаты подзапросом: WHERE not exists(select from t as d where p.history = d.history)
Но, к сожалению, БД возвращает ошибку [42P19] ERROR: recursive reference to query "t" must not appear within a subquery
*/

-- быстрое, но громоздкое решение с небольшим расходом памяти для больших N, на практике нужно обернуть в функцию
do $$
declare
    rec record;
    counter int default 0;
begin
    create temporary table t (
        v uuid unique
        --v bigint unique
    ) on commit drop;

    FOR rec IN select history as v from cts__cdr
    LOOP
        insert into t (v) values(md5(rec.v)::uuid) on conflict do nothing;
        if FOUND then
            counter := counter + 1;
            EXIT WHEN counter = 100;
        end if;
    END LOOP;

    perform * from t;

end
$$;
--completed in 111 ms

Decode \uXXXX

https://stackoverflow.com/questions/20124393/convert-escaped-unicode-character-back-to-actual-character-in-postgresql/69554541 https://stackoverflow.com/questions/10111654/how-to-convert-literal-u-sequences-into-utf-8

Solution without using PL/pgSQL functions and EXECUTE trick, without SQL injection vulnerable. Pure SQL.

Query:

select string_agg(
            case
                when left(m[1], 2) in ('\u', '\U')
                then chr(('x' || lpad(substring(m[1], 3), 8, '0'))::bit(32)::int)
                else m[1]
            end,
            ''
        )
from regexp_matches('\u017D\u010F\u00E1r, Нello \u270C, Привет!\U0001F603', '\\u[\da-fA-F]{4}|\\U[\da-fA-F]{8}|.',  'g') as s(m);
-- TODO \ud83d\ude03 is the same as \U0001F603, but does not work, see https://github.com/rin-nas/php5-utf8/blob/master/UTF8.php#L2546
-- from regexp_matches('\u017D\u010F\u00E1r, Нello \u270C, Привет!\U0001F603 \ud83d\ude03', '\\u[\da-fA-F]{4}|\\U[\da-fA-F]{8}|.',  'g') as s(m);

Of course, you can make function from this query to hide implementation and get usability.

Как очень быстро избавиться от bloat в маленьких таблицах, но очень интенсивных по записи

В таблицах, где записей < 10000, есть очень быстрый способ "огнетушителя" избавиться от bloat. Проверил на прод БД. Всё работает отлично.

DO $$
    BEGIN
        SET LOCAL lock_timeout TO '3s'; -- Максимальное время блокирования других SQL запросов (простоя веб-сайта) во время миграции. Если будет превышено, то транзакция откатится.
        IF pg_try_advisory_xact_lock('service__workers'::regclass::oid::bigint) THEN -- запрещаем этот код выполняться параллельно (блокировка действует до конца транзакции)
            LOCK TABLE service__workers IN SHARE MODE; -- защищаем таблицу от параллельного изменения данных, при этом читать из таблицы можно (блокировка действует до конца транзакции)
            CREATE TEMPORARY TABLE service__workers__tmp ON COMMIT DROP AS SELECT * FROM service__workers;
            TRUNCATE service__workers; -- немедленно высвобождаем место ОС
            INSERT INTO service__workers SELECT * FROM service__workers__tmp;
        END IF;
    END;
$$;

duplicate indexes

SELECT pg_size_pretty(sum(pg_relation_size(idx))::bigint) AS size,
       (array_agg(idx))[1] AS idx1, (array_agg(idx))[2] AS idx2,
       (array_agg(idx))[3] AS idx3, (array_agg(idx))[4] AS idx4
FROM (
         SELECT indexrelid::regclass AS idx, (indrelid::text ||E'\n'|| indclass::text ||E'\n'|| indkey::text ||E'\n'||
                                              coalesce(indexprs::text,'')||E'\n' || coalesce(indpred::text,'')) AS KEY
         FROM pg_index) sub
GROUP BY KEY HAVING count(*)>1
ORDER BY sum(pg_relation_size(idx)) DESC;

Создание GIN индекса для uuid[]

CREATE TABLE someitems (
    items uuid[]
);

CREATE INDEX someitems_items_index ON someitems USING GIN (items); --ERROR:  data type uuid[] has no default operator class for access method "gin"

CREATE OPERATOR CLASS _uuid_ops DEFAULT FOR TYPE _uuid USING gin AS
    OPERATOR 1 &&(anyarray, anyarray),
    OPERATOR 2 @>(anyarray, anyarray),
    OPERATOR 3 <@(anyarray, anyarray),
    OPERATOR 4 =(anyarray, anyarray),
    FUNCTION 1 uuid_cmp(uuid, uuid),
    FUNCTION 2 ginarrayextract(anyarray, internal, internal),
    FUNCTION 3 ginqueryarrayextract(anyarray, internal, smallint, internal, internal, internal, internal),
    FUNCTION 4 ginarrayconsistent(internal, smallint, anyarray, integer, internal, internal, internal, internal),
    STORAGE uuid;
    
SELECT * FROM someitems WHERE items @> ARRAY['171e9457-5242-406d-ab5e-523419794d18']::uuid[];

COPY progress bar with speed (MB/sec)

select query_start,
       e.duration,
       pg_size_pretty(bytes_processed) as processed_size,
       pg_size_pretty(bytes_processed / EXTRACT(epoch FROM e.duration)) || '/sec' as speed,
       p.datname as db_name,
       a.query,
       a.application_name
from pg_stat_progress_copy as p
inner join pg_stat_activity as a on p.pid = a.pid
cross join lateral (
    select
        NOW() - query_start as duration
) as e

Как узнать стратегию хранения колонок для таблицы?

select att.attname,
    case att.attstorage
       when 'p' then 'plain'
       when 'm' then 'main'
       when 'e' then 'external'
       when 'x' then 'extended'
       end as attstorage
from pg_attribute att
join pg_class tbl on tbl.oid = att.attrelid
join pg_namespace ns on tbl.relnamespace = ns.oid
where tbl.relname = 'cts__cdr'
  and ns.nspname = 'public'
  and not att.attisdropped;

Лайвхак по добыванию свободного места в БД

Имеется таблица

create table person_password_log
(
    id                   integer generated by default as identity
        primary key,
    person_id            integer                                   not null
        references person
            on update cascade on delete cascade,
    password_hash        varchar(60)                               not null
        constraint person_password_log_password_hash_check
            check (octet_length((password_hash)::text) = 60),
    created_at           timestamp(0) with time zone default now() not null,
    http_request_headers jsonb,
    request_remote_addr  inet,
    session_id           varchar(128),
    is_auto_generated    boolean
);

comment on table person_password_log is 'История изменений паролей пользователей';
comment on column person_password_log.id is 'ID записи';
comment on column person_password_log.person_id is 'ID персоны';
comment on column person_password_log.password_hash is 'Соль и хеш от пароля в формате bcrypt';
comment on column person_password_log.created_at is 'Дата-время создания';
comment on column person_password_log.http_request_headers is 'Заголовки HTTP запроса в формате ключ-значение';
comment on column person_password_log.request_remote_addr is 'IP адрес запроса';
comment on column person_password_log.session_id is 'ID сессии, значение из session.sid';
comment on column person_password_log.is_auto_generated is 'Признак генерации пароля системой';

В таблице есть разные колонки и ещё http_request_headers, request_remote_addr, session_id. По данным этих колонок можно обнаруживать роботов, спам, делать аналитику и др. Для этого интересны только "свежие" данные за последние N месяцев. В таком случае данные старше N месяцев можно очищать (присваивать этим полям NULL).

Узнаём, сколько примерно места занимают данные:

select count(*),
       sum(pg_column_size(http_request_headers) +
           pg_column_size(request_remote_addr) +
           pg_column_size(session_id) +
           pg_column_size(is_auto_generated)) as size
from public.person_password_log as t
where created_at < now() - interval '1 year'
  and (http_request_headers is not null
       or request_remote_addr is not null
       or session_id is not null
       or is_auto_generated is not null
  );

Удаляем уже ненужные данные:

update public.person_password_log
set http_request_headers = null,
    request_remote_addr  = null,
    session_id           = null,
    is_auto_generated    = null
where created_at < now() - interval '1 year'
  and (http_request_headers is not null
    or request_remote_addr is not null
    or session_id is not null
    or is_auto_generated is not null);

Улучшаем сжатие TOAST (лайвхак)

-- смотрим, как сжимаются данные в механизме TOAST
with t as (
    select id,
           history,
           pg_column_size(history) as "varchar",
           pg_column_size(history::json) as "json",
           pg_column_size(history::jsonb) as "jsonb"
    from public.cts__cdr
    limit 100000
)
select pg_size_pretty(sum("varchar")) as varchar_compressed, --108 MB
       pg_size_pretty(sum("json")) as json_uncompressed, --161 MB
       pg_size_pretty(sum("jsonb")) as jsonb_uncompressed --180 MB
from t;

-- https://postgrespro.ru/docs/postgresql/12/storage-toast
alter table cts__cdr alter column history set storage main; --запрос ничего не блокирует, текущие данные не изменяются

select sum(pg_column_size(history)) --11,424,009
from public.cts__cdr
where id < 10000;

update public.cts__cdr
--set history = trim(history)
set history = rpad(history, 2000, ' ')
where id < 10000 and octet_length(history) < 2000;

select sum(pg_column_size(history)) --6,294,649
from public.cts__cdr
where id < 10000;

Значит, можно сделать триггер и обновить все записи для TOAST сжатия.

primary_key_columns

source https://supabase.com/blog/audit

create or replace function audit.primary_key_columns(entity_oid oid)
    returns text[]
    stable
    security definer
    language sql
as $$
    -- Looks up the names of a table's primary key columns
    select
        coalesce(
            array_agg(pa.attname::text order by pa.attnum),
            array[]::text[]
        ) column_names
    from
        pg_index pi
        join pg_attribute pa
            on pi.indrelid = pa.attrelid
            and pa.attnum = any(pi.indkey)
    where
        indrelid = $1
        and indisprimary
$$;

Find indexes with a high ratio of NULL values

source:

https://github.com/pawurb/ruby-pg-extras/blob/master/lib/ruby_pg_extras/queries/null_indexes.sql
https://habr.com/ru/company/otus/blog/672102/

SQL query small improved

SELECT
    --c.oid,
    --c.relname AS index,
    pg_size_pretty(pg_relation_size(c.oid)) AS index_size_pretty,
    i.indisunique AS unique,
    a.attname AS indexed_column,
    to_char(s.null_frac * 100, '999.00%') AS null_frac,
    pg_size_pretty(e.expected_saving) AS expected_saving_pretty
    , ixs.indexdef -- Uncomment to include the index definition
FROM
    pg_class c
    JOIN pg_index i ON i.indexrelid = c.oid
    JOIN pg_attribute a ON a.attrelid = c.oid
    JOIN pg_class c_table ON c_table.oid = i.indrelid
    JOIN pg_indexes ixs ON c.relname = ixs.indexname
    LEFT JOIN pg_stats s ON s.tablename = c_table.relname AND a.attname = s.attname
    JOIN LATERAL ( SELECT (pg_relation_size(c.oid) * s.null_frac)::bigint AS expected_saving ) AS e ON e.expected_saving > 0
WHERE
    NOT i.indisprimary -- Primary key cannot be partial
    AND i.indpred IS NULL -- Exclude already partial indexes
    AND array_length(i.indkey, 1) = 1 -- Exclude composite indexes
    AND pg_relation_size(c.oid) > 10 * 1024 ^ 2 -- Larger than 10MB
    AND s.null_frac * 100 > 5 -- Larger than 5%
ORDER BY
    e.expected_saving DESC;

`html_strip_tags()` develop

select id,
       description as html,
       r6.s as text
from vacancy
--convert html to text, последовательность шагов обработки важна!
cross join regexp_replace(description, '</?(br|li|p)\M[^>]*>', e'\n', 'gi') as r1(s) --заменяем блочные html теги на перенос строки
cross join regexp_replace(r1.s, '</?[a-z][^>]*>', ' ', 'gi') as r2(s) --заменяем html теги на пробел
cross join html_entity_decode(r2.s) as r3(s) -- см. PHP html_entity_decode(), https://github.com/rin-nas/postgresql-patterns-library/blob/master/functions/html_entity_decode.sql
cross join regexp_replace(r3.s, '(?:\s(?<![\n\r]))+', ' ', 'g') as r4(s) --заменяем несколько пробельных символов на один пробел
cross join regexp_replace(r4.s, '\s*[\n\r]\s*', e'\n', 'g') as r5(s) --заменяем несколько переносов строк на один перенос
cross join trim(r5.s, e' \n') as r6(s) --вырезаем первые и последние пробелы и переносы строк

Как посчитать длительность выполнения запросов в CTE?

START TRANSACTION;

--EXPLAIN
WITH s AS MATERIALIZED (
    SELECT id
    FROM public.cts__cdr
    WHERE start_at < now() - interval '6 month'
      AND history IS NOT NULL
    LIMIT 1000
),
u AS (
    UPDATE public.cts__cdr AS u
    SET history = NULL
    FROM s
    WHERE s.id = u.id
    RETURNING clock_timestamp() as ts
)
SELECT --min(ts) - statement_timestamp() AS select_duration,
       --max(ts) - min(ts) AS update_duration,
       --clock_timestamp() - statement_timestamp() AS query_duration,
       CASE
           -- WHEN NOT EXISTS(TABLE u) THEN 0
           WHEN count(ts) < 1000 THEN 0
           WHEN max(ts) - min(ts) > '1s' THEN (1000 / 2)::int
           ELSE 1000 * 2
       END AS next_bath_size
FROM u;

ROLLBACK;

Идея получения даты-времени модификации для сущности

Данные каждой сущности (вакансия, компания, персона и т.п.) могут храниться в нескольких связанных таблицах в отношении 1 к 1 (например vacancy, vacancy_additional_information), а так же 1 ко многим (например vacancy_region, vacancy_skills).
Добавим для сущности ещё одну служебную таблицу {entity}_modified с отношением 1 к 1. Колонки: id сущности и modified_at
Тогда, при изменении данных (включая удаление строк) в любой cвязанной таблице сущности, для id сущности запишем modified_at=now(). Для этого на все связанные таблицы сущности (со связью по id сущности) повесим триггеры уровня SQL оператора. Такие триггры будут срабатывать не для каждой строки, а 1 раз для SQL оператора INSERT/UPDATE/DELETE. В данном случае такие триггеры хорошо подходят для экономии ресурсов БД.

В итоге для каждой нужной нам сущности в БД будет храниться дата-время последней её модификации.

В SQL запросе для получения данных вакансии так же возвращаются данные для связанных сущностей. Например, вакансия связана с компанией. А для компании возвращаются какие-то данные.

Полагаю, что служебные таблицы {entity}_modified позволят упростить и ускорить выполнение SQL запроса для получения даты-времени последнего изменения вакансии с учётом других связанных сущностей. Так же отсутствует зависимость от наличия колонки updated_at в каких-либо связанных таблицах.

Пример на SQL

drop table if exists vacancy_modified;

create table vacancy_modified (
    vacancy_id int primary key references vacancy (id) on delete cascade on update cascade,
    modified_at timestamptz(0) not null check (modified_at <= now() + interval '10m')
);

comment on table vacancy_modified is 'Таблица для хранения даты и времени последнего изменения сущности';
comment on column vacancy_modified.vacancy_id is 'ID вакансии';
comment on column vacancy_modified.modified_at is 'Дата-время добавления, обновления или удаления сущности или её связей';

--https://www.postgrespro.ru/docs/postgresql/12/plpgsql-trigger
--drop function if exists vacancy_skill_save_modified_at();

--эту триггерную функцию можно написать так, 
--чтобы она была одной для всех триггеров от разных сущностей и разных таблиц
create or replace function vacancy_skill_save_modified_at()
    returns trigger
    language plpgsql
as
$$
begin
    if TG_OP in ('INSERT', 'UPDATE') then
        insert into vacancy_modified as m (vacancy_id, modified_at)
            select distinct t.vacancy_id, now()
            from new_table as t
            where t.vacancy_id is not null
        on conflict (vacancy_id)
        do update set modified_at = excluded.modified_at
           where m.modified_at != excluded.modified_at;
    elsif TG_OP = 'DELETE' then
        insert into vacancy_modified as m (vacancy_id, modified_at)
            select distinct t.vacancy_id, now()
            from old_table as t
            where t.vacancy_id is not null
        on conflict (vacancy_id)
        do update set modified_at = excluded.modified_at
           where m.modified_at != excluded.modified_at;
    end if;
    return null; -- возвращаемое значение для триггера AFTER игнорируется
end
$$;

--https://www.postgrespro.ru/docs/postgresql/12/sql-createtrigger

create trigger vacancy_skill_statement_trg_after_ins
    after insert
    on public.vacancy_skills
    referencing new table as new_table
    for each statement
    execute function vacancy_skill_save_modified_at();

create trigger vacancy_skill_statement_trg_after_upd
    after update
    on public.vacancy_skills
    referencing new table as new_table
    for each statement
    execute function vacancy_skill_save_modified_at();

create trigger vacancy_skill_statement_trg_after_del
    after delete
    on public.vacancy_skills
    referencing old table as old_table
    for each statement
    execute function vacancy_skill_save_modified_at();

--select * from vacancy; --30923954
--select * from skill; -- 287508, 530280, 282319, 302537, 283800

insert into vacancy_skills (vacancy_id, skill_id) values
(30923954, 530280);

delete from vacancy_skills where vacancy_id = 30923954 and skill_id = 530280;

select * from vacancy_modified;

Как решить проблему с неэффективным планом запросов из-за условия OR с разными колонками

У PostgreSQL есть проблема с неэффективным планом запросов с OR из разных колонок. Но есть обходной путь через UNION ALL.

Было

select *
from t
where t.a > 0
   or t.b < 0;

Стало (все условия OR переписываем через несколько SELECT запросов, объединяя их через UNION ALL)

select *
from t
where t.a > 0
union all
select *
from t
where t.b < 0

Это применимо как в основном запросе, так и в подзапросах.

Hstore vs jsonb vs json performance

create extension if not exists hstore with schema public;

CREATE TABLE hstore_test AS (SELECT 'a=>1, b=>2, c=>3, d=>4, e=>5'::hstore AS v FROM generate_series(1,1000000));
CREATE TABLE json_test AS (SELECT '{"a":1, "b":2, "c":3, "d":4, "e":5}'::json AS v FROM generate_series(1,1000000));
CREATE TABLE jsonb_test AS (SELECT '{"a":1, "b":2, "c":3, "d":4, "e":5}'::jsonb AS v FROM generate_series(1,1000000));

SELECT sum((v->'e')::text::int) FROM json_test; --execution: 939 ms, fetching: 27 ms
SELECT sum((v->'e')::text::int) FROM jsonb_test; --execution: 580 ms, fetching: 38 ms
SELECT sum((v->'e')::int) FROM hstore_test; --execution: 304 ms, fetching: 63 ms

Protect deadlock

EXPLAIN ANALYZE
UPDATE
  tbl
SET
  val = val + 1
FROM
  (
    SELECT
      ctid
    FROM
      tbl
    WHERE
      id IN (1, 2, 3)
    ORDER BY
      id
    FOR UPDATE -- блокировка
  ) lc
WHERE
  tbl.ctid = lc.ctid; -- поиск по физической позиции записи

https://habr.com/ru/companies/tensor/articles/567514/

Finding skewed data in Postgres

https://www.crunchydata.com/blog/data-skews-in-postgres
https://www.crunchydata.com/postgres-tips#look-for-skewed-data

If you’ve got a growing data set and are periodically looking at query performance, checking for skewed data is a good idea.

As a general rule, Postgres generally doesn't use an index if a single value is greater than 30% of the total data. So skewed data can nullify an index in cases where you’re using a single or multi-column index and one of your columns has skewed data.

Use these queries to see how your data is distributed by column:

SELECT starelid::regclass AS table_name,attname AS column_name,
(SELECT string_agg('',format(E'\'%s\': %s%%\n', v,ROUND(n::numeric*100, 2)))
FROM unnest(stanumbers1,stavalues1::text::text[])nvs(n,v)) pcts
FROM pg_statistic
JOIN pg_attribute ON attrelid=starelid
AND attnum = staattnum
JOIN pg_class ON attrelid = pg_class.oid
WHERE stanumbers1[1] >= .3 and relname not like 'pg_%'
\x\g\x

Luckily there’s a really easy fix for situations like this: partial indexing.

Roles

select admin_option,
       roleid::regrole::text AS rolename,
       member::regrole::text AS member_rolename,
       grantor::regrole::text AS grantor_rolename
from pg_auth_members
order by rolename;

select * from pg_roles;

Regexp error with `.*?`

select m[1]
from regexp_matches($SQL_split$
    comment on type test.test1 is $$comment1$$;
    comment on column test.test2 is $$comment2$$;
$SQL_split$,
$regexp$
        (\$\$
            #(?:(?!\$\$).)*
            .*?
        \$\$)
      #| unknown # UNCOMMENT ME AND EXECUTE QUERY AGAIN! Ungreedy flag `?` does not work!
$regexp$, 'gx') as m;

Как правильно обрабатывать очередь?

Самый простой вариант обработки очереди, но не самый эффективный.

delete from queue
where item_id = (
    select item_id 
    from queue
    order by item_id
    for update skip locked -- если строки заблокировать не удалось, пропускаем их (они уже заблокированы в параллельных транзакциях)
    limit 1
)
returning *;

Процесс исполнения:

Сканируем таблицу в порядке itemid
На каждую строку пробуем взять блокировку
Игнорируем уже взятые блокировки
Нашли запись: блокируем её и возвращаем
Помечаем кортеж удаленным и держим транзакцию открытой
В случае сбоя транзакция откатится и строка окажется неудалённой снова
Хорошо работает, если вы находитесь в рамках одной БД и процесс обработки транзакции «достаточно быстрый»

Как определить, что таблицы в БД используются?

WITH t AS (
    SELECT
        a.rolname,
        --round((s.calls * 100 / sum(s.calls) over())::numeric, 2) as percent,
        s.calls,
        d.datname,
        --s.query,
        qt.table_name

    FROM pg_stat_statements as s
    INNER JOIN pg_database as d ON d.oid = s.dbid
    INNER JOIN pg_authid as a ON a.oid = s.userid
    cross join pg_size_bytes(regexp_replace(trim(current_setting('track_activity_query_size')), '(?<![a-zA-Z])B$', '')) as q(track_activity_query_size_bytes)
    inner join lateral (
        select distinct to_regclass(m.v[1])
        from regexp_matches(s.query, $regexp$
            \m
            (?:from|join|lateral)
            \s+
            (
              (?:[a-zA-Z_]+[a-zA-Z_\d]*\. | "(?:[^"]|"")+"\.)? #schema name
              [a-zA-Z_]+[a-zA-Z_\d]*\M | "(?:[^"]|"")+" #table name
            )
            (?![\(\)]) #not function like now()
        $regexp$, 'ixg') as m(v)
    ) as qt(table_name) on qt.table_name is not null
    WHERE true
      --and s.query ~* '(^|\n)\s*\m(insert\s+into|update|delete|truncate)\M' --только DML запросы
      and s.query !~* '(^|\n)\s*\m(insert\s+into|update|delete|truncate)\M' --исключая DML запросы
      --по умолчанию текст запроса обрезается до 1024 байт; это число определяется параметром track_activity_query_size
      --обрезанные запросы игнорируем
      and octet_length(s.query) < q.track_activity_query_size_bytes
      and rolname not in ('postgres')
    --ORDER BY calls DESC, table_name::text -- самые популярные по кол-ву
    --LIMIT 100
)
, s as (
    select t.datname,
           t.table_name,
           sum(t.calls) as calls_total
    from t
    group by t.datname, t.table_name
    order by calls_total desc, t.datname, t.table_name
    limit 100
)
select s.datname as db_name,
       n.nspname as schema_name,
       c.relname as table_name,
       s.calls_total,
       round((s.calls_total * 100 / sum(s.calls_total) over())::numeric, 2) as calls_total_percent
from s
join pg_class as c on c.oid = s.table_name
join pg_namespace n on n.oid = c.relnamespace
where n.nspname not in ('information_schema')
order by s.calls_total desc,
         s.datname,
         n.nspname,
         c.relname
limit 100;

Как получить список всех временных таблиц текущей базы данных и их размер?

SELECT
	n.nspname as SchemaName,
	c.relname as RelationName,
	CASE c.relkind
	  WHEN 'r' THEN 'table'
	  WHEN 'v' THEN 'view'
	  WHEN 'i' THEN 'index'
	  WHEN 'S' THEN 'sequence'
	  WHEN 's' THEN 'special'
	END as RelationType,
	pg_catalog.pg_get_userbyid(c.relowner) as RelationOwner,
	pg_size_pretty(pg_relation_size(n.nspname ||'.'|| c.relname)) as RelationSize
FROM pg_catalog.pg_class c
LEFT JOIN pg_catalog.pg_namespace AS n ON n.oid = c.relnamespace
WHERE c.relkind IN ('r','s') 
AND (n.nspname !~ '^pg_toast' and nspname like 'pg_temp%')
ORDER BY pg_relation_size(n.nspname ||'.'|| c.relname) DESC;

Быстро проверить содержимое папки pgsql_tmp: [PostgreSQL datadir]/base/pgsql_tmp/

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TODO.md

TODO.md

Btree, GIN, GIST indexes bloat

MySQL to PostgreSQL

UPDATE/DELETE million rows ideas

Как получить дату из поля типа timestamp

Как защитить БД от внезапных нагрузок, создаваемых приложениями? Например, в периодически запускаемых фоновых (background) задачах.

Битовый тип годится только для хранения > 64 вариантов значений (битов)

Как быстро получить первые N уникальных значений из колонки таблицы без использования индексов (как я ускорял запрос)

Decode \uXXXX

Как очень быстро избавиться от bloat в маленьких таблицах, но очень интенсивных по записи

duplicate indexes

Создание GIN индекса для uuid[]

COPY progress bar with speed (MB/sec)

Как узнать стратегию хранения колонок для таблицы?

Лайвхак по добыванию свободного места в БД

Улучшаем сжатие TOAST (лайвхак)

primary_key_columns

Find indexes with a high ratio of NULL values

`html_strip_tags()` develop

Как посчитать длительность выполнения запросов в CTE?

Идея получения даты-времени модификации для сущности

Как решить проблему с неэффективным планом запросов из-за условия OR с разными колонками

Hstore vs jsonb vs json performance

Protect deadlock

Finding skewed data in Postgres

Roles

Regexp error with `.*?`

Как правильно обрабатывать очередь?

Как определить, что таблицы в БД используются?

Как получить список всех временных таблиц текущей базы данных и их размер?

Files

TODO.md

Latest commit

History

TODO.md

File metadata and controls

Btree, GIN, GIST indexes bloat

MySQL to PostgreSQL

UPDATE/DELETE million rows ideas

Как получить дату из поля типа timestamp

Как защитить БД от внезапных нагрузок, создаваемых приложениями? Например, в периодически запускаемых фоновых (background) задачах.

Битовый тип годится только для хранения > 64 вариантов значений (битов)

Как быстро получить первые N уникальных значений из колонки таблицы без использования индексов (как я ускорял запрос)

Decode \uXXXX

Как очень быстро избавиться от bloat в маленьких таблицах, но очень интенсивных по записи

duplicate indexes

Создание GIN индекса для uuid[]

COPY progress bar with speed (MB/sec)

Как узнать стратегию хранения колонок для таблицы?

Лайвхак по добыванию свободного места в БД

Улучшаем сжатие TOAST (лайвхак)

primary_key_columns

Find indexes with a high ratio of NULL values

html_strip_tags() develop

Как посчитать длительность выполнения запросов в CTE?

Идея получения даты-времени модификации для сущности

Как решить проблему с неэффективным планом запросов из-за условия OR с разными колонками

Hstore vs jsonb vs json performance

Protect deadlock

Finding skewed data in Postgres

Roles

Regexp error with .*?

Как правильно обрабатывать очередь?

Как определить, что таблицы в БД используются?

Как получить список всех временных таблиц текущей базы данных и их размер?

`html_strip_tags()` develop

Regexp error with `.*?`