PostgreSQL 效能優化（上）：LIKE 和 Regex，哪個比較快？

這篇文章是我在工作上真的卡住過的一次效能問題。中間繞了一些路，最後才把真正的瓶頸抓出來。

本篇為上集，先談 LIKE 與 Regex 的抉擇與 I/O／CPU 迷思；接續兩集分別深入：

上集：當 LIKE 遇上 Regex，到底差在哪？

我在工作上接了一批 ETL 後的資料。每筆資料裡，很多標籤被塞在同一個欄位，用 ; 串起來，像這樣：

tag1;tag2;tag3;tag_VIP;tag_inactive

當我要找特定標籤時，最直覺是寫很多個 LIKE。

同事說：「把多個 LIKE 合成一個 Regex，通常會更快。」

我第一反應是：
「沒有索引的話，不是都要整張表一筆一筆看過去嗎？那真的會快多少？」

後來我才搞懂，我們其實切入點不同：我先看讀取成本(I/O)，同事先看運算成本(CPU)。

用比喻來說：

如果資料量還小，Regex 可能已經很有感。
但資料一大，只換語法通常不夠，最後還是得讓資料庫用不同方式找資料。

Regex 可以先減輕 CPU 壓力，但只要查詢還在掃整張表，I/O 依然會是主瓶頸。

中集從 EXPLAIN ANALYZE 拆解 LIKE 與 Regex 的真實成本，下集則動手實作 Array + GIN：