/
/
/
/
/
03.05. Siêu ký tự Regex: Ký tự nhóm a|b|c (abc) [abc] [^xy]

03.05. Siêu ký tự Regex: Ký tự nhóm a|b|c (abc) [abc] [^xy]

Ký tự a|b|c

Phép toán or/hoặc. Khớp với một trong các mẫu đã cho. Ví dụ: a|b|c khớp với “a” hoặc “b” hoặc “c”. Dấu | thể hiện tương hàm OR, nhưng ta không dùng hàm OR khi viết biểu thức chính quy.
=REGEXMATCH(A1;”Google|Sheets“)
Nếu A1 là:
Google => Kết quả: TRUE
Ggg => Kết quả: FALSE
Sheets => Kết quả: TRUE

Ký tự (xyz)

Biểu diễn một nhóm ký tự (có xét đến thứ tự của các ký tự).

Ví dụ: (abc) khớp với “abc”.
xyz(.*) khớp với bất cứ ký tự nào sau cụm xyz.
xyz(.) chỉ khớp với 1 kí tự sau cụm xyz.
xyz (\w*) (\w*) (\w*) lấy 3 cụm chữ liên tiếp sau chữ xyz.
(quochoantran) (.*) lấy nhóm quochoantran và nhóm đằng sau đó.
(?:xyz) (.*) căn cứ vào nhóm xyz để lấy nhóm sau đó mà không “ghi nhớ” và lấy nhóm xyz.
=REGEXEXTRACT(“GoogleSheets xyz“,”(Google)(?:Sheets) (.+)“)
Kết quả trả về 1 ô là “Google” và 1 ô là “xyz”
Dùng khi chỉ định chuỗi con cần lấy, hoặc muốn tách ra thành nhiều cột. Muốn lấy ký tự nào, ta nhóm chuỗi ký tự đó trong ngoặc. Chúng ta cũng dùng ký hiệu | bên trong nhóm như là phép toán or (hoặc) để xác định nhóm. Ví dụ n(g|h) có nghĩa bắt đầu bằng n theo sau là một mẫu con, mẫu đó hoặc là chữ g hoặc là chữ h:
=REGEXMATCH(A1;”n(g|h)“)
Nếu A1 là:
ngoan => Kết quả: TRUE
nóng => Kết quả: TRUE
hgn => Kết quả: FALSE

Ký tự [abc]

Khớp với bất kỳ ký tự đơn lẻ nào trong dấu ngoặc vuông (không cần quan tâm thứ tự).
Ví dụ:
[abc] khớp với “a”, “b”, hoặc “c”.
[c-h] khớp với bất cứ kí tự alphabet nào giữa c đến h.
[th]oàn có nghĩa là có 1 chữ t hoặc chữ h, tiếp theo là o, à, và n. Sẽ khớp với toàn, hoàn.
Lưu ý: Viết [.] thì nó biểu diễn ký tự chấm . chứ không còn ý nghĩa đại diện bất kỳ ký tự nào như trường hợp trên. Chúng ta không cần dùng ký tự thoát khi dấu chấm nằm trong [.]

Ký tự [^xy]

Thông thường thì ^ biểu diễn điểm bắt đầu của chuỗi, tuy nhiên nếu nó nằm ở vị trí sau dấu [ của cặp [] thì nó lại mang ý nghĩa tạo ra tập hợp ký tự loại trừ (phủ định). Khớp với bất kỳ ký tự nào không nằm trong dấu ngoặc vuông.
Ví dụ:
[^abcd] khớp với bất kỳ ký tự nào ngoại trừ “a”, “b”, hoặc “c”, “d”.
[^\w\s] khớp với bất kỳ ký tự nào không phải chữ hay khoảng trắng.
[^!@#$%^&*(.] khớp với bất kỳ ký tự nào không phải các kí tự đặc biệt được liệt kê.

Ký tự –

Dùng để tạo chuỗi ký tự hàng loạt trong dấu ngoặc vuông để so khớp với mọi vị trí.
[K-P] khớp với bất cứ kí tự alphabet viết hoa nào giữa K đến P (không áp dụng cho kí tự tiếng Việt có dấu).
[a-zA-Z] khớp với bất cứ kí tự alphabet nào (không áp dụng cho kí tự tiếng Việt có dấu).
[c-h] khớp với bất cứ kí tự alphabet nào giữa c đến h (không áp dụng cho kí tự tiếng Việt có dấu).
[3-8] khớp với bất cứ số nào từ 3 đến 8.

….các nội dung còn lại của bài viết này kèm file thực hành trong link Ebook phía trên.

Đăng ký Gói 2 để đọc toàn bộ Ebook tại đây

Chia sẻ: