Regexi filtrite kirjutamine ja testimine Google Analyticsi jaoks (koos näidetega)

Regulaaravaldised Regexi Google Analyticsi filtrid

Nagu paljude minu siinsete artiklite puhul, uurin ka kliendi jaoks veidi ja kirjutan siis siit. Kui aus olla, siis on paar põhjust, miks… kõigepealt on see, et mul on kohutav mälu ja uurin sageli teavet oma veebisaidilt. Teiseks on aidata teisi, kes võivad samuti teavet otsida.

Mis on regulaaravaldis (Regex)?

Regex on arendusmeetod tekstis olevate tähemärkide otsimiseks ja tuvastamiseks teksti sobitamiseks või asendamiseks. Kõik kaasaegsed programmeerimiskeeled toetavad regulaaravaldisi.

Ma armastan regulaaravaldisi (regex), kuid need võivad õppimise ja testimise jaoks olla veidi masendavad või vihastavad. Google'i analüüsil on mõned hämmastavad võimalused ... kus saate luua tavaväljenditega vaateid või filtreerida oma andmeid tavaväljendites.

Näiteks kui ma tahan oma siltide lehtedel näha ainult liiklust, saaksin oma püsilingi struktuuris / tag / filtreerida, kasutades järgmist:

/tag\/

Süntaks on seal kriitiline. Kui ma lihtsalt kasutaksin "silti", saaksin kõik lehed, milles oleks termin silt. Kui kasutaksin märget „/ tag”, lisataks iga URL, mis algab märgendiga / sildihaldus kuna Google Analytics lisab vaikimisi mis tahes märgi pärast regulaaravaldist. Niisiis, ma pean tagama, et mul oleks järgmine kaldkriips kaasas ... aga sellel peab olema põgenemismärk.

lehefiltri regex

Regexi süntaksi põhitõed

Süntaks Kirjeldus
^ Algab
$ Lõpeb
. Märk mis tahes tähemärgi jaoks
* Eelmise üksuse null või rohkem
.* Sobib mis tahes tähemärgiga
? Eelmise üksuse null või üks kord
+ Eelmise üksuse üks või mitu korda
| VÕI operaator
[abc] A, b või c (võib olla suvaline arv tähemärke)
[az] Vahemik a kuni z (võib olla suvaline arv tähemärke)
[AZ] Vahemik A kuni Z (suurtähtedega)
[0-9] Vahemik 0 kuni 9 (võib olla mis tahes arv)
[a-zA-Z] Vahemik a kuni Z või A kuni Z
[a-zA-Z0-9] Kõik tähtnumbrilised tähemärgid
1 {} Täpselt 1 eksemplar (võib olla mis tahes arv)
{1–4} Vahemik 1 kuni 4 eksemplari (võib olla mis tahes arv)
{1,} 1 või rohkem eksemplari (võib olla mis tahes arv)
() Grupeerige oma reeglid
\ Põgenege erimärkidest
\d Numbriline tähemärk
\D Mittekohaline märk
\s Valge ruum
\S Mitte-valge ruum
\w sõna
\W Mittesõna (kirjavahemärgid)

Regexi näited Google Analyticsi jaoks

Nii et paneme mõne jaoks mõned näited Kohandatud filtrid. Üks mu kolleegidest palus minult abi siselehe tuvastamiseks / register lisaks kõigile ajaveebi postitustele, mis on püsilinkis kirjutatud aastaga:

Minu kohandatud filtri muster filtri väljale Taotle URL-i:

^/(index|[0-9]{4}\/)

Põhimõtteliselt öeldakse, et otsida / indekseerida VÕI mis tahes neljakohalist arvulist rada, mis lõpeb kaldkriipsuga. Lõin Analyticsis vaate ja lisasin selle filtriks:

Google Analyticsi vaatefilter

Siin on veel mõned näited:

  • Teil on ajaveeb, mille URL-i püsilingi teekonnal on aasta ja soovite filtreerida loendi mis tahes aastasse. Nii et ma tahan 4 numbrit, millele järgneb kaldkriips. Taotle URl-filtri mustrit:

^/[0-9]{4}\/

  • Soovite võrrelda kõiki oma lehti, kus pealkiri on sertifikaat or sertifikaat ta. Lehe pealkirja filtri muster:

(.*)certificat(.*)

  • Soovite võrrelda kahte sihtlehte nende kampaaniasageduse alusel, mis on selles läbitud Google Analyticsi kampaania URL kui utm_medium = otsepostitus or makstud otsing.

(direct\smail|paid\ssearch)

  • Soovite URL-i tee põhjal võrrelda kõiki tooteid, mis on meeste särgid. Taotle URl-filtri mustrit:

^/mens/shirt/(.*)

  • Soovite võrrelda kõiki lehti, mis on nummerdatud URL-iga, mis lõpeb numbriga. Taotle URl-filtri mustrit:

^/page/[1-9]*/$

  • Soovite välistada IP-aadresside vahemiku. Välista IP-aadressi filtri muster:

123\.456\.789\.[0-9]

  • Soovite kaasata aitähou.html lehe, kus esitamine õnnestus, lähtudes päringulõngast edu = tõene. Taotle URl-filtri mustrit:

thankyou\.html\?success=true

Kuidas oma regex-väljendeid testida

Google Analyticsi proovide ja eksituste asemel lähen ma lihtsalt üle regex101, suurepärane vahend tavaväljendite testimiseks. See isegi lagundab teie süntaks teie jaoks ja annab üksikasjad regulaaravaldise kohta:

regulaaravaldised regex101

Regexi loomine, testimine ja silumine

Mis sa arvad?

Sellel saidil kasutatakse rämpsposti vähendamiseks Akismetit. Vaadake, kuidas teie andmeid töödeldakse.