
Sut i Ysgrifennu a Phrofi Hidlau Regex ar gyfer Google Analytics (Gydag Enghreifftiau)
Fel gyda llawer o fy erthyglau yma, rwy'n gwneud rhywfaint o ymchwil i gleient ac yna'n ysgrifennu amdano yma. I fod yn onest, mae yna ddau reswm pam ... yn gyntaf yw bod gen i gof ofnadwy ac yn aml yn ymchwilio i'm gwefan fy hun am wybodaeth. Ail yw helpu eraill a allai hefyd fod yn chwilio am wybodaeth.
Beth yw Mynegiant Rheolaidd (Regex)?
Mae Regex yn ddull datblygu i chwilio a nodi patrwm o gymeriadau yn y testun i naill ai baru neu ddisodli'r testun. Mae pob iaith raglennu fodern yn cefnogi Mynegiadau Rheolaidd.
Rwyf wrth fy modd ag ymadroddion rheolaidd (regex) ond gallant fod ychydig yn rhwystredig neu'n gythryblus i ddysgu a phrofi. Mae gan Google Analytics rai galluoedd anhygoel ... lle gallwch greu golygfeydd gydag ymadroddion rheolaidd neu hidlo'ch data o fewn ymadroddion rheolaidd.
Er enghraifft, pe bawn i eisiau gweld y traffig ar fy nhudalennau tag yn unig, gallwn hidlo am / tag / yn fy strwythur permalink trwy ddefnyddio:
/tag\/
Mae'r gystrawen yn hollbwysig yno. Pe bawn i'n defnyddio “tag” yn unig, byddwn yn cael pob tudalen gyda'r term tag ynddynt. Pe bawn i'n defnyddio “/ tag” yna byddai unrhyw URL sy'n dechrau gyda tag yn cael ei gynnwys, fel / rheoli tagiau oherwydd bod Google Analytics yn rhagosod cynnwys unrhyw gymeriad ar ôl yr ymadrodd rheolaidd. Felly, mae angen i mi sicrhau bod y slaes canlynol yn cael ei chynnwys ... ond mae'n rhaid bod ganddo gymeriad dianc arno.

Hanfodion Cystrawen Regex
Cystrawen | Disgrifiad |
^ | Yn dechrau gyda |
$ | Yn gorffen gyda |
. | Cerdyn gwyllt ar gyfer unrhyw gymeriad |
* | Sero neu fwy o'r eitem flaenorol |
.* | Yn cyfateb i unrhyw gymeriadau yn |
? | Sero neu un amser o'r eitem flaenorol |
+ | Un neu fwy o weithiau o'r eitem flaenorol |
| | Y gweithredwr NEU |
[abc] | A neu b neu c (gall fod yn unrhyw nifer o nodau) |
[az] | Ystod a i z (gall fod yn unrhyw nifer o nodau) |
[AZ] | Ystod o A i Z (wedi'i gyfalafu) |
[0-9] | Ystod o 0 i 9 (gall fod yn unrhyw rif) |
[a-zA-Z] | Ystod o i Z neu A i Z. |
[a-zA-Z0-9] | Pob cymeriad alffaniwmerig |
{1} | Yn union 1 enghraifft (gall fod yn unrhyw rif) |
{1-4} | Ystod o 1 i 4 achos (gall fod yn unrhyw rif) |
{1,} | 1 achos neu fwy (gall fod yn unrhyw rif) |
() | Grwpiwch eich rheolau |
\ | Dianc cymeriadau arbennig |
\d | Cymeriad digid |
\D | Cymeriad di-ddigid |
\s | Gofod gwyn |
\S | Gofod nad yw'n wyn |
\w | Word |
\W | Di-air (atalnodi) |
Enghreifftiau Regex Ar gyfer Google Analytics
Felly gadewch i ni roi rhai enghreifftiau allan yna i rai Hidlau Custom. Gofynnodd un o'm cydweithwyr i mi am gymorth i nodi tudalen fewnol gyda'r llwybr o / mynegai yn ychwanegol at yr holl bostiadau blog a ysgrifennwyd gyda'r flwyddyn yn y permalink:
Fy mhatrwm hidlo arfer ar gyfer y maes hidlo Gofyn am Url:
^/(index|[0-9]{4}\/)
Mae hynny'n nodi yn y bôn i chwilio am / mynegeio NEU unrhyw lwybr rhifol 4 digid sy'n gorffen gyda slaes llusgo. Creais farn yn Analytics ac ychwanegais hyn fel yr hidlydd:

Dyma ychydig mwy o enghreifftiau:
- Mae gennych chi blog gyda'r flwyddyn yn y llwybr permalink URL ac rydych chi am hidlo'r rhestr i unrhyw flwyddyn. Felly rydw i eisiau unrhyw 4 digid rhifol ac yna slaes llusgo. Gofynnwch am Patrwm Hidlo URl:
^/[0-9]{4}\/
- Rydych chi eisiau cymharu'ch holl dudalennau lle mae'r teitl tystysgrif or ardystio ynddo. Patrwm Hidlo Teitl y Dudalen:
(.*)certificat(.*)
- Rydych chi eisiau cymharu dwy dudalen lanio yn seiliedig ar eu Cyfrwng Ymgyrch a basiwyd yn y URL ymgyrch Google Analytics fel utm_medium = post uniongyrchol or chwilio a dalwyd.
(direct\smail|paid\ssearch)
- Rydych chi am gymharu'r holl gynhyrchion sy'n grysau dynion yn seiliedig ar y llwybr URL. Gofynnwch am Patrwm Hidlo URl:
^/mens/shirt/(.*)
- Rydych chi am gymharu pob un o'r tudalennau sydd wedi'u rhifo ar y llwybr URL sy'n gorffen gyda'r rhif. Gofynnwch am Patrwm Hidlo URl:
^/page/[1-9]*/$
- Rydych chi am eithrio ystod o gyfeiriadau IP. Eithrio Patrwm Hidlo Cyfeiriad IP:
123\.456\.789\.[0-9]
- Rydych chi eisiau cynnwys tudalen thankyou.html lle bu cyflwyniad yn llwyddiannus yn seiliedig ar y llwyddiant ymholi = gwir. Gofynnwch am Patrwm Hidlo URl:
thankyou\.html\?success=true
Sut i Brofi'ch Mynegiadau Regex
Yn hytrach na threial a chamgymeriad o fewn Google Analytics, yn aml rydw i'n neidio drosodd i regex101, offeryn gwych ar gyfer profi eich ymadroddion rheolaidd. Mae hyd yn oed yn chwalu'ch cystrawen i chi ac yn darparu manylion eich mynegiant rheolaidd:

Adeiladu, Profi, a Debug Regex