正則中有分組這個功能,在golang中也可以使用命名分組。
場景還原如下:
有一行文本,格式為:姓名 年齡 郵箱地址
請將其轉(zhuǎn)換為一個map
代碼實現(xiàn)如下:
str := `Alice 20 alice@gmail.com` // 使用命名分組,顯得更清晰 re := regexp.MustCompile(`(?Pname>[a-zA-Z]+)\s+(?Page>\d+)\s+(?Pemail>\w+@\w+(?:\.\w+)+)`) match := re.FindStringSubmatch(str) groupNames := re.SubexpNames() fmt.Printf("%v, %v, %d, %d\n", match, groupNames, len(match), len(groupNames)) result := make(map[string]string) // 轉(zhuǎn)換為map for i, name := range groupNames { if i != 0 name != "" { // 第一個分組為空(也就是整個匹配) result[name] = match[i] } } prettyResult, _ := json.MarshalIndent(result, "", " ") fmt.Printf("%s\n", prettyResult)
輸出為:
[Alice 20 alice@gmail.com Alice 20 alice@gmail.com], [ name age email], 4, 4 { "age": "20", "email": "alice@gmail.com", "name": "Alice" }
注意 [ name age email]有4個元素, 第一個為""。
接上面的例子,實現(xiàn)一個更貼近現(xiàn)實的需求:
有一個文件, 內(nèi)容大致如下:
Alice 20 alice@gmail.com Bob 25 bob@outlook.com gerrylon 26 gerrylon@github.com ... 更多內(nèi)容
和上面一樣, 不過這次轉(zhuǎn)出來是一個slice of map, 也就是多個map。
代碼如下:
// 文件內(nèi)容直接用字符串表示 usersStr := ` Alice 20 alice@gmail.com Bob 25 bob@outlook.com gerrylon 26 gerrylon@github.com ` userRe := regexp.MustCompile(`(?Pname>[a-zA-Z]+)\s+(?Page>\d+)\s+(?Pemail>\w+@\w+(?:\.\w+)+)`) // 這里要用FindAllStringSubmatch,找到所有的匹配 users := userRe.FindAllStringSubmatch(usersStr, -1) groupNames := userRe.SubexpNames() var result []map[string]string // slice of map // 循環(huán)所有行 for _, user := range users { m := make(map[string]string) // 對每一行生成一個map for j, name := range groupNames { if j != 0 name != "" { m[name] = strings.TrimSpace(user[j]) } } result = append(result, m) } prettyResult, _ := json.MarshalIndent(result, "", " ") fmt.Println(string(prettyResult))
輸出為:
[ { "age": "20", "email": "alice@gmail.com", "name": "Alice" }, { "age": "25", "email": "bob@outlook.com", "name": "Bob" }, { "age": "26", "email": "gerrylon@github.com", "name": "gerrylon" } ]
使用命名分組可以使正則表示的意義更清晰。
轉(zhuǎn)換為map更加符合人類的閱讀習(xí)慣,不過比一般的根據(jù)索引取分組值麻煩一些。
補充:golang 正則分組匹配多個值
import ( "encoding/json" "fmt" "regexp" )
str := `9x_xx:995:88` // `9x_xx:995` // 使用命名分組,一次匹配多個值 re := regexp.MustCompile(`(?Pfname>\w+):+(?Pmod>[1-9]*):*(?Pstrlen>[0-9]*)`) match := re.FindStringSubmatch(str) groupNames := re.SubexpNames() fmt.Printf("%v, %v, %d, %d\n", match, groupNames, len(match), len(groupNames)) result := make(map[string]string) if len(match) == len(groupNames) { // 轉(zhuǎn)換為map for i, name := range groupNames { if i != 0 name != "" { // 第一個分組為空(也就是整個匹配) result[name] = match[i] } } }
prettyResult, _ := json.MarshalIndent(result, "", " ") fmt.Printf("%s\n", prettyResult)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
標(biāo)簽:雞西 重慶 梅河口 蘭州 銅川 欽州 吐魯番 汕頭
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《golang正則之命名分組方式》,本文關(guān)鍵詞 golang,正則,之,命名,分組,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。上一篇:Golang 正則匹配效率詳解