創作內容

16 GP

C# 正規表達式(Regular Expression)

作者:貓貓風 ฅ●ω●ฅ│2019-01-14 13:58:44│巴幣:32│人氣:2822
.














首先介紹何謂  正規表示式(Regular Expression)

正規表示式,在程式碼中常簡寫為regex、regexp或RE),又稱正則表達式、正規表示法、正規運算式、規則運算式、常規表示法,是電腦科學的一個概念。正規表示式使用單個字串來描述、符合一系列符合某個句法規則的字串。在很多文字編輯器裡,正規運算式通常被用來檢索、替換那些符合某個模式的文字。

許多程式設計語言都支援利用正規運算式進行字串操作。

通常可以用來進行字串比對、輸入防呆、甚至字串切割都可以用此表達式完成

在處理複雜格式的資料時會比一般的字串切割 Split好用很多

( 此篇 為先前使用的字串切割方法 )

不需要藉由不斷重複切割多次處理,只需找出單一特徵即可完成字串處理

//--------常用的正則表示語法規則如下表

字元 描述
將下一個字元標記為一個特殊字元(File Format Escape,清單見本表)、或一個原義字元(Identity Escape,有^$()*+?.[{|共計12個)、或一個向後參照(backreferences)、或一個八進位轉義符。例如,「n」符合字元「n」。「n」符合一個換行符。序列「」符合「」而「(」則符合「(」。
^ 符合輸入字串的開始位置。如果設定了RegExp物件的Multiline屬性,^也符合「n」或「r」之後的位置。
$ 符合輸入字串的結束位置。如果設定了RegExp物件的Multiline屬性,$也符合「n」或「r」之前的位置。
* 符合前面的子運算式零次或多次。例如,zo*能符合「z」、「zo」以及「zoo」。*等價於{0,}。
+ 符合前面的子運算式一次或多次。例如,「zo+」能符合「zo」以及「zoo」,但不能符合「z」。+等價於{1,}。
? 符合前面的子運算式零次或一次。例如,「do(es)?」可以符合「do」或「does」中的「do」。?等價於{0,1}。
{n} n是一個非負整數。符合確定的n次。例如,「o{2}」不能符合「Bob」中的「o」,但是能符合「food」中的兩個o。
{n,} n是一個非負整數。至少符合n次。例如,「o{2,}」不能符合「Bob」中的「o」,但能符合「foooood」中的所有o。「o{1,}」等價於「o+」。「o{0,}」則等價於「o*」。
{n,m} mn均為非負整數,其中n<=m。最少符合n次且最多符合m次。例如,「o{1,3}」將符合「fooooood」中的前三個o。「o{0,1}」等價於「o?」。請注意在逗號和兩個數之間不能有空格。
? 非貪心量化(Non-greedy quantifiers):當該字元緊跟在任何一個其他重複修飾詞(*,+,?,{n},{n,},{n,m})後面時,符合模式是貪婪的。非貪婪模式儘可能少的符合所搜尋的字串,而預設的貪婪模式則儘可能多的符合所搜尋的字串。例如,對於字串「oooo」,「o+?」將符合單個「o」,而「o+」將符合所有「o」。
. 符合除「r」「n」之外的任何單個字元。要符合包括「r」「n」在內的任何字元,請使用像「(.|r|n)」的模式。
(pattern) 符合pattern並取得這一符合的子字串。該子字串用於向後參照。所取得的符合可以從產生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中則使用$0…$9屬性。要符合圓括號字元,請使用「(」或「)」。可帶數量字尾。
(?:pattern) 符合pattern但不取得符合的子字串(shy groups),也就是說這是一個非取得符合,不儲存符合的子字串用於向後參照。這在使用或字元「(|)」來組合一個模式的各個部分是很有用。例如「industr(?:y|ies)」就是一個比「industry|industries」更簡略的運算式。
(?=pattern) 正向肯定預查(look ahead positive assert),在任何符合pattern的字串開始處符合尋找字串。這是一個非取得符合,也就是說,該符合不需要取得供以後使用。例如,「Windows(?=95|98|NT|2000)」能符合「Windows2000」中的「Windows」,但不能符合「Windows3.1」中的「Windows」。預查不消耗字元,也就是說,在一個符合發生後,在最後一次符合之後立即開始下一次符合的搜尋,而不是從包含預查的字元之後開始。
(?!pattern) 正向否定預查(negative assert),在任何不符合pattern的字串開始處符合尋找字串。這是一個非取得符合,也就是說,該符合不需要取得供以後使用。例如「Windows(?!95|98|NT|2000)」能符合「Windows3.1」中的「Windows」,但不能符合「Windows2000」中的「Windows」。預查不消耗字元,也就是說,在一個符合發生後,在最後一次符合之後立即開始下一次符合的搜尋,而不是從包含預查的字元之後開始
(?<=pattern) 反向(look behind)肯定預查,與正向肯定預查類似,只是方向相反。例如,「(?<=95|98|NT|2000)Windows」能符合「2000Windows」中的「Windows」,但不能符合「3.1Windows」中的「Windows」。
(?<!pattern) 反向否定預查,與正向否定預查類似,只是方向相反。例如「(?<!95|98|NT|2000)Windows」能符合「3.1Windows」中的「Windows」,但不能符合「2000Windows」中的「Windows」。
x|y 沒有包圍在()里,其範圍是整個正規表示式。例如,「z|food」能符合「z」或「food」。「(?:z|f)ood」則符合「zood」或「food」。
[xyz] 字元集合(character class)。符合所包含的任意一個字元。例如,「[abc]」可以符合「plain」中的「a」。特殊字元僅有反斜線保持特殊含義,用於跳脫字元。其它特殊字元如星號、加號、各種括號等均作為普通字元。脫字元^如果出現在首位則表示負值字元集合;如果出現在字串中間就僅作為普通字元。連字元 - 如果出現在字串中間表示字元範圍描述;如果如果出現在首位(或末尾)則僅作為普通字元。右方括號應轉義出現,也可以作為首位字元出現。
[^xyz] 排除型字元集合(negated character classes)。符合未列出的任意字元。例如,「[^abc]」可以符合「plain」中的「plain」。
[a-z] 字元範圍。符合指定範圍內的任意字元。例如,「[a-z]」可以符合「a」到「z」範圍內的任意小寫字母字元。
[^a-z] 排除型的字元範圍。符合任何不在指定範圍內的任意字元。例如,「[^a-z]」可以符合任何不在「a」到「z」範圍內的任意字元。
[:name:] 增加命名字元類(named character class)[註 1]中的字元到運算式。只能用於方括號運算式
[=elt=] 增加目前locale下排序(collate)等價於字元「elt」的元素。例如,[=a=]可能會增加ä、á、à、ă、ắ、ằ、ẵ、ẳ、â、ấ、ầ、ẫ、ẩ、ǎ、å、ǻ、ä、ǟ、ã、ȧ、ǡ、ą、ā、ả、ȁ、ȃ、ạ、ặ、ậ、ḁ、ⱥ、ᶏ、ɐ、ɑ 。只能用於方括號運算式。
[.elt.] 增加排序元素(collation element)elt到運算式中。這是因為某些排序元素由多個字元組成。例如,29個字母表的西班牙語, "CH"作為單個字母排在字母C之後,因此會產生如此排序「cinco, credo, chispa」。只能用於方括號運算式。
b 符合一個單詞邊界,也就是指單詞和空格間的位置。例如,「erb」可以符合「never」中的「er」,但不能符合「verb」中的「er」。
B 符合非單詞邊界。「erB」能符合「verb」中的「er」,但不能符合「never」中的「er」。
cx 符合由x指明的控制字元。x的值必須為A-Za-z之一。否則,將c視為一個原義的「c」字元。控制字元的值等於x的值最低5位元(即對3210進位的餘數)。例如,cM符合一個Control-M或Enter符號。ca等效於u0001, cb等效於u0002, 等等...
d 符合一個數字字元。等價於[0-9]。注意Unicode正規表示式會符合全形數字字元。
D 符合一個非數字字元。等價於[^0-9]。
f 符合一個換頁符。等價於x0c和cL。
n 符合一個換行符。等價於x0a和cJ。
r 符合一個Enter符號。等價於x0d和cM。
s 符合任何空白字元,包括空格、制表符、換頁符等等。等價於[ fnrtv]。注意Unicode正規表示式會符合全形空格符。
S 符合任何非空白字元。等價於[^ fnrtv]。
t 符合一個制表符。等價於x09和cI。
v 符合一個垂直制表符。等價於x0b和cK。
w 符合包括底線的任何單詞字元。等價於「[A-Za-z0-9_]」。注意Unicode正規表示式會符合中文字元。
W 符合任何非單詞字元。等價於「[^A-Za-z0-9_]」。
xnn 十六進位跳脫字元序列。符合兩個十六進位數字nn表示的字元。例如,「x41」符合「A」。「x041」則等價於「x04&1」。正規運算式中可以使用ASCII編碼。.
num 向後參照(back-reference)一個子字串(substring),該子字串與正規表示式的第num個用括號圍起來的捕捉群(capture group)子運算式(subexpression)符合。其中num是從1開始的十進位正整數,其上限可能是9[註 2]、31[註 3]、99甚至無限[註 4]。例如:「(.)1」符合兩個連續的相同字元。
n 標識一個八進位轉義值或一個向後參照。如果n之前至少n個取得的子運算式,則n為向後參照。否則,如果n為八進位數字(0-7),則n為一個八進位轉義值。
nm 3位八進位數字,標識一個八進位轉義值或一個向後參照。如果nm之前至少有nm個獲得子運算式,則nm為向後參照。如果nm之前至少有n個取得,則n為一個後跟文字m的向後參照。如果前面的條件都不滿足,若nm均為八進位數字(0-7),則nm將符合八進位轉義值nm
nml 如果n為八進位數字(0-3),且m和l均為八進位數字(0-7),則符合八進位轉義值nml。
un Unicode跳脫字元序列。其中n是一個用四個十六進位數字表示的Unicode字元。例如,u00A9符合版權符號(©)。

來源參考:  
https://zh.wikipedia.org/wiki/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F

以下為實作字串切割範例

原始字串為



目標要擷取出的資料為

ACT: 1
FP: 1
F: 128
H: 27.8
T: 29.9
Inp: 0.395
OutP: 0.1
P: 0.128
NP: 0.341
R_down: 0
R_up: 1
L_down: 0
L_up: 1

在此使用正則式找出特徵 並篩選數字格式和位數


  1. using System;  
  2. using System.Collections.Generic;  
  3. using System.ComponentModel;  
  4. using System.Data;  
  5. using System.Drawing;  
  6. using System.Linq;  
  7. using System.Text;  
  8. using System.Windows.Forms;  
  9. using System.Text.RegularExpressions;  
  10.   
  11. namespace regular_expressions_test  
  12. {  
  13.     public partial class Form1 : Form  
  14.     {  
  15.         String _rex_str = "";  
  16.   
  17.         public Form1()  
  18.         {  
  19.             InitializeComponent();  
  20.         }  
  21.   
  22.         private void button1_Click(object sender, EventArgs e)  
  23.         {  
  24.             _rex_str = textBox1.Text;  
  25.   
  26.             string input = "2019-01-07 16:19:19,437 INFO Record:--
  27.             ACT:1,FP:1,F:128,H:27.8,T:29.9,InP:0.395,OutP:-0.1,P:0.128,NP:0.341,R-
  28.             Down:0,R-Up:1,L-Down:0,L-Up:1";  
  29.             string pattern = @"ACT:(?<ACT>d),FP:(?<FP>d),F:(?<F>d{1,3}),H:(?<H>
  30.             (d{1,3}).(d{1,3})),T:(?<T>(d{1,3}).(d{1,3}))" +  
  31.             @",InP:(?<Inp>(d{1,3}).(d{1,3})),OutP:-(?<OutP>(d{1,3}).(d{1,3})),P:(?<P>
  32.             (d{1,3}).(d{1,3})),NP:(?<NP>(d{1,3}).(d{1,3}))" +  
  33.             @",R-Down:(?<R_down>d),R-Up:(?<R_up>d),L-Down:(?<L_down>d),L-Up:(?
  34.             <L_up>d)";   
  35.   
  36.             foreach (Match match in Regex.Matches(input, pattern))  
  37.             {  
  38.                 richTextBox1.Text += "ACT: " + match.Groups["ACT"].Value + "n";  
  39.                 richTextBox1.Text += "FP: " + match.Groups["FP"].Value + "n";  
  40.                 richTextBox1.Text += "F: " + match.Groups["F"].Value + "n";  
  41.                 richTextBox1.Text += "H: " + match.Groups["H"].Value + "n";  
  42.                 richTextBox1.Text += "T: " + match.Groups["T"].Value + "n";  
  43.                 richTextBox1.Text += "Inp: " + match.Groups["Inp"].Value + "n";  
  44.                 richTextBox1.Text += "OutP: " + match.Groups["OutP"].Value + "n";  
  45.                 richTextBox1.Text += "P: " + match.Groups["P"].Value + "n";  
  46.                 richTextBox1.Text += "NP: " + match.Groups["NP"].Value + "n";  
  47.                 richTextBox1.Text += "R_down: " + match.Groups["R_down"].Value + "n";  
  48.                 richTextBox1.Text += "R_up: " + match.Groups["R_up"].Value + "n";  
  49.                 richTextBox1.Text += "L_down: " + match.Groups["L_down"].Value + "n";  
  50.                 richTextBox1.Text += "L_up: " + match.Groups["L_up"].Value + "n";  
  51.             }  
  52.         }  
  53.     }  
  54. }  

執行結果


引用網址:https://home.gamer.com.tw/TrackBack.php?sn=4260558
All rights reserved. 版權所有,保留一切權利

相關創作

同標籤作品搜尋:涼涼風|C#

留言共 4 篇留言

宇宙吃貨胖宅貓
不明覺厲喵

01-14 14:40

貓貓風 ฅ●ω●ฅ
[e23]01-14 16:11
✿⭐⚝朝❌㊗〼❄⛄
之前在學正規表達式,搞得我頭好亂

01-14 19:25

貓貓風 ฅ●ω●ฅ
可能是還沒理解OAO~01-14 21:17
碎銀子
https://regex101.com/

我都是用上面那個網站確認自己寫的正則表示式又沒有寫錯

01-14 21:34

貓貓風 ฅ●ω●ฅ
感謝提供01-14 21:44
珀伽索斯(Ama)
天啊!看了頭好痛XD

01-14 21:57

貓貓風 ฅ●ω●ฅ
可能公式太長XD01-14 22:06
我要留言提醒:您尚未登入,請先登入再留言

16喜歡★s1234567 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:Arduino PM2.... 後一篇:C# Modbus AS...

追蹤私訊切換新版閱覽

作品資料夾

d88931122所有巴友
歡迎諸君來參觀老僧的小屋,內含Steam與Google Play遊戲、3D角色模組、Line貼圖看更多我要大聲說昨天20:54


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情⋯ 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】