java sscanf_sscanf 详细说明
sscanf
名稱:
sscanf() - 從一個字符串中讀進與指定格式相符的數據.
函數原型:
Int sscanf( string str, string fmt, mixed var1, mixed var2 ... );
int scanf( const char *format [,argument]... );
說明:
sscanf與scanf類似,都是用于輸入的,只是后者以屏幕(stdin)為輸入源,前者以固定字符串為輸入源。
其中的format可以是一個或多個 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符號}
注:
1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星號 (*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中)
2、{a|b|c}表示a,b,c中選一,[d],表示可以有d也可以沒有d。
3、width表示讀取寬度。
4、{h | l | I64 | L}:參數的size,通常h表示單字節size,I表示2字節 size,L表示4字節size(double例外),l64表示8字節size。
5、type :這就很多了,就是%s,%d之類。
6、特別的:%*[width] [{h | l | I64 | L}]type 表示滿足該條件的被過濾掉,不會向目標參數中寫入值
支持集合操作:
%[a-z] 表示匹配a到z中任意字符,貪婪性(盡可能多的匹配)
%[aB'] 匹配a、B、'中一員,貪婪性
%[^a] 匹配非a的任意字符,貪婪性
例子:
1. 常見用法。
char buf[512] = ;
sscanf("123456 ", "%s", buf);
printf("%s\n", buf);
結果為:123456
2. 取指定長度的字符串。如在下例中,取最大長度為4字節的字符串。
sscanf("123456 ", "%4s", buf);
printf("%s\n", buf);
結果為:1234
3. 取到指定字符為止的字符串。如在下例中,取遇到空格為止字符串。
sscanf("123456 abcdedf", "%[^ ]", buf);
printf("%s\n", buf);
結果為:123456
4. 取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。
sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);
printf("%s\n", buf);
結果為:123456abcdedf
5. 取到指定字符集為止的字符串。如在下例中,取遇到大寫字母為止的字符串。
sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);
printf("%s\n", buf);
結果為:123456abcdedf
6、給定一個字符串iios/12DDWDFF@122,獲取 / 和 @ 之間的字符串,先將 "iios/"過濾掉,再將非'@'的一串內容送到buf中
sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
printf("%s\n", buf);
結果為:12DDWDFF
7、給定一個字符串““hello, world”,僅保留world。(注意:“,”之后有一空格)
sscanf(“hello, world”, "%*s%s", buf);
printf("%s\n", buf);
結果為:world
%*s表示第一個匹配到的%s被過濾掉,即hello被過濾了
如果沒有空格則結果為NULL。
sscanf的功能很類似于正則表達式, 但卻沒有正則表達式強大,所以如果對于比較復雜的字符串處理,建議使用正則表達式.
//-------------------------------------------------------
sscanf,表示從字符串中格式化輸入
上面表示從str中,輸入數字給x,就是32700
久以前,我以為c沒有自己的split string函數,后來我發現了sscanf;一直以來,我以為sscanf只能以空格來界定字符串,現在我發現我錯了。
sscanf是一個運行時函數,原形很簡單:
int sscanf(
const char *buffer,
const char *format [,
argument ] ...
);
它強大的功能體現在對format的支持上。
我以前用它來分隔類似這樣的字符串2006:03:18:
int a, b, c;
sscanf("2006:03:18", "%d:%d:%d", a, b, c);
以及2006:03:18 - 2006:04:18:
char sztime1[16] = "", sztime2[16] = "";
sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2);
但是后來,我需要處理2006:03:18-2006:04:18
僅僅是取消了‘-’兩邊的空格,卻打破了%s對字符串的界定。
我需要重新設計一個函數來處理這樣的情況?這并不復雜,但是,為了使所有的代碼都有統一的風格,我需要改動很多地方,把已有的sscanf替換成我自己的分割函數。我以為我肯定需要這樣做,并伴隨著對sscanf的強烈不滿而入睡;一覺醒來,發現其實不必。
format-type中有%[]這樣的type field。如果讀取的字符串,不是以空格來分隔的話,就可以使用%[]。
%[]類似于一個正則表達式。[a-z]表示讀取a-z的所有字符,[^a-z]表示讀取除a-z以外的所有字符。
所以那個問題也就迎刃而解了:
sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2);
在softmse (Jake) 的問題貼http://community.csdn.net/Expert/topic/4843/4843294.xml?temp=.4321558中 ,周星星給出了一個很cool的sscanf用例,而后通過學習,發現sscanf真棒,現做一總結。
scanf 原型:
# include ;
int scanf( const char *format, ... );
函數 scanf() 是從標準輸入流 stdin 中讀內容的通用子程序,可以讀入全部固有類型的數據并自動轉換成機內形式。scanf() 是 printf() 的補函數。
在 C99 中,format 用 restrict 修飾。
format 指向的控制串由以下三類字符組成:
● 格式說明符
● 空白符
● 非空白符
輸入格式說明符前綴為百分號(%),告訴 scanf() 下次讀入何種數據類型。這些格式說明符的清單如下表所示:
┏━━━━┯━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 代??碼 │? ?? ?? ?? ? 意? ?? ?? ?? ?? ?? ?? ?? ???義? ?? ?? ?? ? ┃
┠────┼────────────────────────────┨
┃? ?%a? ?│讀浮點值(僅適用于 C99)? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ? ┃
┃? ?%A? ?│讀浮點值(僅適用于 C99)? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ? ┃
┃? ?%c? ?│讀單字符? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%d? ?│讀十進制整數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???┃
┃? ?%i? ?│讀十進制、八進制、十六進制整數? ?? ?? ?? ?? ?? ?? ?? ???┃
┃? ?%e? ?│讀浮點數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%E? ?│讀浮點數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%f? ?│讀浮點數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%F? ?│讀浮點數(僅適用于 C99)? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ? ┃
┃? ?%g? ?│讀浮點數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%G? ?│讀浮點數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%o? ?│讀八進制數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ? ┃
┃? ?%s? ?│讀字符串? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%x? ?│讀十六進制數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???┃
┃? ?%X? ?│讀十六進制數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???┃
┃? ?%p? ?│讀指針值? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┃? ?%n? ?│至此已讀入值的等價字符數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???┃
┃? ?%u? ?│讀無符號十進制整數? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???┃
┃??%[ ]??│掃描字符集合? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???┃
┃? ?%%? ?│讀 % 符號(百分號)? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?┃
┗━━━━┷━━━━━━━━━━━━━━━━━━━━━━━━━━━━┛
例如: %s 表示讀串而 %d 表示讀整數。格式串的處理順序為從左到右,格式說明符逐一與變元表中的變元匹配。為了讀取長整數,可以將 l(ell) 放在格式說明符的前面;為了讀取短整數,可以將 h 放在格式說明符的前面。這些修飾符可以與 d、i、o、u 和 x 格式代碼一起使用。
默認情況下,a、f、e 和 g 告訴 scanf() 為 float 分配數據。 如果將 l(ell) 放在這些修飾符的前面,則 scanf() 為 double 分配數據。使用 L 就是告訴 scanf(),接收數據的變量是 long double 型變量。
如果使用的現代編譯器程序支持 1995 年增加的寬字符特性, 則可以與 c 格式代碼一起,用 l 修飾符說明類型 wchar_t 的寬字符指針;也可以與 s 格式代碼一起,用 l 修飾符說明寬字符串的指針。l 修飾符也可以用于修飾掃描集,以說明寬字符。
控制串中的空白符使 scanf() 在輸入流中跳過一個或多個空白行。空白符可以是空格(space)、制表符(tab)和新行符(newline)。 本質上,控制串中的空白符使 scanf() 在輸入流中讀,但不保存結果,直到發現非空白字符為止。
非空白符使 scanf() 在流中讀一個匹配的字符并忽略之。例如,"%d,%d" 使 scanf() 先讀入一個整數,讀入中放棄逗號,然后讀另一個整數。如未發現匹配,scanf() 返回。
scanf() 中用于保存讀入值的變元必須都是變量指針,即相應變量的地址。
在輸入流中,數據項必須由空格、制表符和新行符分割。逗號和分號等不是分隔符,比如以下代碼:
scanf( "%d %d", &r, &c );
將接受輸入 10 20,但遇到 10,20 則失敗。
百分號(%)與格式符之間的星號(*)表示讀指定類型的數據但不保存。因此,
scanf( "%d %*c %d", &x, &y );
對 10/20 的讀入操作中,10 放入變量 x,20 放入 y。
格式命令可以說明最大域寬。 在百分號(%)與格式碼之間的整數用于限制從對應域讀入的最大字符數。例如,希望向 address 讀入不多于 20 個字符時,可以書寫成如下形式:
scanf( "%20s", address );
如果輸入流的內容多于 20 個字符,則下次 scanf() 從此次停止處開始讀入。 若達到最大域寬前已遇到空白符,則對該域的讀立即停止;此時,scanf() 跳到下一個域。
雖然空格、制表符和新行符都用做域分割符號,但讀單字符操作中卻按一般字符處理。例如,對輸入流 "x y" 調用:
scanf( "%c%c%c", &a, &b, &c );
返回后,x 在變量 a 中,空格在變量 b 中,y 在變量 c 中。
注意,控制串中的其它字符,包括空格、制表符和新行符,都用于從輸入流中匹配并放棄字符,被匹配的字符都放棄。例如,給定輸入流 "10t20",調用:
scanf( "%dt%d", &x, &y );
將把 10 和 20 分別放到 x 和 y 中,t 被放棄,因為 t 在控制串中。
ANSI C 標準向 scanf() 增加了一種新特性,稱為掃描集(scanset)。 掃描集定義一個字符集合,可由 scanf() 讀入其中允許的字符并賦給對應字符數組。 掃描集合由一對方括號中的一串字符定義,左方括號前必須綴以百分號。 例如,以下的掃描集使 scanf() 讀入字符 A、B 和 C:
%[ABC]
使用掃描集時,scanf() 連續吃進集合中的字符并放入對應的字符數組,直到發現不在集合中的字符為止(即掃描集僅讀匹配的字符)。返回時,數組中放置以 null 結尾、由讀入字符組成的字符串。
用字符 ^ 可以說明補集。把 ^ 字符放為掃描集的第一字符時,構成其它字符組成的命令的補集合,指示 scanf() 只接受未說明的其它字符。
對于許多實現來說,用連字符可以說明一個范圍。 例如,以下掃描集使 scanf() 接受字母 A 到 Z:
%[A-Z]
重要的是要注意掃描集是區分大小寫的。因此,希望掃描大、小寫字符時,應該分別說明大、小寫字母。
scanf() 返回等于成功賦值的域數的值,但由于星號修飾符而讀入未賦值的域不計算在內。給第一個域賦值前已出錯時,返回 EOF。
C99 為 scanf() 增加了幾個格式修飾符:hh、ll、j、z 和 t。hh 修飾符可用于 d、i、o、u、x、X 或 n。它說明相應的變元是 signed 或 unsigned char 值,或用于 n 時, 相應的變元是指向 long char 型變量的指針。ll 修飾符也可用于 d、i、o、u、x、X 或 n。它說明相應的變元是 signed 或者 unsigned long long int 值。
j 格式修飾符應用于 d、i、o、u、x、X 或 n,說明匹配的變元是類型 intmax_t 或 uintmax_t。這些類型在 ; 中聲明,并說明最大寬度的整數。
z 格式修飾符應用于 d、i、o、u、x、X 或 n,說明匹配的變元是指向 size_t 類型對象的指針。該類型在 ; 中聲明,并說明 sizeof 的結構。
t 格式修飾符應用于 d、i、o、u、x、X 或 n,說明匹配的變元是指向 ptrdiff_t??類型對象的指針。該類型在 ; 中聲明,并說明兩個指針之間的差別。
例子:
# include ;
int main( void )
{
char str[80], str2[80];
int i;
/* read a string and a integer */
scanf( "%s%d", str, &i );
/* read up to 79 chars into str */
scanf( "%79s", str );
/* skip the integer between the two strings */
scanf( "%s%*d%s", str, str2 );
return 0;
}
總結
以上是生活随笔為你收集整理的java sscanf_sscanf 详细说明的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java xslt 数据转换_如何将xs
- 下一篇: cmd 调试java_JAVA学习笔记(