一、简介

NSScanner是一个类,用于在字符串中扫描指定的字符,尤其是把它们翻译/转换为数字和别的字符串。可以在创建NSScaner时指定它的string属性,然后scanner会按照你的要求从头到尾地扫描这个字符串的每个字符。

1、NSScanner类是一个类簇的抽象父类,该类簇为一个从NSString对象扫描值的对象提供了程序接口。
2、NSScanner对象把NSString 对象的的字符解释和转化成 number和string 类型的值。在创建NSScanner对象的时候为它分配字符(string ),当你从NSScanner对象获取内容的时候,它会从头到尾遍历字符串(string)。
3、由于类簇的属性, scanner对象并不是 NSScanner类的实例,而是它一个私有子类的实例。尽管scanner对象的类是私有的,但是它的接口是公开的(抽象父类已经声明)。
4、NSScanner 的原始方法是string和Configuring a Scanner方法下面列举的所有的方法。
5、在 NSScanner 对象扫描字符串的时候,你可以通过设置属性charactersToBeSkipped忽略某些字符。在扫描字符串之前,那些位于忽略字符集中的字符将会被跳过。默认的忽略字符是空格和回车字符。
6、可以通过[[scanner string] substringFromIndex:[scanner scanLocation]]获取未扫描的字符串。

二、常用的属性和方法

1、Scanner的创建

//返回值是 扫描过aString字符串的NSScanner 对象,该方法通过调用initWithString设置扫描字符串
+ (instancetype)scannerWithString:(NSString *)aString;

//返回值是 通过用户默认的 locale方式扫描字符串的NSScanner 对象,该方法也是通过调用initWithString设置扫描字符串
+ (id)localizedScannerWithString:(NSString *)aString;

//返回值是NSScanner 对象,该对象通过扫描aString完成初始化
- (instancetype)initWithString:(NSString *)aString;

2、属性解释

@property(readonly, copy) NSString *string;

//下次扫描开始的位置,如果该值超出了string的区域,将会引起NSRangeException,该属性在发生错误后重新扫描时非常有用。(这个方法不是只读的,可自定义扫描位置)
@property NSUInteger scanLocation;

//是否区分字符串中大小写的标志。默认为NO,注意:该设置不会应用到被跳过的字符集。
@property BOOL caseSensitive;

//在扫描时被跳过的字符集,默认是空白格和回车键。被跳过的字符集优先于扫描的字符集:例如一个scanner被跳过的字符集为空格,通过scanInt:去查找字符串中的整型数时,首先做的不是扫描,而是跳过空格,直到找到十进制数据或者其他的字符。在字符被扫描的时候,跳过功能就失效了。如果你扫描的字符和跳过的字符是一样的,结果将是未知的。被跳过的字符是一个唯一值,scanner不会将忽略大小写的功能应用于它,也不会用这些字符做一些组合,如果在扫描字符换的时候你想忽略全部的元音字符,就要这么做(比如:将字符集设置成“AEIOUaeiou”};
@property(copy) NSCharacterSet *charactersToBeSkipped;

//scanner 的locale对它从字符串中区分数值产生影响,它通过locale的十进制分隔符区分浮点型数据的整数和小数部分。一个没有locale的scanner用非定域值。新的scanner若没有设置locale,使用默认locale。
@property(retain) id locale;

3、方法解释

- (BOOL)scanCharactersFromSet:(NSCharacterSet *)scanSet   intoString:(NSString * _Nullable *)stringValue;  
- (BOOL)scanUpToCharactersFromSet:(NSCharacterSet *)stopSet    intoString:(NSString * _Nullable *)stringValue;  
- (BOOL)scanString:(NSString *)string  intoString:(NSString * _Nullable *)stringValue;  
- (BOOL)scanUpToString:(NSString *)stopString   intoString:(NSString * _Nullable *)stringValue;  
- (BOOL)scanDecimal:(NSDecimal *)decimalValue;  
- (BOOL)scanDouble:(double *)doubleValue;  
- (BOOL)scanFloat:(float *)floatValue;  
- (BOOL)scanHexDouble:(double *)result;  
- (BOOL)scanHexFloat:(float *)result;  
- (BOOL)scanHexInt:(unsigned int *)intValue;  
- (BOOL)scanHexLongLong:(unsigned long long *)result;  
- (BOOL)scanInt:(int *)intValue;  
- (BOOL)scanInteger:(NSInteger *)value;  
- (BOOL)scanUnsignedLongLong:(unsigned long long *)unsignedLongLongValue;  
@property(getter=isAtEnd, readonly) BOOL atEnd;

1、scanCharactersFromSet:intoString:扫描字符串中和NSCharacterSet字符集中匹配的字符,是按字符单个匹配的,例如,NSCharacterSet字符集为@”test123Dmo”,scanner字符串为 @” 123test12Demotest”,那么字符串中所有的字符都在字符集中,所以指针指向的地址存储的内容为”123test12Demotest”

2、scanUpToCharactersFromSet:intoString:扫描字符串直到遇到NSCharacterSet字符集的字符时停止,指针指向的地址存储的内容为遇到跳过字符集字符之前的内容
scanString:intoString:从当前的扫描位置开始扫描,判断扫描字符串是否从当前位置能扫描到和传入字符串相同的一串字符,如果能扫描到就返回YES,指针指向的地址存储的就是这段字符串的内容。例如scanner的string内容为123abc678,传入的字符串内容为abc,如果当前的扫描位置为0,那么扫描不到,但是如果将扫描位置设置成3,就可以扫描到了。

3、scanUpToString:intoString:从当前的扫描位置开始扫描,扫描到和传入的字符串相同字符串时,停止,指针指向的地址存储的是遇到传入字符串之前的内容。例如scanner的string内容为123abc678,传入的字符串内容为abc,存储的内容为123

4、:扫描NSDecimal类型的值,有关NSDecimal类型的值更多的信息可以查看:NSDecimalNumber

5、scanDouble :扫描双精度浮点型字符,溢出和非溢出都被认为合法的浮点型数据。在溢出的情况下scanner将会跳过所有的数字,所以新的扫描位置将会在整个浮点型数据的后面。double指针指向的地址存储的数据为扫描出的值,包括溢出时的HUGE_VAL或者 –HUGE_VAL,即未溢出时的0.0。

6、scanFloat:扫描单精度浮点型字符,具体内容同scanDouble

7、scanHexDouble: 扫描双精度的十六进制类型,溢出和非溢出都被认为合法的浮点型数据。在溢出的情况下scanner将会跳过所有的数字,所以新的扫描位置将会在整个浮点型数据的后面。double指针指向的地址存储的数据为扫描出的值,包括溢出时的HUGE_VAL或者 –HUGE_VAL,即未溢出时的0.0。数据接收时对应的格式为 %a 或%A ,双精度十六进制字符前面一定要加 0x或者 0X。

8、scanHexInt 扫描十六进制无符整型,unsigned int指针指向的地址值为 扫描到的值,包含溢出时的UINT_MAX。

9、scanHexLongLong 同scanHexDouble
scanInt 扫描整型,溢出也被认为是有效的整型,int 指针指向的地址的值为扫描到的值,包含溢出时的INT_MAX或INT_MIN。

10、scanInteger 同scanInt

11、scanLongLong 扫描LongLong 型,溢出也被认为是有效的整型,LongLong指针指向的地址的值为扫描到的值,包含溢出时的LLONG_MAX 或 LLONG_MIN。

三、使用

1、过滤常见的html标签

+ (NSString *)filterHtmlMark:(NSString *)htmlString
{
    NSScanner * scanner = [NSScanner scannerWithString:htmlString];
    NSString * text = nil;

    while([scanner isAtEnd] == NO)
    {
        [scanner scanUpToString:@"<" intoString:nil];
        [scanner scanUpToString:@">" intoString:&text];
        htmlString = [htmlString stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>",text] withString:@""];

    }
    NSString * regEx = @"<([^>]*)>";
    htmlString = [htmlString stringByReplacingOccurrencesOfString:regEx withString:@""];

    return htmlString;
}

2、过滤指定的html标签

+ (NSString *)removeHTML:(NSString *)html startStirng:(NSString *)startString endString:(NSString *)endString {

    NSScanner *theScanner;

    NSString *text = nil;

    theScanner = [NSScanner scannerWithString:html];

    while ([theScanner isAtEnd] == NO) {

        // find start of tag
        [theScanner scanUpToString:startString intoString:NULL] ;

        // find end of tag
        [theScanner scanUpToString:endString intoString:&text] ;


        // replace the found tag with a space
        //(you can filter multi-spaces out later if you wish)
        html = [html stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>", text] withString:@""];
    }
    return html;
}
1、过滤掉图片
 articleContent = [NSString removeHTML:articleContent startStirng:@"<img" endString:@">"];

2、过滤掉链接
    articleContent = [NSString removeHTML:articleContent startStirng:@"<link" endString:@">"];
    articleContent = [NSString removeHTML:articleContent startStirng:@"<TABLE" endString:@">"];

3、过滤掉空格
    articleContent = [articleContent stringByReplacingOccurrencesOfString:@" " withString:@""];

3、在段落首行插入空格,实现段落首行缩进

+ (NSString *)insertSpace:(NSString *)html startStirng:(NSString *)startString endString:(NSString *)endString {

    NSScanner *theScanner;

    NSString *text = nil;

    theScanner = [NSScanner scannerWithString:html];

    while ([theScanner isAtEnd] == NO) {

        // find start of tag
        BOOL result1 = [theScanner scanUpToString:startString intoString:NULL] ;

        // find end of tag
        BOOL result2 = [theScanner scanUpToString:endString intoString:&text] ;


        // replace the found tag with a space
        //(you can filter multi-spaces out later if you wish)

        if (result1 && result2) {

            NSString *str1 = [NSString stringWithFormat:@"%@>",text];
            NSString *str2 = [NSString stringWithFormat:@"%@>        ",text];

            html = [html stringByReplacingOccurrencesOfString:str1 withString:str2];

        }

    }
    return html;
}
contents = [NSString insertSpace2:contents startStirng:@"<p id=" endString:@">"];