一、概述

    字符串在JavaScript中几乎无处不在,在你处理用户的输入数据的时候,在读取或设置DOM对象的属性时,在操作cookie时,当然还有更多...。JavaScript的核心部分提供了一组属性和方法用于通用的字符串操作,如分割字符串,改变字符串的大小写,操作子字符串等。

    当前的大部分浏览器也能从强大的正则表达式获益,因为它极大地简化了大量的字符串操作任务,不过它也需要你克服一条有些陡峭的学习曲线。在这里,主要是介绍字符串本身的一些操作,正则表达式会在以后的随笔中涉及。


二、字符串的创建

    创建一个字符串有几种方法。最简单的是用引号将一组字符包含起来,可以将其赋值给一个字符串变量。

    var myStr = "Hello, String!";

    可以用双引号或单引号将字符串包含,但要注意,作为界定字符串的一对引号必须是相同的,不能混用。

    像var myString = "Fluffy is a pretty cat.'; 这样的声明就是非法的。

    允许使用两种引号,使得某些操作变得简单,比如将一种嵌入另外一种:

    document.write("<img src='img/logo.jpg' height='30' width='100' alt='Logo'>");


    我们在上面脚本创建了几个字符串,但本质上,它们并不是真正的字符串对象,准确地说,它们是字符串类型的值。要创建一个字符串对象,可使用如下语句:var strObj = new String("Hello, String!");

    使用typeof运算符查看会发现,上面的myStr类型为string,而strObj类型为object。


    如果想知道字符串的长度,使用其length属性:string.length。

    得到字符串的指定位置的字符使用方法:string.charAt(index);


三、字符串的拼接

问题:

    将两个或多个字符串拼接为一个大的字符串

解决方案:

    非常简单,就用一个"+"将两个字符串"相加":

    var longString = "One piece " + "plus one more piece.";

    要将多个字符串累积为一个字符串,还可以使用"+="操作符:

    var result = "";

    result += "My name is Anders"

    result += " and my age is 25";   


    要在字符串中添加换行符,需要使用转义字符"\n":

    var confirmString = "You did not enter a response to the last " +

        "question.\n\nSubmit form anyway?";

    var confirmValue = confirm(confirmString);

    但这种方法只能用在像警告、确认对话框之类的情况下,如果将这段文本作为HTML内容呈现,就无效了,此时用"<br>"代替它:

    var htmlString = "First line of string.<br>Second line of string.";

    document.write(htmlString);


    String对象还提供了方法concat(),它完成与"+"相同的功能:

    string.concat(value1, value2, ...)

    不过concat()方法显然不如"+"来得直观简洁。


四、访问字符串的子串

问题:

    获得一字符串的一部分的副本。

解决方案:

    使用substring()或slice()方法(NN4+, IE4+),下面说明它们的具体用法。

    substring()的原型为:  string.substring(from, to)

    第一个参数from指定了子字符串在原字符串中的起始位置(基于0的索引);第二个参数to是可选的,它指定了子字符串在原字符串的结束位置(基于0的索引),一般情况下,它应比from大,如果它被省略,那么子字符串将一直到原字符串的结尾处。

    如果参数from不小心比参数to大了会怎样?JavaScript会自动调解子字符串的起止位置,也就是说,substring()总是从两个参数中较小的那个开始,到较大的那个结束。不过要注意,它包含起始位置的那个字符,但不包含结束位置的那个字符。

var fullString = "Every dog has his day.";

var section = fullString.substring(0, 4); // section is "Ever".

section = fullString.substring(4, 0); // section is also "Ever".

section = fullString.substring(1, 1); // section is an empty string.

section = fullString.substring(-2, 4); // section is "Ever", same as fullString.substring(0, 4);

    slice()的原型为:  string.slice(start, end)

    参数start表示子串的起始位置,如果为负数,那么可以理解为倒数第几个开始,例如-3表示从倒数第三个开始;参数end表示结束位置,与start一样,它也可以为负数,其含义也表示到倒数第几个结束。slice()的参数可以为负数,所以要比substring()更加灵活,但没那么宽容了,如果start比end要大,它将返回一个空字符串(示例略)。

    还有一个方法是substr(),其原型为: string.substr(start, length)

    从原型可以看出它的参数的含义,start表示起始位置,length则表示子字符串的长度。JavaScript标准不提倡使用该方法。

五、字符串的大小写转换

问题:

    在你的页面上有文本框接收用户的输入信息,比如城市,然后你会根据他的城市的不同做不同的处理,这时自然会用到字符串比较,那么在比较前,最好进行大小写转换,这样只要考虑转换后的情形即可;或者要在页面上收集数据,然后将这些数据存储在数据库,而数据库恰好只接收大写字符;在这些情况下,我们都要考虑对字符串进行大小写转换。

解决方案:

    使用toLowerCase()和toUpperCase()方法:

    var city = "ShanGHai";

    city = city.toLowerCase();  // city is "shanghai" now.

六、判断两个字符串是否相等

问题:

    比如,你想拿用户的输入值与已知的字符串比较

解决方案:

    先将用户的输入值全部转换为大写(或小写),然后再行比较:

    var name = document.form1.txtUserName.value.toLowerCase();

    if(name == "urname")

    {

        // statements go here.

    }

    JavaScript有两种相等运算符。一种是完全向后兼容的,标准的"==",如果两个操作数类型不一致,它会在某些时候自动对操作数进行类型转换,考虑下面的赋值语句:

    var strA = "i love you!";

    var strB = new String("i love you!");

    这两个变量含有相同的字符序列,但数据类型却不同,前者为string,后者为object,在使用"=="操作符时,JavaScript会尝试各种求值,以检测两者是否会在某种情况下相等。所以下面的表达式结果为true: strA == strB。

    第二种操作符是"严格"的"===",它在求值时不会这么宽容,不会进行类型转换。所以表达式strA === strB的值为false,虽然两个变量持有的值相同。

    有时代码的逻辑要求你判断两个值是否不相等,这里也有两个选择:"!="和严格的"!==",它们的关系就类似于"=="和"==="。

讨论:

    "=="和"!="在求值时会尽可能地寻找值的匹配性,但你可能还是想在比较前进行显式的类型转换,以"帮助"它们完成工作。比如,如果想判断一个用户的输入值(字符串)是否等于一个数字,你可以让"=="帮你完成类型转换:

    if(document.form1.txtAge.value == someNumericVar) { ... }

    也可以提前转换:

    if(parseInt(document.form1.txtAge.value) == someNumericVar) { ... }

    如果你比较习惯于强类型的编程语言(比如C#,Java等),那么这里你可以延续你的习惯(类型转换),这样也会增强程序的可读性。


    有一种情况需要注意,就是计算机的区域设置。如果用"<"和">"来比较字符串,那么JavaScript把它们作为Unicode来比较,但显然,人们在浏览网页时不会把文本当作Unicode来阅读:) 比如在西班牙语中,按照传统的排序,"ch"将作为一个字符排在"c"和"d"之间。localeCompare()提供了一种方式,可以帮助你使用默认区域设置下的字符排序规则。

    var strings;  // 要排序的字符串数组,假设已经得到初始化

    strings.sort(function(a,b) { return a.localeCompare(b) });  // 调用sort()方法进行排序


七、字符串的查找

问题:

    判断一个字符串是否包含另一个字符串。

解决方案:

    使用string的indexOf()方法:

    strObj.indexOf(subString[, startIndex])

    strObj为要进行判断的字符串,subString为要在strObj查找的子字符串,startIndex是可选的,表示查找的开始位置(基于0的索引),如果startIndex省略,则从strObj开始处查找,如果startIndex小于0,则从0开始,如果startIndex大于最大索引,则从最大索引处开始。

    indexOf()返回strObj中subString的开始位置,如果没有找到,则返回-1。在脚本中,可以这么使用:

if(largeString.indexOf(shortString) != -1)

{

// 如果包含,进行相应处理;

}

    也许一个字符串会包含另一字符串不止一次,这时第二个参数startIndex也许会派上用场,下面这个函数演示如何求得一个字符串包含另外一个字符串的次数:

function countInstances(mainStr, subStr)

{

var count = 0;

var offset = 0;

do

{

offset = mainStr.indexOf(subStr, offset);

if(offset != -1)

{

count++;

offset += subStr.length;

}

}while(offset != -1)

return count;

}

    String对象有一个与indexOf()对应的方法,lastIndexOf():

    strObj.lastIndexOf(substring[, startindex])

    strObj为要进行判断的字符串,subString为要在strObj查找的子字符串,startIndex是可选的,表示查找的开始位置(基于0的索引),如果startIndex省略,则从strObj末尾处查找,如果startIndex小于0,则从0开始,如果startIndex大于最大索引,则从最大索引处开始。该方法自右向左查找,返回subString在strObj中最后出现的位置,如果没有找到,返回-1。


八、在Unicode值和字符串中的字符间转换

问题:

    获得一个字符的Unicode编码值,反之亦然。

解决方案:

    要获得字符的Unicode编码,可以使用string.charCodeAt(index)方法,其定义为:

    strObj.charCodeAt(index)

    index为指定字符在strObj对象中的位置(基于0的索引),返回值为0与65535之间的16位整数。例如:

    var strObj = "ABCDEFG";

    var code = strObj.charCodeAt(2); // Unicode value of character 'C' is 67

    如果index指定的索引处没有字符,则返回值为NaN。


    要将Unicode编码转换为一个字符,使用String.fromCharCode()方法,注意它是String对象的一个"静态方法",也就是说在使用前不需要创建字符串实例:

    String.fromCharCode(c1, c2, ...)

    它接受0个或多个整数,返回一个字符串,该字符串包含了各参数指定的字符,例如:

    var str = String.fromCharCode(72, 101, 108, 108, 111);  // str == "Hello"

讨论:

Unicode包含了这个世界上很多书写语言的字符集,但别因为Unicode包含一个字符就期望这个字符能够在警告对话框、文本框或页面呈现时正常显示。如果字符集不可用,在页面将显示为问号或其它符号。一台典型的北美的计算机将不能在屏幕上显示中文字符,除非中文的字符集及其字体已经安装。


    参考:

    JavaScript And Dhtml Cookbook(Oreilly)      ;

    JavaScript-The Definitive Guide(4th Edition);





虽然 JavaScript 有很多用处,但是处理字符串是其中最流行的一个。下面让我们深入地分析一下使用 JavaScript 操作字符串。在 JavaScript 中, String 是对象。 String 对象并不是以字符数组的方式存储的,所以我们必须使用内建函数来操纵它们的值。这些内建函数提供了不同的方法来访问字符串变量的内容。下面我们详细看一下这些函数。

包罗万象

操作字符串的值是一般的开发人员必须面临的家常便饭。操作字符串的具体方式有很多,比如说从一个字符串是提取出一部分内容来,或者确定一个字符串是否包含一个特定的字符。下面的 JavaScript 函数为开发人员提供了他们所需要的所有功能:

• concat() – 将两个或多个字符的文本组合起来,返回一个新的字符串。

• indexOf() – 返回字符串中一个子串第一处出现的索引。如果没有匹配项,返回 -1 。

• charAT() – 返回指定位置的字符。

• lastIndexOf() – 返回字符串中一个子串最后一处出现的索引,如果没有匹配项,返回 -1 。

• match() – 检查一个字符串是否匹配一个正则表达式。

• substring() – 返回字符串的一个子串。传入参数是起始位置和结束位置。

• replace() – 用来查找匹配一个正则表达式的字符串,然后使用新字符串代替匹配的字符串。

• search() – 执行一个正则表达式匹配查找。如果查找成功,返回字符串中匹配的索引值。否则返回 -1 。

• slice() – 提取字符串的一部分,并返回一个新字符串。

• split() – 通过将字符串划分成子串,将一个字符串做成一个字符串数组。

• length() – 返回字符串的长度,所谓字符串的长度是指其包含的字符的个数。

• toLowerCase() – 将整个字符串转成小写字母。

• toUpperCase() – 将整个字符串转成大写字母。

注意: concat 、 match 、 replace 和 search 函数是在 JavaScript 1.2 中加入的。所有其它函数在 JavaScript 1.0 就已经提供了。

下面让我们看一下如何在 JavaScript 使用这些函数。下面的代码是用到了前面提到的所有函数:

function manipulateString(passedString1, passedString2) {

var concatString;

// The string passed to concat is added to the end of the first string

concatString = passedString1.concat(passedString2);

alert(concatString);

// The following if statement will be true since first word is Tony

if (concatString.charAt(3) == "y") {

alert("Character found!");

}

// The last position of the letter n is 10

alert("The last index of n is: " + concatString.lastIndexOf("n"));

// A regular expression is used to locate and replace the substring

var newString = concatString.replace(/Tony/gi,"General");

// The following yields Please salute General Patton

alert("Please salute " + newString);

// The match function returns an array containing all matches found

matchArray = concatString.match(/Tony/gi);

for (var i=0; i<matchArray.length;i++) {

alert("Match found: " + matchArray[i]);

}

// Determine if the regular expression is found, a –1 indicates no

if (newString.search(/Tony/) == -1) {

alert("String not found");

} else {

alert("String found.");

}

// Extract a portion of the string and store it in a new variable

var sliceString = newString.slice(newString.indexOf("l")+2,newString.length);

alert(sliceString);

// The split function creates a new array containing each value separated by a space

stringArray = concatString.split(" ");

for (var i=0; i<stringArray.length;i++) {

alert(stringArray[i];

}

alert(newString.toUpperCase());

alert(newString.toLowerCase());

}

下面是执行上面的代码得到的结果:

Tony Patton

Character Found!

The last index of n is: 10

Match found: Tony

Please salute General Patton

String not found

Patton

Tony

Patton

GENERAL PATTON

general patton

示例代码把所有这些提到的函数都用到了。

特殊字符

除了这些函数之外,还有很多的特殊字符可以用来表示关键的效果。这些特殊字符包括:

• – 跳格键

• – 退格 / 删除

• – 回车

• – 换行

• f – 换页

特殊字符最常见的用途就是格式化输出。例如,你可能需要在输出中插入一个换行来正确地显示一个值。而且,在换行时也需要回车。在一些平台上,“ ”已经足够产生换行效果了,而在一些机器上要正确地显示一个换行则需要“ ”。下面的例子显示了在一个多行窗口上显示的特殊字符:

var output = null;

output = "Special Characters";

output += " ";

output += "===============";

output += " ";

output += "t - tab";

output += " ";

output += "b - backspace/delete";

output += " ";

output += "r - carriage return";

output += " ";

output += "n - newline";

output += " ";

output += "f - form feed";

output += " ";

alert(output);

前面的例子使用加号来连接字符串,而没有使用 concat 函数。原因很简单,对于 concat 函数来说,每一个操作都需要一个新的变量;反之,我们这里用的这种方法则简单地扩展了原有的值,而不需要新的变量。而且,示例中使用换码符来正确地显示特殊字符。系统将一个反斜线当作一个信号,认为它后面会跟一个特殊字符,但是连着两个反斜线则抵消这种操作。输出中的每个字符都通过 newline 特殊字符被显示在新的一行。

添加到工具箱中

特殊字符和函数可以与其它 JavaScript 技巧结合起来解决很多问题。其中一种情况是用来进行 JavaScript 客户端表单验证,这篇文章中提出的方法可以简单地用来实现表单验证。

下面的代码将在一个表单被提交时调用。要提交的表单包含三个域:名称、地址和邮政编码。为了实现起来比较简单,我们只验证每个域都不能为空,并且邮政编码必须是数字。下面的 JavaScript 代码完成这一功能:

function validation() {

var doc = document.forms[0];

var msg = "";

if (doc.Name.value == "") {

msg += "- Name is missing ";

}

if (doc.Address.value == "") {

msg += "- Address is missing ";

}

if (doc.ZipCode.value == "") {

msg += "- Zip code is missing ";

}

var zip = new String(doc.ZipCode.value);

if (zip.search(/^[0-9][0-9][0-9][0-9][0-9]$/)==-1) {

msg += "- Enter valid Zip code";

}

if (msg == "") {

doc.submit;

} else {

msg = "Please correct the following validation errors and re-submit: " + msg;

alert(msg);

}

}

在用户提交表单时,这个函数就会被调用。对函数的调用是在一个 HTML 按钮的 onSubmit 事件中实现的。

<input type="button" type="submit" value="submit" onClick="validation()">

验证函数检查每个域是否为空。如果发现了一个空值,那么就会在验证消息变量 msg 后面添加一个出错消息。此外,还使用了一个正则表达式来验证邮政编码域的格式。在这里,我们只接受五位数的美国地区邮政编码。如果发现有任何错误(即 msg 变量不为空),那么程序就会显示一个错误消息;否则的话,程序就会提交表单。

一门强大的语言

JavaScript 已经发展成熟为一种功能完备的语言,能够用来构建强大的应用程序。它是对具有非连接性天性的 Web 界面的一个完美的补充,能够在不与 Web 服务器交互的情况下完成很多客户端操作。