字符串
创建字符向量 通过将字符序列括在单引号中来创建一个字符向量。 chr = 'Hello, world' chr = 'Hello, world' 字符向量为 char 类型的 1×n 数组。在计算机编程中,字符串是表示 1×n 字符数组的常用术 语。但是,从 R2016b 开始,MATLAB 同时提供 string 数据类型,因此 1×n 字符数组在 MATLAB 文档中称为字符向量。 whos chr Name Size Bytes Class Attributes chr 1x12 24 char 如果文本包含单个引号,请在分配字符向量时放入两个引号。 newChr = 'You''re right' newChr = 'You're right' uint16 等函数将字符转换为其数值代码。 chrNumeric = uint16(chr) chrNumeric = 1×12 uint16 row vector 72 101 108 108 111 44 32 119 111 114 108 100 char 函数将整数向量重新转换为字符。 chrAlpha = char([72 101 108 108 111 44 32 119 111 114 108 100])
要将字符向量合并到二维字符数组中,请使用方括号或 char 函数。 • 应用 MATLAB 串联运算符 []。使用分号 (;) 分隔每一行。每一行都必须包含相同数量的字 符。例如,合并长度相同的三个字符向量: devTitle = ['Thomas R. Lee'; ... 'Sr. Developer'; ... 'SFTware Corp.'] devTitle = 3×13 char array 'Thomas R. Lee' 'Sr. Developer' 'SFTware Corp.' 如果字符向量的长度不同,请根据需要用空格字符填充。例如: mgrTitle = ['Harold A. Jorgensen '; ... 'Assistant Project Manager'; ... 'SFTware Corp. ']
调用 char 函数。如果字符向量的长度不同,char 将用尾随空格填充较短的向量,以使每 一行具有相同数量的字符。 mgrTitle = char('Harold A. Jorgensen', ... 'Assistant Project Manager', 'SFTware Corp.') mgrTitle = 3×25 char array 'Harold A. Jorgensen ' 'Assistant Project Manager' 'SFTware Corp. '
水平合并字符向量 要将字符向量合并到一个行向量中,请使用方括号或 strcat 函数。 • 应用 MATLAB 串联运算符 []。用逗号或空格分隔输入字符向量。此方法可保留输入数组中 的任何尾随空格。 name = 'Thomas R. Lee'; title = 'Sr. Developer'; company = 'SFTware Corp.'; fullName = [name ', ' title ', ' company] MATLAB 返回 fullName = 'Thomas R. Lee, Sr. Developer, SFTware Corp.'
调用串联函数 strcat。此方法可删除输入中的尾随空格。例如,组合字符向量以创建一个 假设的电子邮件地址。 name = 'myname '; domain = 'mydomain '; ext = 'com '; address = strcat(name, '@', domain, '.', ext) address = 'myname@mydomain.com'
使用以下任何函数标识字符数组,或者标识字符数组中的某些字符。 函数 说明 ischar 确定输入是否为字符数组 isletter 查找输入字符数组中的所有英文字母 isspace 查找输入字符数组中的所有空格字符 isstrprop 查找特定类别的所有字符 查找字符向量中的空格。 chr = 'Find the space characters in this character vector'; % | | | | | | | % 5 9 15 26 29 34 44 find(isspace(chr)) ans = 5 9 15 26 29 34 44
使用空格字符 blanks 函数会创建一个包含空字符的字符向量。创建一个包含 15 个空格字符的向量。字符 向量始终会显示在单引号之间。 chr = blanks(15) chr = ' ' 在空白字符向量的中间插入一些非空格字符。 chr(6:10) = 'AAAAA' chr = ' AAAAA ' 您可以使用 strjust 函数将这些字符的位置向左或向右对齐: chrLeft = strjust(chr,'left') chrLeft = 'AAAAA ' chrRight = strjust(chr,'right') chrRight = ' AAAAA' 使用 deblank 删除所有尾随空格字符: chrDeblank = deblank(chr) chrDeblank = ' AAAAA' 使用 strtrim 删除所有前导和尾随空格: chrTrim = strtrim(chr) chrTrim = 'AAAAA'
字符数组中的数据 有时,字符表示的数据并不对应到文本,例如 DNA 序列。您可以将此类数据存储在数据类型 为 char 的字符数组中。字符数组使用单引号。 seq = 'GCTAGAATCC'; whos seq Name Size Bytes Class Attributes seq 1x10 20 char 数组的每个元素都包含单个字符。 seq(4) ans = 'A' 使用方括号串联字符数组,就像串联数值数组一样。 seq2 = [seq 'ATTAGAAACC'] seq2 = 'GCTAGAATCCATTAGAAACC' 在字符串数组引入之前编写的程序中,字符数组很常见。接受 string 数据的所有 MATLAB 函 数都能接受 char 数据,反之亦然
创建字符串数组 R2016b 中引入了字符串数组。字符串数组可存储文本片段,并提供一组用于将文本按数据进 行处理的函数。您可以对字符串数组进行索引、重构和进行串联,就像处理任何其他类型的数 组一样。此外,还可以访问字符串中的字符,并使用 plus 运算符向字符串追加文本。要重新 排列字符串数组中的字符串,请使用 split、 join 和 sort 等函数。 根据变量创建字符串数组 MATLAB® 提供字符串数组来存储文本片段。字符串数组的每个元素都包含一个 1×n 字符序 列。 从 R2017a 开始,您可以使用双引号创建字符串。
当您处理文本时,将字符序列括在双引号中。可以将文本赋给变量。 t = "Hello, world"; 如果文本包含双引号,请在定义中使用两个双引号。 q = "Something ""quoted"" and something else." q = "Something "quoted" and something else."
作为备选方法,您可以使用 string 函数将字符向量转换为字符串。 chr 为一个 1×17 字符向 量。 str 为一个与该字符向量具有相同文本的 1×1 字符串。 chr = 'Greetings, friend' chr = 'Greetings, friend' str = string(chr) str = "Greetings, friend" 使用 [] 运算符创建一个包含多个字符串的字符串数组。 str 是一个 2×3 字符串数组,其中包 含六个字符串。 str = ["Mercury","Gemini","Apollo"; "Skylab","Skylab B","ISS"] str = 2x3 string array "Mercury" "Gemini" "Apollo" "Skylab" "Skylab B" "ISS"
作为备选方法,您可以使用 string 函数将字符向量元胞数组转换为字符串数组。MATLAB 使 用双引号显示字符串数组中的字符串,使用单引号显示元胞数组中的字符向量。 C = {'Mercury','Venus','Earth'} C = 1x3 cell array {'Mercury'} {'Venus'} {'Earth'} str = string(C) str = 1x3 string array "Mercury" "Venus" "Earth"
要将文本添加到字符串的末尾,请使用加号运算符 +。 f = 71; c = (f-32)/1.8; tempText = "Temperature is " + c + "C" tempText = "Temperature is 21.6667C"
与数值数组类似,字符串数组可以有多个元素。使用 strlength 函数求数组中每个字符串的长 度。 A = ["a","bb","ccc"; "dddd","eeeeee","fffffff"] A = 2×3 string array
strlength(A)
除了字符向量,您还可以使用 string 函数将数值、日期时间、持续时间和分类值转换为字符 串。 将数值数组转换为字符串数组。 X = [5 10 20 3.1416]; string(X) ans = 1x4 string array "5" "10" "20" "3.1416"
将日期时间值转换为字符串。 d = datetime('now'); string(d) ans = "03-Feb-2019 10:12:54"
将字符串串联到字符串数组中 将字符串串联到字符串数组中,就像您串联任何其他类型的数组一样。 使用方括号 [] 串联两个字符串数组。 str1 = ["Mercury","Gemini","Apollo"]; str2 = ["Skylab","Skylab B","ISS"]; str = [str1 str2] str = 1x6 string array "Mercury" "Gemini" "Apollo" "Skylab" "Skylab B" "ISS" 转置 str1 和 str2。将它们进行串联,然后将列标题垂直串联到字符串数组上。当您将字符向 量串联到字符串数组中时,字符向量会自动转换为字符串。 str1 = str1'; str2 = str2'; str = [str1 str2]; str = [["Mission:","Station:"] ; str] str = 4x2 string array "Mission:" "Station:" "Mercury" "Skylab" "Gemini" "Skylab B" "Apollo" "ISS"
字符串相关函数
字符串数组
字符串数组 | |
创建不包含字符的字符串数组 | |
合并字符串 |
字符数组
字符数组 | |
转换为字符向量元胞数组 | |
创建空白字符数组 | |
创建换行符 |
字符或字符串数组
将数据格式化为多个字符串 | |
将数据格式化为字符串或字符向量 | |
水平串联字符串 | |
合并字符串 |
转换输入参数
将字符数组转换为字符串数组,其他数组不变 | |
将字符串数组转换为字符数组,其他数组不变 | |
在元胞数组或结构体的任何级别转换字符串数组 |
在数值和字符串之间转换
双精度数组 | |
字符串数组 | |
将字符串转换为双精度值 | |
将数字转换为字符数组
|
确定输入是否为字符数组 | |
确定输入是否为字符向量元胞数组 | |
确定输入是否为字符串数组 | |
确定输入是否为包含一个元素的字符串数组 |
文本属性
字符串长度 | |
确定输入字符串中的哪些字符属于指定类别 | |
确定哪些字符为字母 | |
确定哪些字符是空白字符 |
查找
确定字符串中是否有模式 | |
计算字符串中模式的出现次数 | |
确定字符串是否以模式结尾 | |
确定字符串是否以模式开头 | |
在其他字符串中查找字符串 | |
从字符串读取格式化数据 |
替换
查找并替换一个或多个子字符串 | |
替换起点和终点之间的子字符串 | |
查找并替换子字符串
|
合并字符串 | |
在分隔符处拆分字符串 | |
在换行符处拆分字符串 | |
联接数组中的字符串 | |
在指定分隔符处拆分字符串或字符向量 | |
所选的字符串部分 |
删除字符串内的子字符串 | |
删除起点和终点之间的子字符串 | |
提取指定位置后的子字符串 | |
提取指定位置前的子字符串 | |
提取起点和终点之间的子字符串 | |
在指定的子字符串后插入字符串 | |
在指定的子字符串前插入字符串 | |
为字符串添加前导或尾随字符 | |
删除字符串中的前导和尾随字符 | |
将字符串转换为小写 | |
将字符串转换为大写 | |
反转字符串中的字符顺序 | |
删除字符串末尾的尾随空白 | |
从字符串中删除前导和尾随空白 | |
对齐字符串
|
比较字符串 | |
比较字符串(不区分大小写) | |
比较字符串的前 n 个字符(区分大小写) | |
比较字符串的前 n 个字符(不区分大小写) |
匹配正则表达式(区分大小写) | |
匹配正则表达式(不区分大小写) | |
使用正则表达式替换文本 | |
将文本转换为正则表达式 |
数值类型
整数和浮点数据
MATLAB® 中的数值类包括有符号和无符号整数、单精度和双精度浮点数。
默认情况下,MATLAB 以双精度浮点形式存储所有数值。(您不能更改默认类型和精度。)您可以选择以整数或单精度形式存储任何数值或数值数组。
与双精度数组相比,以整数和单精度数组形式存储数据更节省内存。
所有数值类型都支持基本的数组运算,例如添加下标、重构和数学运算。
函数
双精度数组 | |
单精度数组 | |
8 位有符号整数数组 | |
16 位有符号整数数组 | |
32 位有符号整数数组 | |
64 位有符号整数数组 | |
8 位无符号整数数组 | |
16 位无符号整数数组 | |
32 位无符号整数数组 | |
64 位无符号整数数组 |
将变量转换为不同的数据类型 | |
在不更改基础数据的情况下转换数据类型 |
确定输入是否为整数数组 | |
确定输入是否为浮点数组 | |
确定输入是否为数值数组 | |
确定数组是否为实数数组 | |
确定数组元素是否为有限值 | |
确定数组元素是否为无限值 | |
判断查询数组元素是否包含 NaN 值 |
浮点相对精度 | |
浮点格式的最大连续整数 | |
创建所有值均为 Inf 的数组 | |
指定整数类型的最大值 | |
指定整数类型的最小值 | |
创建所有值均为 NaN 的数组 | |
最大的正浮点数 | |
最小的标准正浮点数
|
MATLAB 默认情况下以双精度浮点形式 (double) 存储数值数据。要以整数形式存储数据,您需要从 double 转换为所需的整数类型。使用上表中所示的转换函数之一。
例如,如果要以 16 位有符号整数形式存储赋给变量 x 的值 325,请键入
x = int16(325);
如果要转换为整数的数值带有小数部分,MATLAB 将舍入到最接近的整数。如果小数部分正好是 0.5,则 MATLAB 会从两个同样临近的整数中选择绝对值大小更大的整数:
x = 325.499; int16(x) ans = int16 325 x = x + .001; int16(x) ans = int16 326
在将其他类(例如字符串)转换为整数时,这些整数转换函数也很有用:
str = 'Hello World'; int8(str) ans = 1×11 int8 row vector 72 101 108 108 111 32 87 111 114 108 100
如果您将 NaN 值转换为整数类,则结果为该整数类中的 0 值。例如,
int32(NaN) ans = int32 0
数值的显示格式 默认显示 默认情况下,MATLAB® 将数值输出显示为 5 位数的定标定点值。您可以将数值的显示方式更改为以下任意方式:
5 位数的定标定点、浮点或这两种方式中的最佳方式
15 位数的定标定点、浮点或这两种方式中的最佳方式
小整数的比率
十六进制(以 16 为基数)
Bank 表示法
format 参考页中列出了所有可用格式。
要更改数值显示设置,请使用 format 函数或预设对话框(可通过 MATLAB 文件菜单访问)。format 函数只在单个 MATLAB 会话期间更改数值的显示方式, 而您的“预设”设置则会从一个会话到下一个会话都保持活动状态。这些设置仅影响数值的显示方式,而不影响 MATLAB 计算或保存数值的方式。 为 x 设置一个整数值并以十六进制(以 16 为基数)格式显示:
format hex x = uint32(876543210) x = 343efcea
将格式设置为 5 位数的浮点格式:
format short e x x = 1.3333e+00 1.2345e-06
设置 x 的值并以 5 位数的定标定点格式显示:
x = [4/3 1.2345e-6] x = 1.3333 0.0000
确定数值类 您可以使用以下任意命令检查变量 x 的数据类型。
whos x
显示 x 的数据类型。
xType = class(x);
将 x 的数据类型赋予变量。
isnumeric(x)
确定 x 是否为数值类型。
isa(x, 'integer') isa(x, 'uint64') isa(x, 'float') isa(x, 'double') isa(x, 'single')
确定 x 是否为指定的数值类型。(此处显示了任意整数、无符号的 64 位整数、任意浮点数、双精度数和单精度数的示例)。
isreal(x)
确定 x 是实数还是复数。
isnan(x)
确定 x 是否不是数值 (NaN)。
isinf(x)
确定 x 是否为无限值。
isfinite(x)
确定 x 是否为有限值。
合并不同的整数类型 概述 如果您在矩阵中合并不同的整数类型(例如有符号与无符号,或 8 位整数与 16 位整数),MATLAB® 将返回所有元素都属于一个公共类型的矩阵。MATLAB 将生成矩阵的所有元素设置为输入矩阵中的最左侧元素的数据类型。例如,以下串联生成由 3 个 16 位有符号整数组成的向量:
A = [int16(450) uint8(250) int32(1000000)] 合并不同大小的整数的示例 禁用如上所示的整数串联警告后,一次串联下面的两个数字,然后转换它们的顺序。返回值取决于整数的串联顺序。最左侧的类型决定着向量中的所有元素的数据类型:
A = [int16(5000) int8(50)] A = 5000 50
B = [int8(50) int16(5000)] B = 50 127 第一个操作返回由 16 位整数组成的向量。第二个操作返回由 8 位整数组成的向量。元素 int16(5000) 设置为 127,即 8 位有符号整数的最大值。
相同规则也适用于垂直串联:
C = [int8(50); int16(5000)] C = 50 127 合并有符号与无符号整数的示例 现在使用有符号与无符号整数做相同的练习。同样,最左侧的元素决定着生成矩阵中的所有元素的数据类型:
A = [int8(-100) uint8(100)] A = -100 100
B = [uint8(100) int8(-100)] B = 100 0 元素 int8(-100) 设为零,因为它不再有符号。
MATLAB 在将每个元素串联为一个合并数组之前计算每个元素。换句话说,在合并两个元素前,以下语句的计算结果为一个 8 位有符号整数(等于 50)和一个 8 位无符号整数(无符号的 -50 设为零)。按照该串联,第二个元素保留其零值,但采用无符号 int8 类型:
A = [int8(50), uint8(-50)] A = 50 0
数据类型检测函数
函数
确定输入是否为日历持续时间数组 | |
确定输入是否为分类数组 | |
确定输入是否为元胞数组 | |
确定输入是否为字符向量元胞数组 | |
确定输入是否为字符数组 | |
确定输入是否为日期时间数组 | |
确定输入是否为持续时间数组 | |
确定变量是否为枚举 | |
确定输入是否为浮点数组 | |
对有效的图形对象句柄为 True | |
确定输入是否为整数数组 | |
确定输入是否为 Java 对象 | |
确定输入是否为逻辑数组 | |
确定输入是否为数值数组 | |
确定输入是否为 MATLAB 对象 | |
确定数组是否为实数数组 | |
确定输入是否为字符串数组 | |
确定输入是否为结构体数组 | |
确定输入是否为表 | |
确定输入是否为时间表 |
检测状态 | |
确定输入是否具有指定数据类型 | |
对象的类 | |
检查数组的有效性 | |
列出工作区中的变量及大小和类型 |
数据类型转换
数值数组、字符数组、元胞数组、结构体或表格之间的转换
函数
字符数组 | |
转换为字符向量元胞数组 | |
将整数转换为字符 | |
将矩阵转换为字符 | |
将数字转换为字符数组 | |
将字符串转换为双精度值 | |
将字符数组或字符串转换为数值数组 | |
将数值字节转换为 Unicode 字符表示形式 | |
将 Unicode 字符表示形式转换为数值字节 |
将以 N 为基数表示数字的文本转换为十进制数字 | |
将用文本表示的二进制数字转换为十进制数字 | |
将十进制数字转换为以 N 为基数的数字的字符向量 | |
将十进制数字转换为表示二进制数字的字符向量 | |
将十进制数字转换为表示十六进制数字的字符向量 | |
将十六进制数字的文本表示形式转换为十进制数字 | |
将 IEEE 十六进制字符串转换为双精度数字 | |
将单精度和双精度值转换成 IEEE 十六进制字符串 |
将表转换为同构数组 | |
将表转换为元胞数组 | |
将表转换为结构体数组 | |
将同构数组转换为表 | |
将元胞数组转换为表 | |
将结构体数组转换为表 |
将元胞数组转换为基础数据类型的普通数组 | |
将元胞数组转换为结构体数组 | |
将数组转换为在元胞中包含子数组的元胞数组 | |
将数组转换为相同大小的元胞数组 | |
将结构体转换为元胞数组 |
函数摘要 此表中列出的函数提供了多种将数值数据转换为字符数组的方法。
函数 | 说明 | 示例 |
char | 将正整数转换为等效的字符。(截断任何小数部分。) | [72 105] → 'Hi' |
string | 将包含双精度值的数组转换为字符串数组。 | [72 105] → "72" "105" [3.1416 2.178] → "3.1416" "2.178" |
int2str | 将正整数或负整数转换为字符类型。(对任何小数部分 四舍五入。) | [72 105] → '72 105' |
num2str | 将数值类型转换为指定精度和格式的字符类型。 | [72 105] → '72/105/' (格式设置为 %1d/) |
mat2str | 将数值类型转换为指定精度的字符类型,并返回 MATLAB 可以计算的字符向量。 | [72 105] → '[72 105]' |
dec2hex | 将正整数转换为字符类型的十六进制基数。 | [72 105] → '48 69' |
dec2bin | 将正整数转换为字符类型的二进制基数。 | [72 105] → '1001000 1101001' |
dec2base | 将正整数转换为字符类型的数字,基数可从 2 到 36。 | [72 105] → '110 151' |
将数字转换为字符代码 char 函数将整数转换为 Unicode 字符代码,并返回由对等字符构成的字符数组: 6 字符和字符串 6-56x = [77 65 84 76 65 66]; char(x) ans = 'MATLAB'
将数字表示为文本 int2str、 num2str 和 mat2str 函数将数值表示为文本,其中每个字符表示输入值中一位单 独的数字。 int2str 和 num2str 函数常被用来为绘图添加标签。例如,下列线条使用 num2str 为绘图的 x 轴准备自动化标签: function plotlabel(x, y) plot(x, y) chr1 = num2str(min(x)); chr2 = num2str(max(x)); out = ['Value of f from ' chr1 ' to ' chr2];
转换为特定基数 另一类转换函数将数值更改为字符数组,将十进制值用另一种基数形式表示,例如二进制或十 六进制表示形式。这些函数包括 dec2hex、 dec2bin 和 dec2base。
函数摘要 此表中列出的函数提供了多种将字符数组转换为数值数据的方法。
函数 | 说明 | 示例 |
uintN(例如 uint8) | 将字符转换为表示该字符的整数代码。 | 'Hi' → 72 105 |
str2num | 将字符类型转换为数值类型。 | '72 105' → [72 105] |
str2double | 与 str2num 类似,但提供更佳的性能,用于处理 字符串数组和字符向量元胞数组。 | "72" "105" → [72 105] {'72' '105'} → [72 105] |
hex2num | 将数值类型转换为指定精度的字符类型,并返回 MATLAB 可以计算的字符数组。 | 'A' → '-1.4917e-154' |
hex2dec | 将数值类型的十六进制基数转换为正整数。 | 'A' → 10 |
bin2dec | 将字符类型的二进制数字转换为十进制数字。 | '1010' → 10 |
base2dec | 将字符类型的 2 到 36 内任何进制的数字转换为十 进制数字。 | '12' → 10 (如果 base == 8) |
从特定基数转换 要将非十进制数字的字符表示转换为该数字的值,请使用以下函数之一:hex2num、 hex2dec、 bin2dec 或 base2dec。 hex2num 和 hex2dec 函数都接受十六进制(以 16 为基数)输入,但 hex2num 返回它表 示的 IEEE 双精度浮点数,而 hex2dec 则将输入转换为十进制整数