字符转化为数字python 字符转化为数字MATLAB

转载

liutao988 2024-01-17 21:59:01

文章标签 字符转化为数字python 字符串数组字符串数组 文章分类 Python 后端开发

字符串

创建字符向量通过将字符序列括在单引号中来创建一个字符向量。 chr = 'Hello, world' chr = 'Hello, world' 字符向量为 char 类型的 1×n 数组。在计算机编程中，字符串是表示 1×n 字符数组的常用术语。但是，从 R2016b 开始，MATLAB 同时提供 string 数据类型，因此 1×n 字符数组在 MATLAB 文档中称为字符向量。 whos chr Name Size Bytes Class Attributes chr 1x12 24 char 如果文本包含单个引号，请在分配字符向量时放入两个引号。 newChr = 'You''re right' newChr = 'You're right' uint16 等函数将字符转换为其数值代码。 chrNumeric = uint16(chr) chrNumeric = 1×12 uint16 row vector 72 101 108 108 111 44 32 119 111 114 108 100 char 函数将整数向量重新转换为字符。 chrAlpha = char([72 101 108 108 111 44 32 119 111 114 108 100])

要将字符向量合并到二维字符数组中，请使用方括号或 char 函数。 • 应用 MATLAB 串联运算符 []。使用分号 (;) 分隔每一行。每一行都必须包含相同数量的字符。例如，合并长度相同的三个字符向量： devTitle = ['Thomas R. Lee'; ... 'Sr. Developer'; ... 'SFTware Corp.'] devTitle = 3×13 char array 'Thomas R. Lee' 'Sr. Developer' 'SFTware Corp.' 如果字符向量的长度不同，请根据需要用空格字符填充。例如： mgrTitle = ['Harold A. Jorgensen '; ... 'Assistant Project Manager'; ... 'SFTware Corp. ']

调用 char 函数。如果字符向量的长度不同，char 将用尾随空格填充较短的向量，以使每一行具有相同数量的字符。 mgrTitle = char('Harold A. Jorgensen', ... 'Assistant Project Manager', 'SFTware Corp.') mgrTitle = 3×25 char array 'Harold A. Jorgensen ' 'Assistant Project Manager' 'SFTware Corp. '

水平合并字符向量要将字符向量合并到一个行向量中，请使用方括号或 strcat 函数。 • 应用 MATLAB 串联运算符 []。用逗号或空格分隔输入字符向量。此方法可保留输入数组中的任何尾随空格。 name = 'Thomas R. Lee'; title = 'Sr. Developer'; company = 'SFTware Corp.'; fullName = [name ', ' title ', ' company] MATLAB 返回 fullName = 'Thomas R. Lee, Sr. Developer, SFTware Corp.'

调用串联函数 strcat。此方法可删除输入中的尾随空格。例如，组合字符向量以创建一个假设的电子邮件地址。 name = 'myname '; domain = 'mydomain '; ext = 'com '; address = strcat(name, '@', domain, '.', ext) address = 'myname@mydomain.com'

使用以下任何函数标识字符数组，或者标识字符数组中的某些字符。函数说明 ischar 确定输入是否为字符数组 isletter 查找输入字符数组中的所有英文字母 isspace 查找输入字符数组中的所有空格字符 isstrprop 查找特定类别的所有字符查找字符向量中的空格。 chr = 'Find the space characters in this character vector'; % | | | | | | | % 5 9 15 26 29 34 44 find(isspace(chr)) ans = 5 9 15 26 29 34 44

使用空格字符 blanks 函数会创建一个包含空字符的字符向量。创建一个包含 15 个空格字符的向量。字符向量始终会显示在单引号之间。 chr = blanks(15) chr = ' ' 在空白字符向量的中间插入一些非空格字符。 chr(6:10) = 'AAAAA' chr = ' AAAAA ' 您可以使用 strjust 函数将这些字符的位置向左或向右对齐： chrLeft = strjust(chr,'left') chrLeft = 'AAAAA ' chrRight = strjust(chr,'right') chrRight = ' AAAAA' 使用 deblank 删除所有尾随空格字符： chrDeblank = deblank(chr) chrDeblank = ' AAAAA' 使用 strtrim 删除所有前导和尾随空格： chrTrim = strtrim(chr) chrTrim = 'AAAAA'

字符数组中的数据有时，字符表示的数据并不对应到文本，例如 DNA 序列。您可以将此类数据存储在数据类型为 char 的字符数组中。字符数组使用单引号。 seq = 'GCTAGAATCC'; whos seq Name Size Bytes Class Attributes seq 1x10 20 char 数组的每个元素都包含单个字符。 seq(4) ans = 'A' 使用方括号串联字符数组，就像串联数值数组一样。 seq2 = [seq 'ATTAGAAACC'] seq2 = 'GCTAGAATCCATTAGAAACC' 在字符串数组引入之前编写的程序中，字符数组很常见。接受 string 数据的所有 MATLAB 函数都能接受 char 数据，反之亦然

创建字符串数组 R2016b 中引入了字符串数组。字符串数组可存储文本片段，并提供一组用于将文本按数据进行处理的函数。您可以对字符串数组进行索引、重构和进行串联，就像处理任何其他类型的数组一样。此外，还可以访问字符串中的字符，并使用 plus 运算符向字符串追加文本。要重新排列字符串数组中的字符串，请使用 split、 join 和 sort 等函数。根据变量创建字符串数组 MATLAB® 提供字符串数组来存储文本片段。字符串数组的每个元素都包含一个 1×n 字符序列。从 R2017a 开始，您可以使用双引号创建字符串。

当您处理文本时，将字符序列括在双引号中。可以将文本赋给变量。 t = "Hello, world"; 如果文本包含双引号，请在定义中使用两个双引号。 q = "Something ""quoted"" and something else." q = "Something "quoted" and something else."

作为备选方法，您可以使用 string 函数将字符向量转换为字符串。 chr 为一个 1×17 字符向量。 str 为一个与该字符向量具有相同文本的 1×1 字符串。 chr = 'Greetings, friend' chr = 'Greetings, friend' str = string(chr) str = "Greetings, friend" 使用 [] 运算符创建一个包含多个字符串的字符串数组。 str 是一个 2×3 字符串数组，其中包含六个字符串。 str = ["Mercury","Gemini","Apollo"; "Skylab","Skylab B","ISS"] str = 2x3 string array "Mercury" "Gemini" "Apollo" "Skylab" "Skylab B" "ISS"

作为备选方法，您可以使用 string 函数将字符向量元胞数组转换为字符串数组。MATLAB 使用双引号显示字符串数组中的字符串，使用单引号显示元胞数组中的字符向量。 C = {'Mercury','Venus','Earth'} C = 1x3 cell array {'Mercury'} {'Venus'} {'Earth'} str = string(C) str = 1x3 string array "Mercury" "Venus" "Earth"

要将文本添加到字符串的末尾，请使用加号运算符 +。 f = 71; c = (f-32)/1.8; tempText = "Temperature is " + c + "C" tempText = "Temperature is 21.6667C"

与数值数组类似，字符串数组可以有多个元素。使用 strlength 函数求数组中每个字符串的长度。 A = ["a","bb","ccc"; "dddd","eeeeee","fffffff"] A = 2×3 string array

strlength(A)

除了字符向量，您还可以使用 string 函数将数值、日期时间、持续时间和分类值转换为字符串。将数值数组转换为字符串数组。 X = [5 10 20 3.1416]; string(X) ans = 1x4 string array "5" "10" "20" "3.1416"

将日期时间值转换为字符串。 d = datetime('now'); string(d) ans = "03-Feb-2019 10:12:54"

将字符串串联到字符串数组中将字符串串联到字符串数组中，就像您串联任何其他类型的数组一样。使用方括号 [] 串联两个字符串数组。 str1 = ["Mercury","Gemini","Apollo"]; str2 = ["Skylab","Skylab B","ISS"]; str = [str1 str2] str = 1x6 string array "Mercury" "Gemini" "Apollo" "Skylab" "Skylab B" "ISS" 转置 str1 和 str2。将它们进行串联，然后将列标题垂直串联到字符串数组上。当您将字符向量串联到字符串数组中时，字符向量会自动转换为字符串。 str1 = str1'; str2 = str2'; str = [str1 str2]; str = [["Mission:","Station:"] ; str] str = 4x2 string array "Mission:" "Station:" "Mercury" "Skylab" "Gemini" "Skylab B" "Apollo" "ISS"

字符串相关函数

字符串数组

string	字符串数组
strings	创建不包含字符的字符串数组
join	合并字符串

字符数组

char	字符数组
cellstr	转换为字符向量元胞数组
blanks	创建空白字符数组
newline	创建换行符

字符或字符串数组

compose	将数据格式化为多个字符串
sprintf	将数据格式化为字符串或字符向量
strcat	水平串联字符串
append	合并字符串

转换输入参数

convertCharsToStrings	将字符数组转换为字符串数组，其他数组不变
convertStringsToChars	将字符串数组转换为字符数组，其他数组不变
convertContainedStringsToChars	在元胞数组或结构体的任何级别转换字符串数组

在数值和字符串之间转换

double	双精度数组
string	字符串数组
str2double	将字符串转换为双精度值
num2str	将数字转换为字符数组

ischar	确定输入是否为字符数组
iscellstr	确定输入是否为字符向量元胞数组
isstring	确定输入是否为字符串数组
isStringScalar	确定输入是否为包含一个元素的字符串数组

文本属性

strlength	字符串长度
isstrprop	确定输入字符串中的哪些字符属于指定类别
isletter	确定哪些字符为字母
isspace	确定哪些字符是空白字符

查找

contains	确定字符串中是否有模式
count	计算字符串中模式的出现次数
endsWith	确定字符串是否以模式结尾
startsWith	确定字符串是否以模式开头
strfind	在其他字符串中查找字符串
sscanf	从字符串读取格式化数据

替换

replace	查找并替换一个或多个子字符串
replaceBetween	替换起点和终点之间的子字符串
strrep	查找并替换子字符串

join	合并字符串
split	在分隔符处拆分字符串
splitlines	在换行符处拆分字符串
strjoin	联接数组中的字符串
strsplit	在指定分隔符处拆分字符串或字符向量
strtok	所选的字符串部分

erase	删除字符串内的子字符串
eraseBetween	删除起点和终点之间的子字符串
extractAfter	提取指定位置后的子字符串
extractBefore	提取指定位置前的子字符串
extractBetween	提取起点和终点之间的子字符串
insertAfter	在指定的子字符串后插入字符串
insertBefore	在指定的子字符串前插入字符串
pad	为字符串添加前导或尾随字符
strip	删除字符串中的前导和尾随字符
lower	将字符串转换为小写
upper	将字符串转换为大写
reverse	反转字符串中的字符顺序
deblank	删除字符串末尾的尾随空白
strtrim	从字符串中删除前导和尾随空白
strjust	对齐字符串

strcmp	比较字符串
strcmpi	比较字符串（不区分大小写）
strncmp	比较字符串的前 n 个字符（区分大小写）
strncmpi	比较字符串的前 n 个字符（不区分大小写）

regexp	匹配正则表达式（区分大小写）
regexpi	匹配正则表达式（不区分大小写）
regexprep	使用正则表达式替换文本
regexptranslate	将文本转换为正则表达式

数值类型

整数和浮点数据

MATLAB® 中的数值类包括有符号和无符号整数、单精度和双精度浮点数。

默认情况下，MATLAB 以双精度浮点形式存储所有数值。（您不能更改默认类型和精度。）您可以选择以整数或单精度形式存储任何数值或数值数组。

与双精度数组相比，以整数和单精度数组形式存储数据更节省内存。

所有数值类型都支持基本的数组运算，例如添加下标、重构和数学运算。

函数

double	双精度数组
single	单精度数组
int8	8 位有符号整数数组
int16	16 位有符号整数数组
int32	32 位有符号整数数组
int64	64 位有符号整数数组
uint8	8 位无符号整数数组
uint16	16 位无符号整数数组
uint32	32 位无符号整数数组
uint64	64 位无符号整数数组

cast	将变量转换为不同的数据类型
typecast	在不更改基础数据的情况下转换数据类型

isinteger	确定输入是否为整数数组
isfloat	确定输入是否为浮点数组
isnumeric	确定输入是否为数值数组
isreal	确定数组是否为实数数组
isfinite	确定数组元素是否为有限值
isinf	确定数组元素是否为无限值
isnan	判断查询数组元素是否包含 NaN 值

eps	浮点相对精度
flintmax	浮点格式的最大连续整数
Inf	创建所有值均为 Inf 的数组
intmax	指定整数类型的最大值
intmin	指定整数类型的最小值
NaN	创建所有值均为 NaN 的数组
realmax	最大的正浮点数
realmin	最小的标准正浮点数

MATLAB 默认情况下以双精度浮点形式 (double) 存储数值数据。要以整数形式存储数据，您需要从 double 转换为所需的整数类型。使用上表中所示的转换函数之一。

例如，如果要以 16 位有符号整数形式存储赋给变量 x 的值 325，请键入

x = int16(325);

如果要转换为整数的数值带有小数部分，MATLAB 将舍入到最接近的整数。如果小数部分正好是 0.5，则 MATLAB 会从两个同样临近的整数中选择绝对值大小更大的整数：

x = 325.499; int16(x) ans = int16 325 x = x + .001; int16(x) ans = int16 326

在将其他类（例如字符串）转换为整数时，这些整数转换函数也很有用：

str = 'Hello World'; int8(str) ans = 1×11 int8 row vector 72 101 108 108 111 32 87 111 114 108 100

如果您将 NaN 值转换为整数类，则结果为该整数类中的 0 值。例如，

int32(NaN) ans = int32 0

数值的显示格式默认显示默认情况下，MATLAB® 将数值输出显示为 5 位数的定标定点值。您可以将数值的显示方式更改为以下任意方式：

5 位数的定标定点、浮点或这两种方式中的最佳方式

15 位数的定标定点、浮点或这两种方式中的最佳方式

小整数的比率

十六进制（以 16 为基数）

Bank 表示法

format 参考页中列出了所有可用格式。

要更改数值显示设置，请使用 format 函数或预设对话框（可通过 MATLAB 文件菜单访问）。format 函数只在单个 MATLAB 会话期间更改数值的显示方式，而您的“预设”设置则会从一个会话到下一个会话都保持活动状态。这些设置仅影响数值的显示方式，而不影响 MATLAB 计算或保存数值的方式。为 x 设置一个整数值并以十六进制（以 16 为基数）格式显示：

format hex x = uint32(876543210) x = 343efcea

将格式设置为 5 位数的浮点格式：

format short e x x = 1.3333e+00 1.2345e-06

设置 x 的值并以 5 位数的定标定点格式显示：

x = [4/3 1.2345e-6] x = 1.3333 0.0000

确定数值类您可以使用以下任意命令检查变量 x 的数据类型。

whos x

显示 x 的数据类型。

xType = class(x);

将 x 的数据类型赋予变量。

isnumeric(x)

确定 x 是否为数值类型。

isa(x, 'integer') isa(x, 'uint64') isa(x, 'float') isa(x, 'double') isa(x, 'single')

确定 x 是否为指定的数值类型。（此处显示了任意整数、无符号的 64 位整数、任意浮点数、双精度数和单精度数的示例）。

isreal(x)

确定 x 是实数还是复数。

isnan(x)

确定 x 是否不是数值 (NaN)。

isinf(x)

确定 x 是否为无限值。

isfinite(x)

确定 x 是否为有限值。

合并不同的整数类型概述如果您在矩阵中合并不同的整数类型（例如有符号与无符号，或 8 位整数与 16 位整数），MATLAB® 将返回所有元素都属于一个公共类型的矩阵。MATLAB 将生成矩阵的所有元素设置为输入矩阵中的最左侧元素的数据类型。例如，以下串联生成由 3 个 16 位有符号整数组成的向量：

A = [int16(450) uint8(250) int32(1000000)] 合并不同大小的整数的示例禁用如上所示的整数串联警告后，一次串联下面的两个数字，然后转换它们的顺序。返回值取决于整数的串联顺序。最左侧的类型决定着向量中的所有元素的数据类型：

A = [int16(5000) int8(50)] A = 5000 50

B = [int8(50) int16(5000)] B = 50 127 第一个操作返回由 16 位整数组成的向量。第二个操作返回由 8 位整数组成的向量。元素 int16(5000) 设置为 127，即 8 位有符号整数的最大值。

相同规则也适用于垂直串联：

C = [int8(50); int16(5000)] C = 50 127 合并有符号与无符号整数的示例现在使用有符号与无符号整数做相同的练习。同样，最左侧的元素决定着生成矩阵中的所有元素的数据类型：

A = [int8(-100) uint8(100)] A = -100 100

B = [uint8(100) int8(-100)] B = 100 0 元素 int8(-100) 设为零，因为它不再有符号。

MATLAB 在将每个元素串联为一个合并数组之前计算每个元素。换句话说，在合并两个元素前，以下语句的计算结果为一个 8 位有符号整数（等于 50）和一个 8 位无符号整数（无符号的 -50 设为零）。按照该串联，第二个元素保留其零值，但采用无符号 int8 类型：

A = [int8(50), uint8(-50)] A = 50 0

数据类型检测函数

函数

iscalendarduration	确定输入是否为日历持续时间数组
iscategorical	确定输入是否为分类数组
iscell	确定输入是否为元胞数组
iscellstr	确定输入是否为字符向量元胞数组
ischar	确定输入是否为字符数组
isdatetime	确定输入是否为日期时间数组
isduration	确定输入是否为持续时间数组
isenum	确定变量是否为枚举
isfloat	确定输入是否为浮点数组
isgraphics	对有效的图形对象句柄为 True
isinteger	确定输入是否为整数数组
isjava	确定输入是否为 Java 对象
islogical	确定输入是否为逻辑数组
isnumeric	确定输入是否为数值数组
isobject	确定输入是否为 MATLAB 对象
isreal	确定数组是否为实数数组
isstring	确定输入是否为字符串数组
isstruct	确定输入是否为结构体数组
istable	确定输入是否为表
istimetable	确定输入是否为时间表

is*	检测状态
isa	确定输入是否具有指定数据类型
class	对象的类
validateattributes	检查数组的有效性
whos	列出工作区中的变量及大小和类型

数据类型转换

数值数组、字符数组、元胞数组、结构体或表格之间的转换

函数

char	字符数组
cellstr	转换为字符向量元胞数组
int2str	将整数转换为字符
mat2str	将矩阵转换为字符
num2str	将数字转换为字符数组
str2double	将字符串转换为双精度值
str2num	将字符数组或字符串转换为数值数组
native2unicode	将数值字节转换为 Unicode 字符表示形式
unicode2native	将 Unicode 字符表示形式转换为数值字节

base2dec	将以 N 为基数表示数字的文本转换为十进制数字
bin2dec	将用文本表示的二进制数字转换为十进制数字
dec2base	将十进制数字转换为以 N 为基数的数字的字符向量
dec2bin	将十进制数字转换为表示二进制数字的字符向量
dec2hex	将十进制数字转换为表示十六进制数字的字符向量
hex2dec	将十六进制数字的文本表示形式转换为十进制数字
hex2num	将 IEEE 十六进制字符串转换为双精度数字
num2hex	将单精度和双精度值转换成 IEEE 十六进制字符串

table2array	将表转换为同构数组
table2cell	将表转换为元胞数组
table2struct	将表转换为结构体数组
array2table	将同构数组转换为表
cell2table	将元胞数组转换为表
struct2table	将结构体数组转换为表

cell2mat	将元胞数组转换为基础数据类型的普通数组
cell2struct	将元胞数组转换为结构体数组
mat2cell	将数组转换为在元胞中包含子数组的元胞数组
num2cell	将数组转换为相同大小的元胞数组
struct2cell	将结构体转换为元胞数组

函数摘要此表中列出的函数提供了多种将数值数据转换为字符数组的方法。

函数	说明	示例
char	将正整数转换为等效的字符。（截断任何小数部分。）	[72 105] → 'Hi'
string	将包含双精度值的数组转换为字符串数组。	[72 105] → "72" "105" [3.1416 2.178] → "3.1416" "2.178"
int2str	将正整数或负整数转换为字符类型。（对任何小数部分四舍五入。）	[72 105] → '72 105'
num2str	将数值类型转换为指定精度和格式的字符类型。	[72 105] → '72/105/' （格式设置为 %1d/）
mat2str	将数值类型转换为指定精度的字符类型，并返回 MATLAB 可以计算的字符向量。	[72 105] → '[72 105]'
dec2hex	将正整数转换为字符类型的十六进制基数。	[72 105] → '48 69'
dec2bin	将正整数转换为字符类型的二进制基数。	[72 105] → '1001000 1101001'
dec2base	将正整数转换为字符类型的数字，基数可从 2 到 36。	[72 105] → '110 151'

将数字转换为字符代码 char 函数将整数转换为 Unicode 字符代码，并返回由对等字符构成的字符数组： 6 字符和字符串 6-56x = [77 65 84 76 65 66]; char(x) ans = 'MATLAB'

将数字表示为文本 int2str、 num2str 和 mat2str 函数将数值表示为文本，其中每个字符表示输入值中一位单独的数字。 int2str 和 num2str 函数常被用来为绘图添加标签。例如，下列线条使用 num2str 为绘图的 x 轴准备自动化标签： function plotlabel(x, y) plot(x, y) chr1 = num2str(min(x)); chr2 = num2str(max(x)); out = ['Value of f from ' chr1 ' to ' chr2];

转换为特定基数另一类转换函数将数值更改为字符数组，将十进制值用另一种基数形式表示，例如二进制或十六进制表示形式。这些函数包括 dec2hex、 dec2bin 和 dec2base。

函数摘要此表中列出的函数提供了多种将字符数组转换为数值数据的方法。

函数	说明	示例
uintN（例如 uint8）	将字符转换为表示该字符的整数代码。	'Hi' → 72 105
str2num	将字符类型转换为数值类型。	'72 105' → [72 105]
str2double	与 str2num 类似，但提供更佳的性能，用于处理字符串数组和字符向量元胞数组。	"72" "105" → [72 105] {'72' '105'} → [72 105]
hex2num	将数值类型转换为指定精度的字符类型，并返回 MATLAB 可以计算的字符数组。	'A' → '-1.4917e-154'
hex2dec	将数值类型的十六进制基数转换为正整数。	'A' → 10
bin2dec	将字符类型的二进制数字转换为十进制数字。	'1010' → 10
base2dec	将字符类型的 2 到 36 内任何进制的数字转换为十进制数字。	'12' → 10 （如果 base == 8）

从特定基数转换要将非十进制数字的字符表示转换为该数字的值，请使用以下函数之一：hex2num、 hex2dec、 bin2dec 或 base2dec。 hex2num 和 hex2dec 函数都接受十六进制（以 16 为基数）输入，但 hex2num 返回它表示的 IEEE 双精度浮点数，而 hex2dec 则将输入转换为十进制整数

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。