学习Linux字符集查看的简单方法 (linux字符集查看)
Linux是一种流行的操作系统,它具有广泛的应用,并被许多开发人员和系统管理员使用。在Linux操作系统中,字符集是一项重要的组成部分,因为它们定义了字符的表示方式。 想要在Linux操作系统中正确工作,就需要知道如何查看和理解字符集。本文将介绍Linux字符集查看的简单方法。
一、什么是字符集?
字符集是一种将字符映射到数字代码的机制。它把每个字符映射到一个唯一的代码,以便在计算机系统中进行处理。ASCII字符集是最早的字符集之一,它将英文字母、数字和一些符号映射到数字代码。随着计算机系统的发展,新的字符集如Unicode被开发出来,可以支持更多的字符。
二、Linux系统中的字符集
Linux操作系统中默认使用UTF-8字符集。这是一种Unicode字符集,支持字符串中包含各种语言的字符。字符集还包括字体和字形,它们决定了在显示器上字符显示的外观。
三、Linux字符集查看方法
在Linux操作系统中,我们可以使用以下命令来查看当前的字符集:
locale
该命令将列出当前使用的字符集和其他本地化参数,例如数字和日期格式。输出可能包括类似于“en_US.UTF-8”的字符串。这表示当前字符集为UTF-8。您还可以使用以下命令查看当前字符集的详细信息:
locale -a
该命令会列出当前支持的所有字符集。对于每个字符集,它会显示字符集的名称以及可用的本地化。您还可以查看字符集的手册页,以深入了解其特性和使用方式。
man charsets
这将显示与字符集相关的手册页。手册页中包含了有关字符集及其使用的更多信息。
四、字符集的转换
有时,我们需要将不同的字符集转换为当前的字符集,这可以使用iconv命令来实现。iconv命令将文件或字符串从一种字符集转换为另一种字符集。
例如,将一个名为“file.txt”的文件从ISO-8859-1字符集转换为UTF-8字符集,可以使用以下命令:
iconv -f ISO-8859-1 -t UTF-8 file.txt -o converted_file.txt
该命令将对输入文件进行编码转换,并将结果写入一个名为“converted_file.txt”的新文件中。根据需要,您可以指定不同的输入文件和输出文件名,以及目标字符集。
五、
字符集是Linux操作系统中重要的组成部分,在正确的字符集下工作可以避免出现各种问题。本文介绍了如何查看当前的字符集,以及如何使用iconv命令进行字符集的转换。掌握这些技巧可以帮助您更好地理解Linux操作系统,并更好地控制您的开发和系统管理任务。
相关问题拓展阅读:
- java fileLists读取linux服务器文件名中文乱码
- linux c glob()函数详细的使用方法,将man glob 的英文翻译出来也行
java fileLists读取linux服务器文件名中文乱码
JBoss4.0.5使用的是滚圆tomcat5,而tomcat的默认字符集是ISO.找到大贺塌JBoss的根目录下名 为\%JBoss4.0.5%server\default\deploy\jbossweb-tomcat55.sar的文件夹.
修改server.xml文件.
修改方法,找到默认是8080端拍让口,在后面加入URIEcoding=’UTF-8′,字符集根据页面进行相应的设置,我的整个项目是使用UTF-
8字符集(包括UTF-8).
linux c glob()函数详细的使用方法,将man glob 的英文翻译出来也行
GLOB
Section: Linux Programmer’s Manual (7)
Updated: 12 June
1998
Index
NAME
glob – 形成路径名称
描述 (DESCRIPTION)
很久以前 在 UNIX V6 版 中 有一个 程序 /etc/glob 用来 展开 通配符模板.
不久以后 它 成为 shell 内建功能. 现在 人们 开发了 类似的 库函数 glob(3), 让 用户程序 实现 同样的 功能.
此 规则 遵循 (POSIX 1003.2, 3.13).
通配符匹配 (WILDCARD MATCHING)
包含 ‘?’, ‘*’ 或 ‘
pattern). 形成路径名(globbing) 指 一种 操作, 把 通配符模板 展开为 匹配 该串的 路径名. 匹配 定义为:
不在 方括弧中 的 ‘?’ 匹配 任意 单个 字符.
不在 方括弧中 的 ‘*’ 匹配 任意 字符串, 包括 空串.
字符集 (Character classes)
对于 表达式 `’, 如果 在 之一个 ‘
‘!’, 则 该 表达式 匹配 任意 一个 在 `’内 出现的 字符. 方括弧内 不能樱罩孝 有 空串, 因此 ‘>’ 可以 作为 之一个 字符 出现在
方括弧内. (像 这样, ” 匹配 下列三闷绝个 字符 中的 任意 一个, ” 和 ‘!’.)
范围集 (Ranges)
字符集 有一个 特例: 用 ‘-‘ 分开的 两个 字符 表示 一个 范围集. (像 这样, `’
等于 `’.) 把 ‘-‘ 放到 方括弧内 的 开头 或 最后 可以 获得 它的 本意. (像 这样,
`->’ 匹配 ‘>’和’-‘ 中 任意 一个. 而 `’ 匹配 `-‘, `.’ 和`/’中任意 一个.)
补集 (Complementation)
表达式 ” 表示 一个 字符, 该 字符 不匹配 方括弧内 去掉 开头 ‘!’ 后的
表达式. (像 这样, `a->’ 匹配 除了 ‘>’, ‘a’ 和 ‘-‘ 的 任意 一个 字符.)
要 去掉 ‘?’, ‘*’ 和 ‘
这些 字符. 在 方括弧内 这些 字符 显露出 本意, 所以, ” 匹配 这 四个字符中 的 一个: ‘
路径名 (PATHNAME)
形成路径名 功能 应用于 路径 中 的 每一个 成员部分. 路径 中 的 ‘/’ 不能 被通配符 ‘?’ 或
‘*’, 或 范围集 如 ” 匹配. 范围集 不能 直接 包含 ‘/’, 否则 导致 语法错误.
如果 待匹配的 文件名 以’.’开头, 那么 这个 ‘.’ 字符 必须 直接 给出. (比如说, 用 ‘tar c .’ 会 更好.)
空列表 (EMPTY LISTS)
上述的 简单优雅 规则, 把 通配符模板 展开为 匹配的 路径名, 来源于 最初的 UNIX 定义. 它
允许 展开出 空串, 例如 xv -wait 0 *.gif *.jpg
这里 可能 没有 *.gif 文件 (而且 不算 错误).
然而, POSIX 要求 句法 错误 或 路径名 列表 为 空 时, 保留 通配符模板 不变. (译注: 即 不展开.)
在 bash 中 可以 通过 设置 allow_null_glob_expansion=true 把 它 强置为 传统的
风格. (其他 地方 也有 类似的 问题, 例如, 老式的 语句 是
rm `find . -name “*~”`
新的 写法 为
rm -f nosuchfile `find . -name “*~”`
以 避免 由于 空参数调用 rm 而 产生 错误信息.)
注意 (NOTES)
正规表达式 (Regular expressions)
注意, 通配符模板 不是 正规表达式, 尽管 它们 有点象. 首先, 它 匹配 文件名,
而 不是 正文; 其次, 规则 不一样, 例如 正规表达式 里 的 ‘*’ 代表 零个或多个 前面内容的 重复.
正规表达式 的 方括弧表达式 用 ‘^’ 引导 取反操作, (而不是 ”). POSIX 声明, 在 通配符模板 中, ”
未做 定义.
字符集 和 国际化 (Character classes and Internationalization )
当然, 范围集 最初 指
ASCII的 范围, 因此 ” 意思是 ”,
一些 UNIX实现 把 这个 归纳为: 范围 X-Y 指 X的编码 到 Y的编码 之间的编码字符. 可是, 这 要求 用户 知道 他们 本地系统的
字符编码, 此外, 如果本地的 字母表顺序 和 字符集顺序 不对应, 那 就 更不方便了.
因此, POSIX 对 通配符模板 和 正规表达式 的 方括弧表达法 作了 重大扩展, 上面 我们 知道了 方括弧表达式 中 的 三个 类型, 它们是
(i) 取补集 (ii) 直接列出的 单个字符 和 (iii) 范围集.
POSIX 对 范围集 在 国际化 方面 作了 更有力的 说明, 并且 增加了 三个 类型:
(iii) 范围 X-Y 由 X 和 Y 之间 所有的字符 组成 (包括X和Y), X 和 Y 的 当前编码序列 由 当前场合的 LC_COLLATE
分类定义.
(iv) 命名字符集, 象
因此 可以 用 ‘>’ 代替 ”, 它 在 丹麦语 里 同样 有效, 虽然 丹麦的 字母表 里 ‘z’ 后面 还有
三个 字母. 这些 字符集 由 当前场合的 LC_CTYPE 分类定义.
(v) 符号对映, 象 ” 或 ”, 在 ” 之间的 字符串 是 定义 在 当前场合的
对映元素. 注意 这 可以 是 多字符元素.
(vi) 等类表达式, 象 ”, 在 ” 之间的 字符串 是 任意 等类 中 的 对映元素, 它 定义在 当前场合.
例如, ‘>’ 可以 等同于 `‘ (警告: 这里 有 Latin-1 字符), 也就是
`>’.
SEE ALSO
sh(1), glob(3), fnmatch(3),
locale(7), regex(7)
linux字符集查看的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于linux字符集查看,学习Linux字符集查看的简单方法,java fileLists读取linux服务器文件名中文乱码,linux c glob()函数详细的使用方法,将man glob 的英文翻译出来也行的信息别忘了在本站进行查找喔。