R语言【utils】——read.table():以表格式读取文件,并从中创建一个数据帧,其中大小写对应于行,变量对应于文件中的字段。
Package?utils?version 4.2.0
Usage
read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = FALSE,
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
Arguments
参数【file】:要从中读取数据的文件的名称。表的每一行为文件的一行。如果不包含绝对路径,则文件名相对于当前工作目录 getwd()。在支持的地方执行波浪运算符扩展。这可以是一个压缩文件。或者,参数【file】可以是一个可读的文本模式连接 (如果需要,将打开以供读取,如果需要,则在函数调用结束时关闭 (并因此销毁))。(如果使用 stdin(),则行提示可能会有些混乱。用空行或EOF信号终止输入,Unix上是 Ctrl-D, Windows上是 Ctrl-Z。任何对 stdin()?的回推都会在返回之前被清除)。参数【file】也可以是一个完整的URL。
参数【header】:一个逻辑值,指示文件是否包含变量的名称作为其第一行。如果没有,则从文件格式确定该值:当且仅当第一行包含的字段比列数少一个时,参数【header】被设置为?TRUE。
参数【sep】:字段分隔符。文件每行上的值由该字符分隔。如果参数【sep】 = "" (read.table的默认值),分隔符是 '空白',即一个或多个空格、制表符、换行符或回车符。
参数【quote】:引号字符的集合。要完全禁用引号,使用参数【quote】 = ""。有关嵌入引号中的引号的行为,请参阅 scan。只有作为字符读取的列才会考虑引用,除非指定了 colClasses,否则所有列都是这样。
参数【dec】:文件中用于小数点的字符。
参数【numerals】:指示如何转换数值,会失去精度。可以缩写。(也适用于复数输入。)
参数【row.names】:行名的向量。这可以是给出实际行名的向量,也可以是给出包含行名的表列的单个数字,也可以是给出包含行名的表列名的字符串。如果有标题,并且第一行包含的字段比列数少一个,则输入中的第一列用于行名。否则,如果缺少参数【row.names】,则对行进行编号。使用 参数【row.names】 = NULL?强制行编号。
参数【col.names】:变量的可选名称的向量。默认是使用 "V" 后跟列号。
参数【as.is】:控制字符变量 (只要它们没有被转换为逻辑的、数字的或复杂的) 到因子的转换,如果没有由参数【colClasses】指定的话。它的值要么是逻辑向量 (必要时可循环使用值),要么是数字或字符索引向量,这些索引指定哪些列不应转换为因子。
参数【na.strings】:将被解释为 NA 值的字符串字符向量。空白字段也被认为是逻辑、整数、数字和复杂字段中的缺失值。请注意,测试发生在从输入中删除空白之后,所以没有。字符串值可能需要预先去掉它们自己的空白。
参数【colClasses】:字符型。为列假定的类向量。如果未命名,必要时回收。如果命名,则名称与被视为 NA 的未指定值相匹配。
参数【nrows】:整数值:读取的最大行数。负值和其他无效值将被忽略。
参数【skip】:整数值:在开始读取数据之前要跳过的数据文件行数。
参数【check.names】:逻辑值。如果为 TRUE,则检查数据帧中的变量名,以确保它们是语法上有效的变量名。如有必要,将对它们进行调整 (通过 make.names ),以确保它们是一致的,并确保没有重复。
参数【fill】:逻辑值。如果为 TRUE,则在行长度不等的情况下,隐式添加空白字段。
参数【strip.white】:逻辑值。仅在指定参数【sep】时使用,并允许从未加引号的字符字段中去除前导和尾随空格 (数字字段总是被去除)。
参数【blank.lines.skip】:逻辑值。如果为 TRUE,则忽略输入中的空行。
参数【comment.char】:字符值:长度为 1 的字符向量,包含单个字符或空字符串。使用 “” 来关闭注释的解释。
参数【allowEscapes】:逻辑值。C 风格的转义符号如 '\n' 是否应该被逐字处理或读取 (默认值)?请注意,如果不在引号内,则可以将其解释为分隔符 (而不是注释字符)。
参数【flush】:逻辑值。如果为 TRUE, scan?将在读取请求的最后一个字段后刷新到行尾。这允许在最后一个字段后面放置注释。
参数【stringsAsFactors】:逻辑值。字符向量应该转换为因子吗?注意,它被参数【as.is】和参数【colClasses】,它们都允许更精细的控制。
参数【fileEncoding】:字符串:if non-empty声明文件(不是连接)上使用的编码,以便字符数据可以重新编码。
参数【encoding】:为输入字符串假定的编码。它用于将字符串标记为已知的 Latin-1 或 UTF-8:它不用于重新编码输入,但允许 R 以其原生编码处理编码字符串 (如果这两者之一)。
参数【text】:字符串:如果没有提供参数【file】,则通过文本连接从参数【text】的值读取数据。请注意,文字字符串可用于在 R 代码中包含(小)数据集。
参数【skipNul】:逻辑值:应该跳过空值吗?
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!