r如何读取excel数据:调用readxl包执行代码即可直接读取表格内容

r如何读取excel数据:调用readxl包执行代码即可直接读取表格内容

前段时间赶部门的数据分析作业,死磕半天r如何读取excel数据,来回试了好几种办法,踩了一堆低级坑,现在回想起来纯粹是自己瞎折腾。

最开始压根没想着额外装工具包,总觉得R语言自带的功能就能搞定所有表格读取工作。直接复制网上零散的基础代码去运行,控制台反反复复弹出报错提示,既读不了xlsx格式的新版表格,对老旧的xls文件也完全没反应。当时还傻乎乎的以为是文件路径写错,反复复制粘贴文件地址,来回调试二十多分钟,问题压根没得到半点解决。

其实绝大多数新手卡壳,都是犯了和我一样的毛病,盲目依赖基础函数,忽略了R原生并不适配Excel专属格式这个基础事实。原生函数只适合处理csv这类纯文本表格,拿来读取结构复杂、带格式批注的Excel文件,从一开始就行不通。

折腾好久才搞明白,业内做数据分析的,基本都固定用readxl包来处理这类需求,没有花里胡哨的操作,代码简洁还兼容所有版本的Excel文件。

安装流程直白的不能再直白。先在控制台输入install.packages("readxl")完成包体安装,很多人会在这一步搞错,把安装代码和加载代码混为一谈,安装之后不写library(readxl)调用工具包,后续所有读取指令都会失效。

那个时候就是漏了调用步骤,装好包之后直接写读取代码,白白多浪费了十几分钟。完整的读取代码就两行,加载包之后,用read_excel("文件完整路径"),粘贴对应的文件路径,运行代码就能顺利的读取全部数据。

还踩过一个很不起眼的坑,分不清那xls和xlsx格式的区别。readxl包虽然兼容性强,但老版本xls表格偶尔会出现数据行列错乱的问题,反正后续我处理数据前,都会提前把xls文件另存为xlsx格式,规避莫名的格式bug。

如果不需要读取整张表格,只想提取指定工作表,直接在代码里新增sheet参数就行。sheet后填写数字对应工作表排序,填写文字就是工作表的命名,灵活度很高,完全能满足日常办公、课程作业的所有需求。

弄完所有数据读取、整理好数据集之后,关掉杂乱的代码窗口,清空控制台里之前一堆报错的冗余记录,指尖停在鼠标左键上,迟迟没点开下一份待处理的原始数据表。