查看原文
其他

如何用Stata读入Excel单表文件

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:胡   婧

本文编辑:李朋冲

技术总编:刘洪儒

爬虫俱乐部是您身边的科研助手,能够为您在数据处理实证研究中提供帮助。承蒙30000+粉丝的支持与厚爱,我们在腾讯课堂推出了网络视频课程,专注于数据整理、网络爬虫、循环命令编制和结果输出…李老师及团队精彩地讲解,深入浅出,注重案例与实战,让您更加快速高效地掌握Stata技巧及数据处理的精髓,而且可以无限次重复观看,百分百好评,简单易学,一个月让您从入门到精通。绝对物超所值!观看学习网址:https://ke.qq.com/course/286526?tuin=1b60b462,敬请关注!


Stata可以使用use/sysuse命令直接导入后缀名为dta的文件。然而,我们常常遇到原始数据不是dta格式的情况,这时怎么用Stata读入呢?今天我们要介绍的是最常见的Excel格式文件的读入。为了简化我们的问题,我们假设要读入的Excel文件是temp.xlsx,储存在D:\temp\路径下,该Excel文件只有一个单表(sheet),单表的名字是“sheet1”。这就要用到今天介绍的命令:import excel。该命令是将Excel文件读入到Stata中的利器!

基本语法

import excel [using] filename

其中 using可以省略,也可以加上;filename为我们要导入的文件名。

首先,我们清空Stata内存进入Excel文件所在的位置,运用import excel命令将文件导入Stata中,程序如下:

clear cd D:\temp import excel using temp.xlsx browse

附加选项

将数据导入到Stata后,往往需要对数据进行处理。为简化程序和节省时间,我们可以在导入数据时尽可能地提高效率。这将用到import excel命令的附加选项。接下来,小编为大家一一介绍!

(1)clear选项

根据上面的程序,每次打开一个文件都要先用clear命令清空内存,并且转到文件所在位置。这意味着每次将Excel表格文件导入到Stata时要输入三行命令。怎么将三行命令合成一行呢?文件名前加文件所在路径即可打开该文件,以本文数据为例,文件名连同路径为:D:\temp\temp.xlsx,如果路径或文件名中有空格或特殊字符,建议将路径和文件名放在英文双引号中;同时在文件名后加上选项clear即可实现清空内存中的数据:

import excel D:\temp\temp, clear list

以上便是clear选项的用法。那么,将Excel文件导入Stata时,怎么直接将Excel文件的表头作为变量名呢?这是firstrow选项要实现的功能。

(2)firstrow选项

Excel文件的第一行往往是表头,导入Excel文件时如果想将第一行当作变量名,在“,”后面加上firstrow即可,可将其缩写为first。

import excel D:\temp\temp, first clear  //first和clear不用考虑顺序先后 browse

(3)case()选项

我们发现,上图中的变量名有的是完全大写,有的是大小写混杂,有的是完全小写,这无疑会对后期的数据处理增加不必要的麻烦。所以,在导入Stata时,一般都将变量名中的所有字母变成大写或者小写,这要用到case()选项。

case()选项括号中可以输入:preserve、lower、upper。其中,preserve为保持变量名的大小写原状,这是默认选项。lower是将变量名中的所有字母变成小写字母,upper是将变量名中的所有字母变成大写字母。我们以将变量名都变成小写字母为例,如下所示:

import excel D:\temp\temp, clear first case(lower) browse
describe

以上便是使用import excel命令导入Excel文件的单个sheet的全部内容!我们将在以后的推文中介绍如何导入一个Excel文件中的多个sheet的内容,敬请关注!

有问题,不要怕!访问 

http://www.wuhanstring.com/uploads/5_aboutus/爬虫俱乐部-用户问题登记表.docx (复制到浏览器中)下载爬虫俱乐部用户问题登记表并按要求填写后发送至邮箱statatraining@163.com,我们会及时为您解答哟~

爬虫俱乐部的github主站正式上线了!我们的网站地址是:https://stata-club.github.io,粉丝们可以通过该网站访问过去的推文哟~

爬虫俱乐部隆重推出数据定制及处理业务,您有任何网页数据获取及处理方面的难题,请发邮件至我们邮箱statatraining@163.com,届时会有俱乐部高级会员为您排忧解难!

对爬虫俱乐部的推文累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫!

往期推文推荐

关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。


此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:statatraining@163.com

投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存