查看原文
其他

科研助力 | “如何用大数据做社会科学研究——基于Python的操作”系列直播课

十万学者关注了→ 语言学通讯 2021-03-17



伴随着互联网技术的迅猛发展和普及以及用户规模的爆发式增长,互联网也进入了“大数据”时代。网络大数据的“大”,不仅体现在其体量大,还在于其数据量增长迅猛,数据类型的多种多样;但网络大数据也存在其天然的局限性,即大数据中包含了大量重复、无效和垃圾数据,这些都为传统的社会科学研究带来新的挑战和机遇。


随着大数据的普及,网络数据资源成为潜在的研究宝藏,而工具方法的快速发展,也使得非计算机专业背景的人也可以借助机器学习、主题模型等相关方法来进行社科研究。


传统社会科学基于个案和抽样小数据的研究有其天然的局限,在社交媒体数据大爆发的时代,互联网空间涌现大量的用户行为数据,其中文本数据最丰富且最易获得,如何将这些数据从互联网上爬取下来,并通过计算机进行辅助研究,如何对文本数据进行分词、可视化呈现,并根据不同的研究目的选用不同的手段,如机器学习、主题模型等来进行分析,是本课程要讲授的核心内容。

课程目标:


本次课程针对对利用大数据来做社科研究有兴趣的研究人员,使得初学者可以建立了解使用大数据做社科研究的基本方法和软件操作(基于python),并使研究者掌握进行文本分析的思路和基础与进阶方法,并可以实现相关操作,辅以相应的案例来使学习者更好的理解所习得的操作手段和分析方法。


课程大纲:


第一讲 爬虫基础课程-王小宁老师(10.25  19:00-21:00)

1、爬虫基础——HTML基础、网络通信原理

2、爬虫软件介绍及使用——用gooseeker实现大量场景数据的抓取


第二讲 python基础入门及进行简单爬虫编写-王小宁老师(10.26 19:00-21:00)

1、Python基础

2、用Python编写简单爬虫


第三讲 利用Python进行复杂抓取-王小宁老师(10.27  19:00-21:00)

1、用Python模拟登陆

2、用python模拟浏览器自动抓取


第四讲 文本分析初步-李锋老师(10.28  19:00-21:00)

1、文本数据的类型

2、文本表示模型

3、利用Python进行文本分析(以政府工作报告为例)


第五讲 文本分析高阶-李锋老师(10.29  19:00-21:00)

1、机器学习入门

2、文本分析与机器学习

3、利用Python进行主题模型(以网络问政平台为例)


第六次 情感分析入门 - 王成军老师 (10.30 19:00-21:00)

1. 情感分析简介
2. 基于情感字典的方法
3. 基于机器学习的方法
4. 使用Python进行情感分析(以推特情感分析为例)


讲师介绍:


王小宁,中国人民大学统计学博士,曾任统计之都(https://cosx.org/)副主编,曾参与组织多次中国R会议(https://china-r.org/),主持或参与多项社科、教育部和国家统计局项目。目前主持国家统计局重点项目一项和参与北京市自然科学项目一项,发表SCI和CSSCI论文6篇,现为中国传媒大学数据科学与智能媒体学院师资博士后,中国人民大学中国调查与数据中心研究员,研究方向为抽样设计、统计机器学习和文本挖掘。主要代表作有《R语言实战(第2版)》、《ggplot2:数据分析与图形艺术(第2版)》、《Hadoop金融大数据分析》以及《传媒数据学》(2021年6月出版)


李锋,任教于中共中央党校政治和法律教研部,清华大学数据治理研究中心兼职研究员,北京大学国家治理研究院助理研究员。本科毕业于北京大学元培计划实验班,北京大学政府管理学院—美国哥伦比亚大学联合培养博士,哈佛大学燕京学社访问学者。主要研究方向为大数据政治学、量化研究、国家治理等,主持或参与省部级项目,在《Telematics and Informatics》、《政治学研究》、《中国行政管理》等SSCI/CSSCI期刊发表中英文文章近20篇。


王成军,博士毕业于香港城市大学媒体与传播系,现任南京大学新闻传播学院副教授、计算传播学实验中心主任、中国新闻史学会计算传播学二级分会秘书长,集智俱乐部成员,兼任香港城市大学互联网挖掘实验室研究员。致力于采用计算社会科学视角研究人类传播行为,内容包括社交媒体上的信息扩散、数字媒体中的注意力流动、未来就业,其研究成果发表于SSCI和SCI索引的期刊,例如Scientific Reports、PloS ONE、Physica A、Cyberpsychology、Telematics and Informatics。合著《计算传播学导论》(2018)、《社交网络上的计算传播学》(2015)、参与翻译《社会网络分析:方法与实践》(2013)。2014年创建计算传播网。主要讲授《计算社会科学导论》(本科课程)、《大数据挖掘与分析》(硕士课程)、《计算传播研究方法》(博士课程)等课程。


适合人群:


对利用大数据做社科研究有兴趣的学员


课程信息:


时间:2020年10月25-30日 每晚19:00-21:00

费用:前50名优惠399元/人,原价459元/人

咨询联系人:6号辅导员    

微信:fudaoyuan006

直播方式:小鹅通平台直播

报名截止:2020年10月25日 19:00

(课程满50人开课,如在开课前一日未能满50人,工作人员将于3-7个工作日联系您进行退款。)

注意事项:


1.支付成功后,请务必点击完成,并长按二维码加入微信交流群。课程可在微信公众号“学术志”-学术课程-我的-我的已购里面查找。

2.本次为小鹅通平台直播,具体直播观看方式群内将会发观看链接通知。

3.本次课程为网络直播课,一旦购买,无法提供退款。视频版权归讲师及学术志平台共同所有,课后提供长期的在线视频供学员复习,仅限个人学习使用,不得外传。报名之后不支持退费,敬请理解!

4. 本次课程提供电子发票,可以开具的类目为:会议费,网络会议费,咨询费,信息服务费四种任选其一,订阅课程后,可在微信号“学术志”—学员服务栏—个人中心—发票中心申请开具发票,可在所留邮箱中查收下载。如对发票报销存在疑问,请咨询财务武老师,联系方式:13552535030。

5.本次课程最终解释权归学术志(北京思高乐教育科技有限公司)所有

专著推荐 | 雷蕾《基于Python的语料库数据处理》

专著推荐 | 如何做定量研究?手把手教你使用SPSS《二语习得研究中的常用统计方法》


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存