课程大纲
时间:2021年7月15-18日(王飞、司季春)
2021年7月19-21日(太子,邓建鹏)
2021年7月22-23日(邓旭东)
地点:小鹅平台(线上直播)
主讲人:王飞(中国人民大学)、司继春(上海对外经贸大学)、王子(上海财经大学)、邓建鹏(上海财经大学)、邓旭东(哈尔滨工业大学)技术博士)、刘文革(课程总策划)、谢杰(课程协调人)
教学方法:
·Python3.7.5 Matlab R2019b及以上 Stata 14及以上
·每天6小时(8:30-11:30;14:00-17:00)+30分钟问答
价格:
Python(邓旭东老师):2000元; 回放10天
结构模型(王子老师+邓建鹏老师):3000元; 回放10天
Stata(王飞老师):2000元; 回放10天
Stata(司继春老师):2000元; 回放10天
·优惠政策:
两位老师的课程可享受 10% 的折扣; 三位老师的课程可享受 20% 的折扣; 四位老师的课程可享受 25% 的折扣; 三人或三人以上团体可享 10% 折扣; 五人或五人以上的团体可享受 20% 的折扣; 旧生优惠10%; 学生优惠200元/人; 各种叠加不超过25折。
(注:为扩大学员的选择范围,可选择单独报名一位老师或几位老师的课程,也可以拼团报名,详情请咨询文末陈老师文章)
课程内容:
王飞:①数据清洗与描述②工具变量③断点回归④综合控制与最新实证方法补充
司季春:①线性回归与Stata基础②线性面板数据模型③双差模型及新进展④面板二元选择模型
王子:①结构模型的意义和理论基础②结构模型的具体实现步骤,以Eaton和Kortum(2002)为例③结构估计和反事实分析中使用的数值计算方法(算法和Matlab编程)④定量政策分析Caliendo和Parro(2015)的具体实现过程(算法与Matlab编程)
邓建鹏:①Eaton Kortum和Kramarz(2011):简单的文献综述②如何看数据:从引力模型到企业级数据(Stata绘图)③《搭积木和玩乐高》:EKK模型详解④Structural Estimation and矩量法模拟(算法与Matlab编程)⑤反事实分析(算法与Matlab编程)
邓旭东:①Python语法介绍②数据获取③文本分析介绍④高级机器学习与文本分析
演讲者简介
邓旭东:哈尔滨工业大学管理学院信息管理系统专业在读博士。 曾在多所高校分享数据采集和文本分析,运营【公众号:大邓和他的Python】主要分享Python、爬虫、文本分析、机器学习等内容。
王子:博士美国宾夕法尼亚州立大学经济学博士,上海财经大学商学院助理教授。 研究领域为国际贸易、跨国公司和中国经济,在《国际经济学报》、《国际货币与金融学报》、《世界经济》等期刊发表多篇论文。 多次受邀在多所高校讲授《结构方程建模方法与应用》前沿课程,受到广泛好评。
邓建鹏:博士美国宾夕法尼亚州立大学经济学博士,上海财经大学商学院助理教授。 主要研究领域为国际贸易、经济增长和经济地理学。 曾在多所高校分享结构模型方法在国际贸易中的应用,反响热烈。
王飞:博士美国南加州大学经济学博士,中国人民大学劳动人事学院副教授,“杰出学者”青年学者,中国人民大学国家发展与战略研究院研究员实证模型,全球劳工组织成员( GLO),中国就业研究院研究员。 主持国家自然科学基金委青年科学基金项目。 主要研究领域为劳动经济学、人口经济学、主观幸福感等,在PNAS、Journal of Happiness Studies、Journal of Population Economics、China Economic Review、《Population》等国内外权威期刊发表多篇论文研究”。 多次讲授微观实证研究方法,广受好评。 他是《Stata简明讲义》的作者。
司继春(慧航):上海对外经济贸易大学统计与信息学院助理教授。 主要研究领域为微观计量经济学和产业组织理论。 在Journal of Business and Economic Statistics和Financial Research等学术期刊发表多篇论文。 其实大家比较熟悉的是知乎上大名鼎鼎的【徽航】,拥有294929个粉丝,151655个赞。 他就是司季春老师——【徽航】。
车间介绍
为促进我国经济学、统计学等社会科学定量研究方法的学习和应用,培养和培养社会科学相关领域的青年学者、硕士和博士生,促进我国研究方法的科学规范化。社会科学相关领域,《结构模型、Stata实证前沿》、《Python数据挖掘》暑期工作坊为学者们提供了一个高层次交流、普及研究方法、分享研究经验的平台。工作坊采用模块化教学方式,不仅着重介绍经济学、统计学等社会科学量化的基本方法,更注重研究设计和研究课题培养,注重理论与实践相结合,培养学生的综合素质。定量分析和社会科学研究的能力。
结构模型,也称为结构计量经济学模型,是结合经济模型和统计模型来估计描述现实和模拟现实世界的深层参数以合理评估政策效果的经验工具。 结构建模通过对产生因果关系的数据生成的特定方式(机制)进行建模,以简化形式解决问题。 该模型通过一定的参数清楚地表明了一些重要的外部因素(如政策)如何影响参与者的决策,然后通过改变这些外部因素并结合现有数据估计的参数,该结构模型可以提供一系列反事实推论,这对政策制定具有重要意义。 政策评估需要基于对政策不变的“深层”参数的理解。 在结构方法中,理论与实践之间的联系很强。 由于其建模技术的优雅和深刻,它不仅处于当今经济政策评估领域的前沿,而且是经济理论发展的有力武器。 在世界顶级期刊中,使用结构模型建模的文章引起了广泛的关注和引用,是对学科的巨大贡献。 它对理论发展和政策评估产生了深远的影响。
在实证研究过程中,学者们普遍面临数据获取、清洗和编码两大问题。 在前大数据时代,一般采用实验方法、问卷调查、访谈或二手数据,将数据组织成结构化的表格数据,然后用计量经济学的分析方法对这些表格数据进行分析。 然而,在大数据时代,网络数据已成为各界学者迫切需要发掘的潜在宝藏。 大量的商业信息和社会信息以文本等非结构化、异构的数据格式存储在海量网页中。 那么,对于以经管为代表的人文社科专业研究人员来说,Python可以帮助学者们解决利用Web数据进行科学研究所面临的两大问题,即:①高效地从网络世界中收集数据②从复杂的文本中学习数据提取文本信息。
在获得数据和文本信息后,需要使用测量方法对数据进行分析和处理。 Stata软件的功能越来越强大,理论也与时俱进。 前沿的分析可能会给你的论文加分,但如果你不了解它的理论基础,就会导致前沿方法的滥用,你的研究会大大黯然失色!
为此,本次工作坊邀请了五位处于测量和爬虫文本分析前沿的学者。 估计。 在21世纪第三个十年来临之际,我们将与致力于科学探索的您分享最前沿的知识和技能! 我们力求为您带来最前沿的测量理论和扎实的操作基础的精品课程!
课程表
7月15日上午
主讲人:王飞
课程安排:数据清理和描述
1. 公式化的数据清洗,让复杂的数据处理变得无比清晰
2.实证研究摆正:数据描述不只是表格
3. 常用数据清洗与描述的实战演示
7月15日下午
主讲人:王飞
课程安排:工具变量
1. 系统回顾工具变量的经典方法和步骤
2. 寻找工具变量的具体方法
3. 处理弱工具变量的具体程序
4.二元内生自变量和工具变量在非线性模型中的应用方法
5. 工具变量经典论文结果的复现
7月16日上午
主讲人:王飞
课程安排:断点回归
1.断点回归经典设计思路和实用步骤系统梳理
2. 断点回归到开发和实际应用的前沿
3. 最新前沿论文断点回归结果的复现
7月16日下午
主讲人:王飞
课程安排:最新实证方法的综合控制与补充
1. 系统回顾合成控制的经典步骤及最新进展
2. 最新前沿论文成果复制的综合控制
3.置换检验在综合控制等方法中的应用与误用
4.补充介绍因果鉴定方法的最新进展
7月17日上午
主讲人:司继春
课程安排:线性回归和 Stata 基础知识
1. 线性回归模型基础
2. 系数解释和模型设置:平方项和交叉项的解释和使用
3. 系数解释和模型设置:加权最小二乘和权重的使用
4.线性回归中固定效应的使用
5.控制变量的选择
6.统计推断:异方差稳健标准误差和聚类标准误差
7.交叉方程假设检验
7月17日下午
主讲人:司继春
课程安排:线性面板数据模型
1、面板数据基本设置
2.随机效应模型和混合最小二乘法
3.一阶差分模型和固定效应模型
4. 不同估计量之间的关系和选择
5.线性面板数据中的时间固定效应和时间趋势
6.交互固定效应模型
7月18日上午
主讲人:司继春
课程安排:双差模型及其新发展
一、双差模型的基本设定和共同趋势假设
2.双差模型的标准设置
3、多周期双差模型设置
4、平行趋势检验法
5.三重差模型及回归控制方法介绍
6. 模糊 DID
7. 异质性动态治疗效果的估计(Sun, Abraham, 2020;Callaway, San't Anna, 2020)
7月18日下午
主讲人:司继春
课程安排:小组二元选择模型
1.基本Probit和Logit回归介绍
2. 二元选择模型中系数的解释和报告
3.随机效应Probit和Logit回归
4.固定效应Probit和Logit回归
7月19日上午和下午
讲者:太子
课程安排:结构模型方法论与理论建模、模型求解与估计、定量政策分析
一、结构模型的意义和理论基础
2. 结构模型的具体实现步骤,以Eaton and Kortum (2002)为例
3.结构估计和反事实分析中使用的数值计算方法(算法和Matlab编程)
4.量化政策分析的具体实现过程,以Caliendo和Parro(2015)为例(算法和Matlab编程)
7 月 20-21 日
主讲人:邓建鹏
课程安排:结构模型在国际贸易中的应用:从微观数据到宏观分析
1. 为什么选择 Eaton Kortum 和 Kramarz (2011):简要文献回顾
2、如何看数据:从引力模型到企业级数据(Stata绘图)
3.《搭积木与玩乐高》:EKK模型详解
4.矩的结构估计与模拟方法(算法与Matlab编程)
5.反事实分析(算法和Matlab编程)
7月22日上午
主讲人:邓旭东
课程安排:Python 语法简介
1. Python 和英语一样是一门语言
2.数据类型的字符串
3.列出数据类型的元组集合
4. 数据类型字典
5. Boolean value 和 None 的数据类型
6.逻辑语句(if&for&tryexcept)
7.列表理解
8.了解功能
9.常用内置函数
10.os路径库
11.内置库csv文件库
12.常见错误总结
7月22日下午
主讲人:邓旭东
课程安排:数据采集
一、网络爬虫的原理
2.网络访问请求库
3.pyquery库解析html网页
4. 案例一:豆瓣小说
5.json库解析json网页
6. 案例二:知乎
7. 案例三:微博
8. 案例四:批量下载文档和多媒体文件
9、案例5:批量下载上市公司pdf定期报告
10、案例六:API数据采集
11.区分动态网站和静态网站
7月23日上午
主讲人:邓旭东
课程安排:文本分析简介
一、文本分析在经管领域的应用
2.读取文件中的数据(txt、pdf、docx、xlsx、csv)
3、数据清洗重库——从文本中提取姓名、年龄、电话、号码等信息
4. 案例七:如何将多个文件的数据整理到一个excel中
5.中文jieba分词
6、案例8:词频统计,制作词云图
7. 案例九:通过共现法扩展情感词典
8、案例10:词向量word2vec扩展情感词典
9、案例11:中文情感分析(未加权字典法)
10.快速入门pandas库进行数据分析
11、案例12:使用pandas对excel中的文本进行情感分析
12、案例13:使用tf-idf进行情感分析(加权字典法)
13. 案例14:从文本数据构建可用的社交网络数据
14. 案例15:社交网络数据可视化
7月23日下午
主讲人:邓旭东
课程安排:机器学习和文本分析
1. 了解机器学习
2.使用机器学习做文本分析的过程
3. Scikit-learn机器学习库介绍
4. 文本特征工程——将文本转化为机器可以处理的数字向量
5.识别词袋法实证模型,one-hot,Tf-Idf,word2vec
6、案例16:使用标注工具对文本数据进行标注