admin发表的所有文章 - 统计学之家

Stata软件截面趋势图的绘制

Stata软件截面趋势图的绘制在实际工作和研究中，截面通常代表不同的主体和分类，例如各个省区、每个单位等，因此了解不同截面上变量随时间的变化趋势在实际应用中往往具有重要的现实意义。Stata提供了获...

2021年10月31日 Stata已关闭评论

Stata软件显示面板数据的分布频率

Stata软件显示面板数据的分布频率对于二值和多值变量，分布频率可以为我们的研究和工作提供更为有效的信息。利用Stata软件获取面板数据分布频率的基本语法如下： xttab varname 其中，x...

2021年10月31日 Stata已关闭评论

Stata软件面板数据的描述性统计分析

Stata软件面板数据的描述性统计分析同截面和时间序列一样，对数据基本特征和分布情况的了解可以为我们的工作提供有效的参考，描述性统计量的获取可以为我们直观地提供数据的全距、均值和离散情况等信息。利用...

2021年10月31日 Stata已关闭评论

Stata软件面板数据的设定命令

Stata软件设定面板数据的命令面板数据处理的第一步与时间序列数据相同都为设定数据。设定面板数据的命令如下： xtset panelvar timevar 其中，panelvar代表截面变量的名称...

2021年10月31日 Stata已关闭评论

Stata软件tokenize和gettoken命令的用法

Stata软件tokenize和gettoken命令的用法有时可能想要对宏进行分解，而只获取所需的部分，可以通过tokenize或gettoken命令来实现。相比起语法（Syntax）命令，这种解析...

2021年10月28日 Stata已关闭评论

Stata软件markin命令的用法

Stata软件markin命令的用法寻找选定观测值的范围的基本命令为markin，语法形式如下： markin 这里，选项name()用于指定新生成的局部宏的名字，如果不设定该选项，名字in就会被使...

2021年10月28日 Stata已关闭评论

Stata软件标记变量的适用规则

Stata软件标记变量的适用规则无论使用的是marksample还是mark，以及它们后面有没有markout，如下的一些规则都适用：观测值的权重为0时，标记变量被设定为0（设定选项zerowei...

2021年10月28日 Stata已关闭评论

Stata软件的临时变量、临时矩阵和临时文件

有些时候，程序在运行的过程中需要产生一些临时的变量、矩阵等，而一旦程序运行结束，这些变量、矩阵等就不再需要。在这种情况下，我们可以生成临时变量。生成临时变量的命令格式为： tempvar var1 ...

2021年10月28日 Stata已关闭评论

Stata软件局部宏与全局宏的命令

宏是Stata程序的变量，它用一个字符串（宏的名称）来代表另一个字符串（宏的内容）。宏分为局部宏（Local Macro）和全局宏（Global Macro）。局部宏只属于其所定义的程序，不能从其他程...

2021年10月28日 Stata已关闭评论

Stata软件如何在do文件或ado文件中加入注释

Stata软件如何在do文件或ado文件中加入注释有时，我们想在命令中加入注释，从而方便以后阅读。若要在do文件或ado文件中加入注释，则可采取如下几种方式：以“*”来开始一行。这样，该行就会被当...

2021年10月27日 Stata已关闭评论

Stata软件声明版本命令：version

Stata软件声明版本命令：version 随着Stata版本的变化，相应的命令也会有些变化。较早版本的命令可能没办法在现在的版本中使用，而现在的某些命令可能也没办法在以后的版本中使用。为了让现在的程...

2021年10月27日 Stata已关闭评论

Stata软件的Ado文件：基本命令

如果想自动加载并运行程序内容，那么可以将程序保存到ado（automatically do）文件中（同样是利用do文件编辑器，保存时选择扩展名为.ado），以后，直接输入程序名就可以使用该程序。但需要...

2021年10月27日 Stata已关闭评论

Stata重复抽样的基本命令：bsample

Stata重复抽样的基本命令：bsample 重复抽样使用的基本命令为bsample，语法形式如下： bsample 其中，if代表条件语句，in代表范围语句，options代表其他选项。exp为表达...

2021年10月27日 Stata已关闭评论

代表性调查的例子：“盖洛普”的利器

19世纪中后期，随着现代统计方法的不断进步，人们对数字产生了浓厚的兴趣，催生了一股“统计热”。当时的欧洲各国都有一批热衷于进行统计调查研究的人士。这些人士聚集到伦敦，在1885年成立了一个名为国际统计...

2021年10月22日统计员已关闭评论

样本代表性不足的例子：可口可乐的教训

人类认识事物的过程一般是通过归纳与演绎实现的。归纳就是从个别到一般，演绎则是从一般到个别。古代的中国人和古希腊人为了鉴别打猎获得的食物是否可以食用，先会从猎物身上取出一小部分，让一些人先吃吃看。然后，...

2021年10月22日统计员已关闭评论

网站反爬虫的目的与手段

网站所有者从所有网站来访者中识别出爬虫并对其做出相应处理（通常为封禁IP）的过程，被称为反爬虫。对于网站所有者而言，爬虫并不是一个受欢迎的客人。爬虫会消耗大量的服务器资源，影响服务器的稳定性，增加运营...

2021年10月22日数据挖掘已关闭评论

爬虫的合法性与robot.txt协议

1. 爬虫的合法性网络爬虫领域现在还处于早期的拓荒阶段，虽然已经由互联网行业自身的协议建立起一定的道德规范，但法律部分还在建立和完善中。目前，多数网站允许将爬虫爬取的数据用于个人使用或者科学研究。...

2021年10月22日数据分析已关闭评论

深层网络爬虫的基本原理

Web页面按照存在方式可以分为表层页面和深层页面两类。表层页面是指传统搜索引擎可以索引到的页面，以超链接可以到达的静态页面为主。深层页面是指大部分内容无法通过静态链接获取，隐藏在搜索表单后的，需要用户...

2021年10月22日数据分析已关闭评论

增量式网络爬虫的基本原理

增量式网络爬虫只对已下载网页采取增量式更新，或只爬取新产生的及已经发生变化的网页，这种机制能够在某种程度上保证所爬取的页面尽可能的新。与其他周期性爬取和刷新页面的网络爬虫相比，增量式网络爬虫仅在需要的...

2021年10月22日数据分析已关闭评论

聚焦（主题）网络爬虫的爬取策略

聚焦网络爬虫又被称作主题网络爬虫，其最大的特点是只选择性地爬取与预设的主题相关的页面。与通用网络爬虫相比，聚焦爬虫仅需爬取与主题相关的页面，极大地节省硬件及网络资源，能更快地更新保存的页面，更好地满足...

2021年10月22日数据分析已关闭评论

文章目录
繁