在replace()中,可以通过字典构造或者传入两个列表(分别表示需要替换的值和替换后的值)来进行替换: In : df.replace({'Female':0, 'Male':1}).head() ...
pandas的频次函数:unique()和nunique()函数
pandas中有一些函数和数据中元素出现的频次相关。对Series使用unique()和nunique()可以分别得到其唯一值组成的列表和唯一值的个数: In : df.unique() Out: a...
在pandas中,有哪些特征统计函数?
在pandas中,有哪些特征统计函数? 在Series和DataFrame上定义了许多统计函数,最常见的是sum()、mean()、median()、var()、std()、max()和min()。下...
pandas的汇总函数:head()函数和tail()函数
Series和DataFrame上存储了许多信息,但我们很多时候只需要获取其中的部分信息。当想要查看表的前几行或后几行时,可以使用head()函数和tail()函数,它们分别返回表或者序列的前n行和后...
pandas两种基本的数据结构:Series和DataFrame
pandas有两种基本的数据结构,分别是存储一维值属性values的Series和存储二维值属性values的DataFrame,在这两种数据结构上定义了很多属性和方法,pandas中的绝大多数数据处...
pandas的文件输入输出,安装第三方库的命令?
pandas的文件输入输出模块依赖xlrd、xlwt和openpyxl这3个第三方库,若未安装可使用如下命令安装: # 可以使用如下<em>conda</em>命令或<e...
NumPy数组的构造方式有哪些?
NumPy数组的构造方式多种多样,其中最一般的方法是通过array()来构造,下面的例子是把一个普通列表转换为NumPy数组: In : import numpy as np np.array() O...
什么是绝对误差?什么是相对误差?
1.绝对误差 某量值的绝对误差定义为该量的给出值x(包括实验值、计算近似值等要研究和给出的非真值)与真值A(包括理论真值、约定真值和相对真值等)之差,即 Δx=x-A (2-8) 误差的绝对值越小,...
Stata
长面板数据分析的Stata操作命令
长面板数据的主要特征是时间维度比较大而横截面维度相对较小,对于长面板数据分析,我们不需要在固定效应模型、随机效应模型和混合回归模型之间进行选择,长面板数据分析先验假定长面板数据模型就是固定效应模型,相...
Stata
短面板数据分析的Stata操作命令有哪些?
短面板数据分析的Stata操作命令有哪些? 短面板数据的主要特征是横截面维度比较大而时间维度相对较小,短面板数据分析方法包括直接最小二乘回归分析、固定效应回归分析、随机效应回归分析、组间估计量回归分析...
什么是随机效应回归分析?
随机效应模型(Random Effects Model)是经典的线性模型的一种推广,与固定效应模型不同,随机效应模型把固定效应模型中固定的回归系数看作随机变量。如果模型中一部分系数是随机的,另一部分系...
什么是固定效应回归分析?
如果对于不同的截面或不同的时间序列,只是模型的截距项不同,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型又分为3类:个体固定效应模型、时点固定效应模型、时点个体固定效应模型。具体来说...
Stata
面板数据预处理的Stata操作命令有哪些?
1.设置面板数据 设置面板数据的命令为xtset,该命令的语法格式为: xtset panelvar timevar xtset为命令,panelvar为截面变量,timevar为时间变量,在设置面板...
Stata
生存分析参数模型命令streg的语法格式?
生存分析参数模型命令streg的语法格式? 生存分析参数模型的命令为streg,streg使用参数模型进行最大似然估计,该命令的语法格式为: streg 其中streg为命令,为被解释变量,为条件表达...
Stata
估计后绘制生存、风险或累积风险函数图的命令:stcurve
估计后绘制生存、风险或累积风险函数图的命令:stcurve 我们在执行stcox、streg、stintreg、mestreg、xtstreg等命令估计后,绘制生存、风险或累积风险函数图的基本命令为s...
Stata
Cox半参数模型的Stata操作命令:stcox
Cox半参数模型的Stata操作命令:stcox Cox半参数模型的命令为stcox,该命令的语法格式为: stcox 其中stcox为命令,为被解释变量,为条件表达式,用于设置样本范围,为可选项,主...
比例风险假定检验的Stata操作命令是什么?
比例风险假定检验的Stata操作命令是什么? (1)绘制对数-对数图 若对数-对数图中的曲线相互平行, 则比例风险设置是成立的。对应的命令及其语法格式为: stphplot , {by(varname...
生存分析的方法可以分为哪3种?
生存分析方法最初为参数模型(Parametric Model),它可以估计出影响因素对风险率的影响及各时点的生存率,但对生存时间分布有一定的要求,但该类模型假设生存数据服从某个已知分布,使用参数分布方...
生存分析的数据类型有哪些?
生存分析所使用的数据被称为生存数据,用于度量某事件发生前所经历的时间长度。生存数据按照观测数据信息完整性的差异可分为完全数据、删失数据和截尾数据3种。 完全数据:即提供了完整信息的数据。如研究汽车的生...
生存分析涉及的基本概念有哪些?
1.生存时间 从特定起点开始到所研究事件发生的时间。事件发生的时间就是计时终点,这通常是比较好确定的,比如患者确实发生了死亡,计算机发生了报废,但计时起点很多时候难以确定,比如前面提及的患者患病,如果...