发布时间:2024-03-21 浏览次数: 813

Stata 是一个完整的、集成的软件包,它提供了所有数据科学所需的数据操作、可视化、统计和可重复报告功能。

StataNow包含的新功能

• 高维固定效应(HDFE)

• 相关性的Meta分析

• 对弱工具的稳健性推理

• 通过 工具变量 的SVAR

• 贝叶斯分位数回归

• 贝叶斯非对称Laplace模型

• 增强效应

• Do-fileEditor增强功能

• 更多图形可按变量着色

• VAR模型的稳健SE

• PyStata增强功能

新功能详情点击 这里



数据管理

Stata 的数据管理功能为您提供完全的控制权。

框架 -- 同时管理多个数据集

导入、导出

JDBC ODBC, SQL

排序、匹配、合并、连接、追加、创建

内置电子表格

√  Unicode

处理文本或二进制数据

在本地或 web 上访问数据

跨组收集统计信息

√  BLOBs- 可以保存整个文档的字符串

数十亿行数据

成千上万的变量

生存数据、面板数据、多级数据、调查数据、离散选择数据、多重插补数据、分类数据、时间序列数据


更重要的是,支持您所有的数据科研需求。

出版物质量图形

您可以通过单击来创建自定义图,也可以编写脚本以可复制的方式生成数百或数千个图。将图形导出到 EPS TIFF 以供发布,将图形导出到 PNG SVG 以供 web 使用,或将图形导出到 PDF 以供查看。使用集成 Graph Editor ,您可以单击以更改图形的任何内容,或者添加标题、注释、 线条 、箭头和文本。

Stata 让生成具有出版质量、风格独特的图形变得更加容易。






创建动态文档

自动报告结果所需的所有工具。

动态 Markdown 文档

创建 Word 文档

创建 PDF 文档

创建 Excel 格式的文件

图形方案

 Word, HTML, PDF, SVG, PNG








真正的可再生的研究

很多人谈论可复制研究。 Stata 致力于此已有 30 多年。

我们在不断添加新功能。我们甚至从根本上改变了语言元素。无论如何, Stata 是唯一具有集成版本控制的统计包。如果您在 1985 年编写了一个脚本来执行分析,那么相同的脚本在今天仍然会运行并产生相同的结果。您在 1985 年创建的任何数据集,现在都可以读取。 2050 年也是如此。 Stata 将能够运行您今天所做的任何事情。我们重视产品的可重复性。


PyStata-Python 集成

以交互方式调用 Python 或将 Python 嵌入到 Stata 代码中。从 Python 中调用 Stata ,并在 IPython 环境中调用 Stata 代码。在 Jupyter 笔记本中使用 Stata 。在 Stata Python 之间无缝地传递数据和结果。使用 Python 中的 Stata 分析。在 Stata 中使用任何 Python 包。

  • 用于可视化的 Matplotlib seaborn

  • 用于网页抓取的 Beautiful Soup Scrapy

  • 用于数值分析的 NumPy Panda

  • 用于机器学习的 TensorFlow scikit-learn

……


帮助文档

当您需要进行分析或理解您使用的方法时, Stata 不会让您束手无策,也不会让您通过订购书籍来了解每一个细节。


我们的每个数据管理功能都得到了充分的解释和文档化,并在实际示例中有演示。每个估计量都有完整的文档记录,包括一些关于真实数据的例子,以及如何解释结果的真实讨论。示例提供了数据,这样您就可以在 Stata 中工作,甚至扩展分析。我们将为您提供每个功能的快速入门,展示一些最常见的用法。 我们的方法和公式部分提供了正在计算的内容的细节,我们的参考资料为您提供了更多信息。


Stata 是一个强大的软件包,所以在 35 卷中有超过 18,000 多页的文档。 但是不要担心, 输入 help 和帮助的主题内容 , Stata 将搜索它的关键字、索引,甚至社区贡献的包,从而为您提供您需要了解的关于这个主题的所有信息。 Stata 中的一切都是可用的。


值得信赖

我们不只是对统计方法编程,我们还要验证它们。

您从 Stata 估计值中看到的结果依赖于与其他估计值的比较、一致性和覆盖范围的蒙特卡罗模拟以及统计人员的广泛测试。我们发布的每个 Stata 版本都通过了一个认证套件,其中包含 410 万行测试代码,生成 580 万行输出。我们会对 580 万行输出中的每个数字和文本片段进行验证。


使用方便

Stata 的所有功能都可以通过菜单、对话框、控制面板、数据编辑器、变量管理器、图形编辑器, 表格生成器, 甚至 SEM 图表 生成 器来访问。您可以通过任何分析来指出和单击您的方法。


如果您不想编写命令和脚本,则不必编写。


即使是在单击时,也可以记录所有结果,并在以后的报告中包含它们。您甚至可以保存操作创建的命令,并在稍后重新生成完整的分析。


易于上手

Stata 执行任务的命令直观且易于学习。更便捷的是,关于执行任务的所有知识都可以应用于其他任务。例如,您只需将 if gender=='female' 添加到任何命令中,以将您的分析限制为样本中的女性。您只需将 vce(robust) 添加到任何估计中,即可获得对许多常见假设具有 robust 的标准错误和假设检验。


这种一致性可以更深入研究。关于数据管理命令的知识通常适用于评估命令,反之亦然。还有一组完整的后估计命令来执行假设检验、形成线性和非线性组合、进行预测、形成对比,甚至使用交互图执行边际分析。这些命令在几乎每个评估之后都以相同的方式工作。


排序命令读取和清理数据,然后执行统计检验和评估,最后报告结果,这是可重复研究的核心。 Stata 使得所有的研究人员都可以访问这个过程。


易于自动化

每个人都有他们一直在做的任务 -- 创建特定类型的变量、生成特定的表、执行一系列统计步骤、计算 RMSE 等等。可能性是无限的。 Stata 有数千个内置过程,但是您可能有相对独特的任务,或者希望以特定的方式完成这些任务。

如果您编写了在给定数据集上执行任务的脚本,那么很容易将该脚本转换为可用于所有数据集、任何变量集和任何观察集的脚本。


易于扩展

您自动化的一些东西可能非常有用,您希望与同事共享它们,甚至让 Stata 的所有用户都可以使用它们。那也很简单。只需一小段代码,您就可以将自动化脚本转换为 Stata 命令。支持 Stata 官方命令支持的标准特性的命令。可以像使用正式命令一样使用的命令


高级编程

Stata 还包括一种高级编程语言 Mata

Mata 具有您在编程语言中所期望的结构、指针和分类,并添加了对矩阵编程的直接支持。

虽然使用 Stata 不需要编写程序, 但是了解到一种快速和完整的编程语言是很有必要的。 Mata 既是一个用于操作矩阵的交互式环境,也是一个可以生成编译和优化代码的完整开发环境。它包括处理面板数据的特殊功能,对真实或复杂的矩阵执行操作,为面向对象编程提供完整的支持,并与 Stata 的各个方面完全集成。


Stata 还有 PyStata ,它提供了全面的 Python 集成,允许您直接从 Stata 代码中利用 Python 的所有功能,并从 Python 代码中使用 Stata 的所有功能。


Stata 甚至可以让您通过针对每种语言的本地 API C C++ Java 插件集成到 Stata 程序中。 您甚至可以将 Java 代码直接嵌入到您的 Stata 代码中!

社区促进功能更新

Stata 是可编程的,因此开发人员和用户每天都要添加新功能,以满足当今研究人员日益增长的需求。有了 Stata 的互联网功能,新功能和官方更新可以在互联网上安装。


世界一流的技术支持

Stata 技术支持对注册用户是免费的,这意味着您得到的要比付出的多得多。我们有专业的 Stata 程序员和统计人员来解答您的技术问题。从棘手的数据管理解决方案到让您的图形看起来恰到好处,从解释一个强大的标准错误到指定多级模型,我们都可以给您答案。


跨平台兼容

Stata 可以在 Windows Mac Linux/Unix 计算机上运行。然而,我们的许可证不是特定于平台的。

这意味着如果您有一台 Mac 笔记本电脑和一台 Windows 桌面电脑,您不需要两个单独的许可证来运行 Stata 。您可以在任何受支持的平台上安装 Stata 许可证。 Stata 数据集、程序和其他数据可以跨平台共享,无需转换。您还可以快速轻松地从其他统计软件包、电子表格和数据库导入数据集。


广泛被使用

Stata 被研究人员使用了 30 多年,它提供了数据科学数据操作、可视化、统计和可重复报告所需的一切。 Stata 可以应用的领域包括

行为科学

生物统计

数据科学

经济学

教育学

流行病学

金融、商业和营销

机构研究

医学

政治学

公共卫生

公共政策

社会学


Stata 各版本参数对比

功能

Stata/BE

Stata/SE

Stata/MP




2-core

4-core

6-core

最大变量数

2,048

32,676

120,000


-

-


-




最大观测值

2.14 billion

20 billion

计算速度

1 倍速

2 倍速

4 倍速

更快




-

-

-




-

-

-



-

-



-



使用 1000 万个观测值和 20 个协变量进行逻辑回归的时间

20

10

5.2

<5.2






-

-

-






-

-

-






-

-






-






最大自变量数

798

10,998

65,532



-

-



-








系统需求

Stata for Windows

Windows 11*

Windows 10 *

Windows Server 2022, 2019, 2016, 2012R2 *

* Stata requires 64-bit Windows for x86-64 processors made by Intel or AMD (Core i3 equivalent or better)


Stata for Mac

Mac with Apple Silicon or Intel processors

macOS 11.0 (Big Sur) or newer for Macs with Apple Silicon and macOS 10.13 (High Sierra) or newer for Macs with Intel processors


Stata for Linux

Any 64-bit (Core i3 equivalent or better) running Linux

Minimum requirements include the GNU C library (glibc) 2.17 or better and libcurl4

Check the output of ldd -v within a terminal

For xstata, you need to have GTK 2.24 installed


硬件需求

版本

内存空间

磁盘空间

Stata/BE

1 GB

2 GB

Stata/SE

2 GB

2 GB

Stata/MP

4 GB

2 GB