ggplot2 – 介绍

ggplot2 – 介绍


ggplot2 是一个 R 包,专为数据可视化和提供最佳探索性数据分析而设计。它提供了漂亮、轻松的绘图,可以处理微小的细节,例如绘制图例并表示它们。可以反复创建绘图并在以后进行编辑。该软件包旨在以分层方式工作,首先显示在使用 R 进行探索性数据分析期间收集的原始数据的层,然后添加注释和统计摘要层。

即使是最有经验的 R 用户也需要帮助来创建优雅的图形。这个库是在 R 中创建图形的非凡工具,但即使经过多年几乎每天的使用,我们仍然需要参考我们的备忘单。

这个包在称为“图形语法”的深层语法下工作,它由一组可以通过多种方式创建的独立组件组成。“图形语法”是使 ggplot2 非常强大的唯一原因,因为 R 开发人员不仅限于在其他包中使用的一组预先指定的图形。语法包括一组简单的核心规则和原则。

2005年,威尔金森创造了或者说是首创了图形语法的概念来描述所有统计图形之间包含的深层特征。它侧重于层的主要部分,包括适应嵌入 R 的功能。

“图形语法”与R的关系

它告诉用户或开发人员,统计图形用于将数据映射到美学属性,例如颜色、形状、相关几何对象(如点、线和条)的大小。该图还可能包含绘制在上述坐标系上的相关数据的各种统计变换。它还包括一个称为“分面”的功能,通常用于为上述数据集的不同子集创建相同的图。R 包括各种内置数据集。这些独立组件的组合完全构成了一个特定的图形。

现在让我们关注可以参考语法创建的不同类型的图 –

数据

如果用户想要可视化给定的美学映射集,它描述了数据中所需的变量如何映射在一起以创建映射的美学属性。

图层

它由几何元素和所需的统计变换组成。图层包括几何对象、用于短数据的几何对象,它们在点、线、多边形等的帮助下实际表示绘图。最好的演示是对观测值进行分箱和计数,以创建用于总结特定线性模型的 2D 关系的特定直方图。

比例用于映射数据空间中的值,该数据空间用于创建值,无论是颜色、大小和形状。它有助于绘制提供逆映射所需的图例或轴,从而可以从上述图中读取原始数据值。

坐标系

它描述了如何将数据坐标一起映射到上述图形平面。它还提供读取图形所需的轴和网格线的信息。通常它用作笛卡尔坐标系,其中包括极坐标和地图投影。

刻面

它包括有关如何将数据分解为所需子集并将子集显示为数据倍数的规范。这也称为调节或格子过程。

主题

它控制更精细的显示点,如字体大小和背景颜色属性。为了创造一个有吸引力的情节,最好考虑参考资料。

现在,讨论语法不提供的限制或功能也同样重要 –

  • 它缺乏应该使用哪些图形或用户有兴趣做什么的建议。

  • 它不描述交互性,因为它只包括静态图形的描述。对于动态图形的创建,应应用其他替代解决方案。

下面提到了使用 ggplot2 创建的简单图形 –

使用 ggplot2 创建的图形

觉得文章有用?

点个广告表达一下你的爱意吧 !😁