在 ggplot2中显示堆叠条形图上的数据值

我想在 ggplot2中显示堆叠条形图上的数据值

Year      <- c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4))
Category  <- c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <- c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data      <- data.frame(Year, Category, Frequency)
library(ggplot2)
p <- qplot(Year, Frequency, data = Data, geom = "bar", fill = Category,     theme_set(theme_bw()))
p + geom_text(aes(label = Frequency), size = 3, hjust = 0.5, vjust = 3, position =     "stack")

enter image description here

我想在每个部分的中间显示这些数据值。在这方面的任何帮助都将不胜感激。谢谢

260807 次浏览

ggplot 2.2.0标签可以很容易地堆叠使用 position = position_stack(vjust = 0.5)geom_text

ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
geom_bar(stat = "identity") +
geom_text(size = 3, position = position_stack(vjust = 0.5))

enter image description here

还要注意“ position_stack()position_fill()现在按照分组的相反顺序堆栈值,这使得默认堆栈顺序与图例匹配。”


答案对旧版本的 ggplot有效:

这里有一种方法,它计算棒的中点。

library(ggplot2)
library(plyr)


# calculate midpoints of bars (simplified using comment by @DWin)
Data <- ddply(Data, .(Year),
transform, pos = cumsum(Frequency) - (0.5 * Frequency)
)


# library(dplyr) ## If using dplyr...
# Data <- group_by(Data,Year) %>%
#    mutate(pos = cumsum(Frequency) - (0.5 * Frequency))


# plot bars and add text
p <- ggplot(Data, aes(x = Year, y = Frequency)) +
geom_bar(aes(fill = Category), stat="identity") +
geom_text(aes(label = Frequency, y = pos), size = 3)

Resultant chart

正如 Hadley 提到的,有比堆叠条形图中的标签更有效的方式来传达你的信息。事实上,叠加图表并不是很有效,因为条形图(每个类别)并不共享一个轴,所以很难进行比较。

在这些实例中使用两个图形,共享一个公共轴几乎总是更好的。在你的例子中,我假设你想显示整体的总数,然后是每个类别在给定年份中贡献的比例。

library(grid)
library(gridExtra)
library(plyr)


# create a new column with proportions
prop <- function(x) x/sum(x)
Data <- ddply(Data,"Year",transform,Share=prop(Frequency))


# create the component graphics
totals <- ggplot(Data,aes(Year,Frequency)) + geom_bar(fill="darkseagreen",stat="identity") +
xlab("") + labs(title = "Frequency totals in given Year")
proportion <- ggplot(Data, aes(x=Year,y=Share, group=Category, colour=Category))
+ geom_line() + scale_y_continuous(label=percent_format())+ theme(legend.position = "bottom") +
labs(title = "Proportion of total Frequency accounted by each Category in given Year")


# bring them together
grid.arrange(totals,proportion)

这会给你一个像这样的2面板显示:

Vertically stacked 2 panel graphic

如果要添加频率值,表格是最佳格式。

如@Ramnath 编辑的@Henrik 给出的答案所示,通过向 position_stack()vjust参数传递一个参数,可以调整标签的相对位置,这对居中的标签非常有效。在问题本身中,@MYaseen208展示了如何使用垂直对齐替换标签的位置。在 R 调整是相对于文本标签的边界框,这可能导致标签的位置略有不同,这取决于标签中的字符(有像“ g”或没有像“ a”) ,或当文本的大小或图形设备改变。根据不同的情况,这可能是一个优势或劣势。

在这里,我提供了一个可供选择的答案,在某些情况下可能是更好的,一个例子,定位文本标签从其原来的位置,由一个恒定的距离在数据单位。这相当于将 position_stack()position_nudge()结合起来,并且可以通过包‘ ggpp’中的 position_stacknudge()来实现。

Year <-
c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4))
Category <-
c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <-
c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data <- data.frame(Year, Category, Frequency)


library(ggplot2)
library(ggpp)


ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
geom_bar(stat = "identity") +
geom_text(size = 3, position = position_stacknudge(y = -60))

创建于2022-09-03与 Reprex v2.0.2