统计聚合_开发指南_表格存储_企业版

背景信息

统计聚合的详细功能请参见下表。

功能	说明
最小值	返回一个字段中的最小值，类似于SQL中的min。
最大值	返回一个字段中的最大值，类似于SQL中的max。
和	返回数值字段的总数，类似于SQL中的sum。
平均值	返回数值字段的平均值，类似于SQL中的avg。
统计行数	返回指定字段值的数量或者多元索引数据总行数，类似于SQL中的count。
去重统计行数	返回指定字段不同值的数量，类似于SQL中的count（distinct）。
字段值分组	根据一个字段的值对查询结果进行分组，相同的字段值放到同一分组内，返回每个分组的值和该值对应的个数。
范围分组	根据一个字段的范围对查询结果进行分组，字段值在某范围内放到同一分组内，返回每个范围中相应的item个数。
地理位置分组	根据距离某一个中心点的范围对查询结果进行分组，距离差值在某范围内放到同一分组内，返回每个范围中相应的item个数。
过滤条件分组	按照过滤条件对查询结果进行分组，获取每个过滤条件匹配到的数量，返回结果的顺序和添加过滤条件的顺序一致。
嵌套	分组类型的统计聚合功能支持嵌套，其内部可以添加子统计聚合。
多个统计聚合	多个统计聚合功能可以组合使用。

前提条件

已初始化Client。具体操作，请参见初始化。
已创建数据表并写入数据。
已在数据表上创建多元索引。具体操作，请参见创建多元索引。

最小值

返回一个字段中的最小值，类似于SQL中的min。

参数

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long和Double类型。
Missing	当某行数据中的字段为空时，字段值的默认值。如果未设置Missing值，则在统计聚合时会忽略该行。如果设置了Missing值，则使用Missing值作为字段值的默认值参与统计聚合。

示例

/**
 *  商品库中有每一种商品的价格，求产地为浙江省的商品中，价格最低的商品价格是多少。
 *  等效的SQL语句是SELECT min(column_price) FROM product where place_of_production="浙江省";
func min(client *tablestore.TableStoreClient, tableName string, indexName string) {
    searchRequest := &tablestore.SearchRequest{}
    searchRequest.
        SetTableName(tableName).    //设置数据表名称。
        SetIndexName(indexName).    //设置多元索引名称。
        SetSearchQuery(search.NewSearchQuery().
            SetQuery(&search.TermQuery{"place_of_production", "浙江省"}).
            SetLimit(0).    //如果只关心统计聚合结果，不关心具体数据，您可以将limit设置为0来提高性能。
            Aggregation(search.NewMinAggregation("min_agg_1", "column_price").Missing(0.00)))
    searchResponse, err := client.Search(searchRequest)    //执行查询。
    aggResults := searchResponse.AggregationResults        //获取统计聚合结果。
    agg1, err := aggResults.Min("min_agg_1")        //获取名称为"min_agg_1"的统计聚合结果。
    if err != nil {
        panic(err)
    if agg1.HasValue() {        //名称为"min_agg_1"的统计聚合结果是否有Value值。
        fmt.Println(agg1.Value)    //打印统计聚合结果。
}

最大值

返回一个字段中的最大值，类似于SQL中的max。

参数

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long和Double类型。
Missing	当某行数据中的字段为空时，字段值的默认值。如果未设置Missing值，则在统计聚合时会忽略该行。如果设置了Missing值，则使用Missing值作为字段值的默认值参与统计聚合。

示例

/**
 * 商品库中有每一种商品的价格，求产地为浙江省的商品中，价格最高的商品价格是多少。
 * 等效的SQL语句是SELECT max(column_price) FROM product where place_of_production="浙江省"。
func max(client *tablestore.TableStoreClient, tableName string, indexName string) {
    searchRequest := &tablestore.SearchRequest{}
    searchRequest.
        SetTableName(tableName).    //设置数据表名称。
        SetIndexName(indexName).    //设置多元索引名称。
        SetSearchQuery(search.NewSearchQuery().
            SetQuery(&search.TermQuery{"place_of_production", "浙江省"}).
            SetLimit(0).    //如果只关心统计聚合结果，不关心具体数据，您可以将limit设置为0来提高性能。
            Aggregation(search.NewMaxAggregation("max_agg_1", "column_price").Missing(0.00)))
    searchResponse, err := client.Search(searchRequest)    //执行查询。
    aggResults := searchResponse.AggregationResults        //获取统计聚合结果。
    agg1, err := aggResults.Max("max_agg_1")        //获取名称为"max_agg_1"的统计聚合结果。
    if err != nil {
        panic(err)
    if agg1.HasValue() {        //名称为"max_agg_1"的统计聚合结果是否有Value值。
        fmt.Println(agg1.Value)    //打印统计聚合结果。
}

和

返回数值字段的总数，类似于SQL中的sum。

参数

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long和Double类型。
Missing	当某行数据中的字段为空时，字段值的默认值。如果未设置Missing值，则在统计聚合时会忽略该行。如果设置了Missing值，则使用Missing值作为字段值的默认值参与统计聚合。

示例

/**
 * 商品库中有每一种商品的售出数量，求产地为浙江省的商品中，一共售出了多少件商品。如果某一件商品没有该值，默认售出了10件。
 * 等效的SQL语句是SELECT sum(column_price) FROM product where place_of_production="浙江省"。
func sum(client *tablestore.TableStoreClient, tableName string, indexName string) {
    searchRequest := &tablestore.SearchRequest{}
    searchRequest.
        SetTableName(tableName).    //设置数据表名称。
        SetIndexName(indexName).    //设置多元索引名称。
        SetSearchQuery(search.NewSearchQuery().
            SetQuery(&search.TermQuery{"place_of_production", "浙江省"}).
            SetLimit(0).    //如果只关心统计聚合结果，不关心具体数据，您可以将limit设置为0来提高性能。
            Aggregation(search.NewSumAggregation("sum_agg_1", "column_price").Missing(0.00)))
    searchResponse, err := client.Search(searchRequest)    //执行查询。
    aggResults := searchResponse.AggregationResults        //获取统计聚合结果。
    agg1, err := aggResults.Sum("sum_agg_1")        //获取名称为"sum_agg_1"的统计聚合结果。
    if err != nil {
        panic(err)
    fmt.Println(agg1.Value)    //打印统计聚合结果。
}

平均值

返回数值字段的平均值，类似于SQL中的avg。

参数

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long和Double类型。
Missing	当某行数据中的字段为空时，字段值的默认值。如果未设置Missing值，则在统计聚合时会忽略该行。如果设置了Missing值，则使用Missing值作为字段值的默认值参与统计聚合。

示例

/**
 * 商品库中有每一种商品的售出数量，求产地为浙江省的商品中，平均价格是多少。
 * 等效的SQL语句是SELECT avg(column_price) FROM product where place_of_production="浙江省"。
func avg(client *tablestore.TableStoreClient, tableName string, indexName string) {
    searchRequest := &tablestore.SearchRequest{}
    searchRequest.
        SetTableName(tableName).    //设置数据表名称。
        SetIndexName(indexName).    //设置多元索引名称。
        SetSearchQuery(search.NewSearchQuery().
            SetQuery(&search.TermQuery{"place_of_production", "浙江省"}).
            SetLimit(0).    //如果只关心统计聚合结果，不关心具体数据，您可以将limit设置为0来提高性能。
            Aggregation(search.NewAvgAggregation("avg_agg_1", "column_price").Missing(0.00)))
    searchResponse, err := client.Search(searchRequest)    //执行查询。
    aggResults := searchResponse.AggregationResults        //获取统计聚合结果。
    agg1, err := aggResults.Avg("avg_agg_1")        //获取名称为"avg_agg_1"的统计聚合结果。
    if err != nil {
        panic(err)
    if agg1.HasValue() {        //名称为"agg1"的统计聚合结果是否有Value值。
        fmt.Println(agg1.Value)    //打印统计聚合结果。
}

统计行数

返回指定字段值的数量或者多元索引数据总行数，类似于SQL中的count。

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long、Double、Boolean、Keyword和Geo_point类型。

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long、Double、Boolean、Keyword和Geo_point类型。
Missing	当某行数据中的字段为空时，字段值的默认值。如果未设置Missing值，则在统计聚合时会忽略该行。如果设置了Missing值，则使用Missing值作为字段值的默认值参与统计聚合。

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long、Double、Boolean和Keyword类型。
Size	返回的分组数量。
GroupBySorters	分组中的item排序规则，默认按照分组中item的数量降序排序，多个排序则按照添加的顺序进行排列。支持的参数如下：按照值的字典序升序排列按照值的字典序降序排列按照行数升序排列按照行数降序排列按照子统计聚合结果中值升序排列按照子统计聚合结果中值降序排列
SubAggregation和SubGroupBy	子统计聚合，子统计聚合会根据分组内容再进行一次统计聚合分析。场景统计每个类别的商品数量，且统计每个类别价格的最大值和最小值。方法最外层的统计聚合是根据类别进行分组，再添加两个子统计聚合求价格的最大值和最小值。结果示例水果：5个（其中价格的最大值为15，最小值为3）洗漱用品：10个（其中价格的最大值为98，最小值为1）电子设备：3个（其中价格的最大值为8699，最小值为2300）其它：15个（其中价格的最大值为1000，最小值为80）

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Long和Double类型。
Range(fromInclusive float64, toExclusive float64)	分组的范围。起始值fromInclusive可以使用最小值NegInf，结束值toExclusive可以使用最大值Inf。
SubAggregation和SubGroupBy	子统计聚合，子统计聚合会根据分组内容再进行一次统计聚合分析。例如按销量分组后再按省份分组，即可获得某个销量范围内哪个省比重比较大，实现方法是GroupByRange下添加一个GroupByField。

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
FieldName	用于统计聚合的字段，仅支持Geo_point类型。
CenterPoint(latitude float64, longitude float64)	起始中心点的经纬度。 latitude是起始中心点坐标纬度，longitude是起始中心点坐标经度。
Range(fromInclusive float64, toExclusive float64)	分组的范围，单位为米。起始值fromInclusive可以使用最小值NegInf，结束值toExclusive可以使用最大值Inf。
SubAggregation和SubGroupBy	子统计聚合，子统计聚合会根据分组内容再进行一次统计聚合分析。

参数	说明
Name	自定义的统计聚合名称，用于区分不同的统计聚合，可根据此名称获取本次统计聚合结果。
Query	过滤条件，返回结果的顺序和添加过滤条件的顺序一致。
SubAggregation和SubGroupBy	子统计聚合，子统计聚合会根据分组内容再进行一次统计聚合分析。

/**
 * 嵌套的统计聚合示例。
 * 外层GroupByField中添加了2个Aggregation和1个GroupByRange。
func NestedSample(client *tablestore.TableStoreClient, tableName string, indexName string) {
    searchRequest := &tablestore.SearchRequest{}
    searchRequest.
        SetTableName(tableName).    //设置数据表名称。
        SetIndexName(indexName).    //设置多元索引名称。
        SetSearchQuery(search.NewSearchQuery().
            SetQuery(&search.MatchAllQuery{}).    //匹配所有行。
            SetLimit(0).
            GroupBy(search.NewGroupByField("group1", "field1").
                SubAggregation(search.NewMinAggregation("sub_agg1", "sub_field1")).
                SubAggregation(search.NewMaxAggregation("sub_agg2", "sub_field2")).
                SubGroupBy(search.NewGroupByRange("sub_group1", "sub_field3").
                    Range(search.NegInf, 3).
                    Range(3, 5).
                    Range(5, search.Inf))))
    searchResponse, err := client.Search(searchRequest)
    if err != nil {
        fmt.Printf("%#v", err)
        return
    groupByResults := searchResponse.GroupByResults    //获取统计聚合结果。
    group, err := groupByResults.GroupByField("group1")
    if err != nil {
        fmt.Printf("%#v", err)
        return
    for _, item := range group.Items {    //遍历返回的所有分组。
        //打印分组的值和分组中的记录行数。
        fmt.Println("\tkey: ", item.Key, ", rowCount: ", item.RowCount) 
        //获取名称为"sub_agg1"的统计聚合结果。
        subAgg1, _ := item.SubAggregations.Min("sub_agg1")
        if subAgg1.HasValue() {
            fmt.Println("\t\tsub_agg1: ", subAgg1.Value)
        //获取名称为"sub_agg2"的统计聚合结果。
        subAgg2, _ := item.SubAggregations.Max("sub_agg2")
        if subAgg2.HasValue() {
            fmt.Println("\t\tsub_agg2: ", subAgg2.Value)
        //获取名称为"sub_group1"的统计聚合结果。
        subGroup, _ := item.SubGroupBys.GroupByRange("sub_group1")
        for _, item := range subGroup.Items {
            fmt.Println("\t\t[", item.From, ", ", item.To, "), rowCount: ", item.RowCount)
}

背景信息

前提条件

最小值

最大值

和

平均值

统计行数

去重统计行数

字段值分组

范围分组

地理位置分组

过滤条件分组

嵌套

多个统计聚合