doc/html/aggregate-functions_8cc_source.html

 // Copyright 2012 Cloudera Inc.

 //

 // Licensed under the Apache License, Version 2.0 (the "License");

 // you may not use this file except in compliance with the License.

 // You may obtain a copy of the License at

 //

 // http://www.apache.org/licenses/LICENSE-2.0

 //

 // Unless required by applicable law or agreed to in writing, software

 // distributed under the License is distributed on an "AS IS" BASIS,

 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 // See the License for the specific language governing permissions and

 // limitations under the License.


 #include "exprs/aggregate-functions.h"


 #include <math.h>

 #include <sstream>

 #include <algorithm>


 #include <boost/random/ranlux.hpp>

 #include <boost/random/uniform_int.hpp>


 #include "common/logging.h"

 #include "runtime/decimal-value.h"

 #include "runtime/string-value.h"

 #include "runtime/timestamp-value.h"

 #include "exprs/anyval-util.h"


 #include "common/names.h"


 using boost::uniform_int;

 using boost::ranlux64_3;

 using std::push_heap;

 using std::pop_heap;


 // TODO: this file should be cross compiled and then all of the builtin

 // aggregate functions will have a codegen enabled path. Then we can remove

 // the custom code in aggregation node.

 namespace impala {


 // Converts any UDF Val Type to a string representation

 template <typename T>

 StringVal ToStringVal(FunctionContext* context, T val) {

   stringstream ss;

   ss << val;

   const string &str = ss.str();

   StringVal string_val(context, str.size());

   memcpy(string_val.ptr, str.c_str(), str.size());

   return string_val;

 }


 // Delimiter to use if the separator is NULL.

 static const StringVal DEFAULT_STRING_CONCAT_DELIM((uint8_t*)", ", 2);


 // Hyperloglog precision. Default taken from paper. Doesn't seem to matter very

 // much when between [6,12]

 const int AggregateFunctions::HLL_PRECISION = 10;

 const int AggregateFunctions::HLL_LEN = 1024; // 2^HLL_PRECISION


 void AggregateFunctions::InitNull(FunctionContext*, AnyVal* dst) {

   dst->is_null = true;

 }


 template<typename T>

 void AggregateFunctions::InitZero(FunctionContext*, T* dst) {

   dst->is_null = false;

   dst->val = 0;

 }


 template<>

 void AggregateFunctions::InitZero(FunctionContext*, DecimalVal* dst) {

   dst->is_null = false;

   dst->val16 = 0;

 }


 StringVal AggregateFunctions::StringValGetValue(

     FunctionContext* ctx, const StringVal& src) {

   if (src.is_null) return src;

   StringVal result(ctx, src.len);

   memcpy(result.ptr, src.ptr, src.len);

   return result;

 }


 StringVal AggregateFunctions::StringValSerializeOrFinalize(

     FunctionContext* ctx, const StringVal& src) {

   StringVal result = StringValGetValue(ctx, src);

   if (!src.is_null) ctx->Free(src.ptr);

   return result;

 }


 void AggregateFunctions::CountUpdate(

     FunctionContext*, const AnyVal& src, BigIntVal* dst) {

   DCHECK(!dst->is_null);

   if (!src.is_null) ++dst->val;

 }


 void AggregateFunctions::CountStarUpdate(FunctionContext*, BigIntVal* dst) {

   DCHECK(!dst->is_null);

   ++dst->val;

 }


 void AggregateFunctions::CountRemove(

     FunctionContext*, const AnyVal& src, BigIntVal* dst) {

   DCHECK(!dst->is_null);

   if (!src.is_null) {

     --dst->val;

     DCHECK_GE(dst->val, 0);

   }

 }


 void AggregateFunctions::CountStarRemove(FunctionContext*, BigIntVal* dst) {

   DCHECK(!dst->is_null);

   --dst->val;

   DCHECK_GE(dst->val, 0);

 }


 void AggregateFunctions::CountMerge(FunctionContext*, const BigIntVal& src,

     BigIntVal* dst) {

   DCHECK(!dst->is_null);

   DCHECK(!src.is_null);

   dst->val += src.val;

 }


 struct AvgState {

   double sum;

   int64_t count;

 };


 void AggregateFunctions::AvgInit(FunctionContext* ctx, StringVal* dst) {

   dst->is_null = false;

   dst->len = sizeof(AvgState);

   dst->ptr = ctx->Allocate(dst->len);

   memset(dst->ptr, 0, sizeof(AvgState));

 }


 template <typename T>

 void AggregateFunctions::AvgUpdate(FunctionContext* ctx, const T& src, StringVal* dst) {

   if (src.is_null) return;

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(AvgState), dst->len);

   AvgState* avg = reinterpret_cast<AvgState*>(dst->ptr);

   avg->sum += src.val;

   ++avg->count;

 }


 template <typename T>

 void AggregateFunctions::AvgRemove(FunctionContext* ctx, const T& src, StringVal* dst) {

   // Remove doesn't need to explicitly check the number of calls to Update() or Remove()

   // because Finalize() returns NULL if count is 0.

   if (src.is_null) return;

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(AvgState), dst->len);

   AvgState* avg = reinterpret_cast<AvgState*>(dst->ptr);

   avg->sum -= src.val;

   --avg->count;

   DCHECK_GE(avg->count, 0);

 }


 void AggregateFunctions::AvgMerge(FunctionContext* ctx, const StringVal& src,

     StringVal* dst) {

   const AvgState* src_struct = reinterpret_cast<const AvgState*>(src.ptr);

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(AvgState), dst->len);

   AvgState* dst_struct = reinterpret_cast<AvgState*>(dst->ptr);

   dst_struct->sum += src_struct->sum;

   dst_struct->count += src_struct->count;

 }


 DoubleVal AggregateFunctions::AvgGetValue(FunctionContext* ctx, const StringVal& src) {

   AvgState* val_struct = reinterpret_cast<AvgState*>(src.ptr);

   if (val_struct->count == 0) return DoubleVal::null();

   return DoubleVal(val_struct->sum / val_struct->count);

 }


 DoubleVal AggregateFunctions::AvgFinalize(FunctionContext* ctx, const StringVal& src) {

   DoubleVal result = AvgGetValue(ctx, src);

   ctx->Free(src.ptr);

   return result;

 }


 void AggregateFunctions::TimestampAvgUpdate(FunctionContext* ctx,

     const TimestampVal& src, StringVal* dst) {

   if (src.is_null) return;

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(AvgState), dst->len);

   AvgState* avg = reinterpret_cast<AvgState*>(dst->ptr);

   double val = TimestampValue::FromTimestampVal(src).ToSubsecondUnixTime();

   avg->sum += val;

   ++avg->count;

 }


 void AggregateFunctions::TimestampAvgRemove(FunctionContext* ctx,

     const TimestampVal& src, StringVal* dst) {

   if (src.is_null) return;

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(AvgState), dst->len);

   AvgState* avg = reinterpret_cast<AvgState*>(dst->ptr);

   double val = TimestampValue::FromTimestampVal(src).ToSubsecondUnixTime();

   avg->sum -= val;

   --avg->count;

   DCHECK_GE(avg->count, 0);

 }


 TimestampVal AggregateFunctions::TimestampAvgGetValue(FunctionContext* ctx,

     const StringVal& src) {

   AvgState* val_struct = reinterpret_cast<AvgState*>(src.ptr);

   if (val_struct->count == 0) return TimestampVal::null();

   TimestampValue tv(val_struct->sum / val_struct->count);

   TimestampVal result;

   tv.ToTimestampVal(&result);

   return result;

 }


 TimestampVal AggregateFunctions::TimestampAvgFinalize(FunctionContext* ctx,

     const StringVal& src) {

   TimestampVal result = TimestampAvgGetValue(ctx, src);

   ctx->Free(src.ptr);

   return result;

 }


 struct DecimalAvgState {

   DecimalVal sum; // only using val16

   int64_t count;

 };


 void AggregateFunctions::DecimalAvgInit(FunctionContext* ctx, StringVal* dst) {

   dst->is_null = false;

   dst->len = sizeof(DecimalAvgState);

   dst->ptr = ctx->Allocate(dst->len);

   memset(dst->ptr, 0, sizeof(DecimalAvgState));

 }


 void AggregateFunctions::DecimalAvgUpdate(FunctionContext* ctx, const DecimalVal& src,

     StringVal* dst) {

   DecimalAvgAddOrRemove(ctx, src, dst, false);

 }


 void AggregateFunctions::DecimalAvgRemove(FunctionContext* ctx, const DecimalVal& src,

     StringVal* dst) {

   DecimalAvgAddOrRemove(ctx, src, dst, true);

 }


 void AggregateFunctions::DecimalAvgAddOrRemove(FunctionContext* ctx,

     const DecimalVal& src, StringVal* dst, bool remove) {

   if (src.is_null) return;

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(DecimalAvgState), dst->len);

   DecimalAvgState* avg = reinterpret_cast<DecimalAvgState*>(dst->ptr);

   const FunctionContext::TypeDesc* arg_desc = ctx->GetArgType(0);

   DCHECK(arg_desc != NULL);

   const ColumnType& arg_type = AnyValUtil::TypeDescToColumnType(*arg_desc);


   // Since the src and dst are guaranteed to be the same scale, we can just

   // do a simple add.

   int m = remove ? -1 : 1;

   switch (arg_type.GetByteSize()) {

     case 4:

       avg->sum.val16 += m * src.val4;

       break;

     case 8:

       avg->sum.val16 += m * src.val8;

       break;

     case 16:

       avg->sum.val16 += m * src.val16;

       break;

     default:

       DCHECK(false) << "Invalid byte size for type " << arg_type.DebugString();

   }

   if (remove) {

     --avg->count;

     DCHECK_GE(avg->count, 0);

   } else {

     ++avg->count;

   }

 }


 void AggregateFunctions::DecimalAvgMerge(FunctionContext* ctx,

     const StringVal& src, StringVal* dst) {

   const DecimalAvgState* src_struct =

       reinterpret_cast<const DecimalAvgState*>(src.ptr);

   DCHECK(dst->ptr != NULL);

   DCHECK_EQ(sizeof(DecimalAvgState), dst->len);

   DecimalAvgState* dst_struct = reinterpret_cast<DecimalAvgState*>(dst->ptr);

   dst_struct->sum.val16 += src_struct->sum.val16;

   dst_struct->count += src_struct->count;

 }


 DecimalVal AggregateFunctions::DecimalAvgGetValue(FunctionContext* ctx,

     const StringVal& src) {

   DecimalAvgState* val_struct = reinterpret_cast<DecimalAvgState*>(src.ptr);

   if (val_struct->count == 0) return DecimalVal::null();

   const FunctionContext::TypeDesc& output_desc = ctx->GetReturnType();

   DCHECK_EQ(FunctionContext::TYPE_DECIMAL, output_desc.type);

   Decimal16Value sum(val_struct->sum.val16);

   Decimal16Value count(val_struct->count);

   // The scale of the accumulated sum must be the same as the scale of the return type.

   // TODO: Investigate whether this is always the right thing to do. Does the current

   // implementation result in an unacceptable loss of output precision?

   ColumnType sum_type = ColumnType::CreateDecimalType(38, output_desc.scale);

   ColumnType count_type = ColumnType::CreateDecimalType(38, 0);

   bool is_nan = false;

   bool overflow = false;

   Decimal16Value result = sum.Divide<int128_t>(sum_type, count, count_type,

       output_desc.scale, &is_nan, &overflow);

   if (UNLIKELY(is_nan)) return DecimalVal::null();

   if (UNLIKELY(overflow)) {

     ctx->AddWarning("Avg computation overflowed, returning NULL");

     return DecimalVal::null();

   }

   return DecimalVal(result.value());

 }


 DecimalVal AggregateFunctions::DecimalAvgFinalize(FunctionContext* ctx,

     const StringVal& src) {

   DecimalVal result = DecimalAvgGetValue(ctx, src);

   ctx->Free(src.ptr);

   return result;

 }


 template<typename SRC_VAL, typename DST_VAL>

 void AggregateFunctions::SumUpdate(FunctionContext* ctx, const SRC_VAL& src,

     DST_VAL* dst) {

   if (src.is_null) {

     // Do not count null values towards the number of updates

     ctx->impl()->IncrementNumUpdates(-1);

     return;

   }

   if (dst->is_null) InitZero<DST_VAL>(ctx, dst);

   dst->val += src.val;

 }


 template<typename SRC_VAL, typename DST_VAL>

 void AggregateFunctions::SumRemove(FunctionContext* ctx, const SRC_VAL& src,

     DST_VAL* dst) {

   // Do not count null values towards the number of removes

   if (src.is_null) ctx->impl()->IncrementNumRemoves(-1);

   if (ctx->impl()->num_removes() >= ctx->impl()->num_updates()) {

     *dst = DST_VAL::null();

     return;

   }

   if (src.is_null) return;

   if (dst->is_null) InitZero<DST_VAL>(ctx, dst);

   dst->val -= src.val;

 }


 void AggregateFunctions::SumDecimalUpdate(FunctionContext* ctx,

     const DecimalVal& src, DecimalVal* dst) {

   SumDecimalAddOrSubtract(ctx, src, dst);

 }


 void AggregateFunctions::SumDecimalRemove(FunctionContext* ctx,

     const DecimalVal& src, DecimalVal* dst) {

   if (ctx->impl()->num_removes() >= ctx->impl()->num_updates()) {

     *dst = DecimalVal::null();

     return;

   }

   SumDecimalAddOrSubtract(ctx, src, dst, true);

 }


 void AggregateFunctions::SumDecimalAddOrSubtract(FunctionContext* ctx,

     const DecimalVal& src, DecimalVal* dst, bool subtract) {

   if (src.is_null) return;

   if (dst->is_null) InitZero<DecimalVal>(ctx, dst);

   const FunctionContext::TypeDesc* arg_desc = ctx->GetArgType(0);

   // Since the src and dst are guaranteed to be the same scale, we can just

   // do a simple add.

   int m = subtract ? -1 : 1;

   if (arg_desc->precision <= 9) {

     dst->val16 += m * src.val4;

   } else if (arg_desc->precision <= 19) {

     dst->val16 += m * src.val8;

   } else {

     dst->val16 += m * src.val16;

   }

 }


 void AggregateFunctions::SumDecimalMerge(FunctionContext* ctx,

     const DecimalVal& src, DecimalVal* dst) {

   if (src.is_null) return;

   if (dst->is_null) InitZero<DecimalVal>(ctx, dst);

   dst->val16 += src.val16;

 }


 template<typename T>

 void AggregateFunctions::Min(FunctionContext*, const T& src, T* dst) {

   if (src.is_null) return;

   if (dst->is_null || src.val < dst->val) *dst = src;

 }


 template<typename T>

 void AggregateFunctions::Max(FunctionContext*, const T& src, T* dst) {

   if (src.is_null) return;

   if (dst->is_null || src.val > dst->val) *dst = src;

 }


 void AggregateFunctions::InitNullString(FunctionContext* c, StringVal* dst) {

   dst->is_null = true;

   dst->ptr = NULL;

   dst->len = 0;

 }


 template<>

 void AggregateFunctions::Min(FunctionContext* ctx, const StringVal& src, StringVal* dst) {

   if (src.is_null) return;

   if (dst->is_null ||

       StringValue::FromStringVal(src) < StringValue::FromStringVal(*dst)) {

     if (!dst->is_null) ctx->Free(dst->ptr);

     uint8_t* copy = ctx->Allocate(src.len);

     memcpy(copy, src.ptr, src.len);

     *dst = StringVal(copy, src.len);

   }

 }


 template<>

 void AggregateFunctions::Max(FunctionContext* ctx, const StringVal& src, StringVal* dst) {

   if (src.is_null) return;

   if (dst->is_null ||

       StringValue::FromStringVal(src) > StringValue::FromStringVal(*dst)) {

     if (!dst->is_null) ctx->Free(dst->ptr);

     uint8_t* copy = ctx->Allocate(src.len);

     memcpy(copy, src.ptr, src.len);

     *dst = StringVal(copy, src.len);

   }

 }


 template<>

 void AggregateFunctions::Min(FunctionContext* ctx,

     const DecimalVal& src, DecimalVal* dst) {

   if (src.is_null) return;

   const FunctionContext::TypeDesc* arg = ctx->GetArgType(0);

   DCHECK(arg != NULL);

   if (arg->precision <= 9) {

     if (dst->is_null || src.val4 < dst->val4) *dst = src;

   } else if (arg->precision <= 19) {

     if (dst->is_null || src.val8 < dst->val8) *dst = src;

   } else {

     if (dst->is_null || src.val16 < dst->val16) *dst = src;

   }

 }


 template<>

 void AggregateFunctions::Max(FunctionContext* ctx,

     const DecimalVal& src, DecimalVal* dst) {

   if (src.is_null) return;

   const FunctionContext::TypeDesc* arg = ctx->GetArgType(0);

   DCHECK(arg != NULL);

   if (arg->precision <= 9) {

     if (dst->is_null || src.val4 > dst->val4) *dst = src;

   } else if (arg->precision <= 19) {

     if (dst->is_null || src.val8 > dst->val8) *dst = src;

   } else {

     if (dst->is_null || src.val16 > dst->val16) *dst = src;

   }

 }


 template<>

 void AggregateFunctions::Min(FunctionContext*,

     const TimestampVal& src, TimestampVal* dst) {

   if (src.is_null) return;

   if (dst->is_null) {

     *dst = src;

     return;

   }

   TimestampValue src_tv = TimestampValue::FromTimestampVal(src);

   TimestampValue dst_tv = TimestampValue::FromTimestampVal(*dst);

   if (src_tv < dst_tv) *dst = src;

 }


 template<>

 void AggregateFunctions::Max(FunctionContext*,

     const TimestampVal& src, TimestampVal* dst) {

   if (src.is_null) return;

   if (dst->is_null) {

     *dst = src;

     return;

   }

   TimestampValue src_tv = TimestampValue::FromTimestampVal(src);

   TimestampValue dst_tv = TimestampValue::FromTimestampVal(*dst);

   if (src_tv > dst_tv) *dst = src;

 }


 // StringConcat intermediate state starts with the length of the first

 // separator, followed by the accumulated string.  The accumulated

 // string starts with the separator of the first value that arrived in

 // StringConcatUpdate().

 typedef int StringConcatHeader;


 void AggregateFunctions::StringConcatUpdate(FunctionContext* ctx,

     const StringVal& src, StringVal* result) {

   StringConcatUpdate(ctx, src, DEFAULT_STRING_CONCAT_DELIM, result);

 }


 void AggregateFunctions::StringConcatUpdate(FunctionContext* ctx,

     const StringVal& src, const StringVal& separator, StringVal* result) {

   if (src.is_null) return;

   const StringVal* sep = separator.is_null ? &DEFAULT_STRING_CONCAT_DELIM : &separator;

   if (result->is_null) {

     // Header of the intermediate state holds the length of the first separator.

     const int header_len = sizeof(StringConcatHeader);

     DCHECK(header_len == sizeof(sep->len));

     *result = StringVal(ctx->Allocate(header_len), header_len);

     *reinterpret_cast<StringConcatHeader*>(result->ptr) = sep->len;

   }

   int new_len = result->len + sep->len + src.len;

   result->ptr = ctx->Reallocate(result->ptr, new_len);

   memcpy(result->ptr + result->len, sep->ptr, sep->len);

   result->len += sep->len;

   memcpy(result->ptr + result->len, src.ptr, src.len);

   result->len += src.len;

   DCHECK(result->len == new_len);

 }


 void AggregateFunctions::StringConcatMerge(FunctionContext* ctx,

     const StringVal& src, StringVal* result) {

   if (src.is_null) return;

   const int header_len = sizeof(StringConcatHeader);

   if (result->is_null) {

     // Copy the header from the first intermediate value.

     *result = StringVal(ctx->Allocate(header_len), header_len);

     *reinterpret_cast<StringConcatHeader*>(result->ptr) =

         *reinterpret_cast<StringConcatHeader*>(src.ptr);

   }

   // Append the string portion of the intermediate src to result (omit src's header).

   int new_len = result->len + src.len - header_len;

   result->ptr = ctx->Reallocate(result->ptr, new_len);

   memcpy(result->ptr + result->len, src.ptr + header_len, src.len - header_len);

   result->len += src.len - header_len;

   DCHECK(result->len == new_len);

 }


 StringVal AggregateFunctions::StringConcatFinalize(FunctionContext* ctx,

     const StringVal& src) {

   if (src.is_null) return src;

   const int header_len = sizeof(StringConcatHeader);

   DCHECK(src.len >= header_len);

   int sep_len = *reinterpret_cast<StringConcatHeader*>(src.ptr);

   DCHECK(src.len >= header_len + sep_len);

   // Remove the header and the first separator.

   StringVal result(ctx, src.len - header_len - sep_len);

   memcpy(result.ptr, src.ptr + header_len + sep_len, result.len);

   ctx->Free(src.ptr);

   return result;

 }


 // Compute distinctpc and distinctpcsa using Flajolet and Martin's algorithm

 // (Probabilistic Counting Algorithms for Data Base Applications)

 // We have implemented two variants here: one with stochastic averaging (with PCSA

 // postfix) and one without.

 // There are 4 phases to compute the aggregate:

 //   1. allocate a bitmap, stored in the aggregation tuple's output string slot

 //   2. update the bitmap per row (UpdateDistinctEstimateSlot)

 //   3. for distributed plan, merge the bitmaps from all the nodes

 //      (UpdateMergeEstimateSlot)

 //   4. compute the estimate using the bitmaps when all the rows are processed

 //      (FinalizeEstimateSlot)

 const static int NUM_PC_BITMAPS = 64; // number of bitmaps

 const static int PC_BITMAP_LENGTH = 32; // the length of each bit map

 const static float PC_THETA = 0.77351f; // the magic number to compute the final result


 void AggregateFunctions::PcInit(FunctionContext* c, StringVal* dst) {

   // Initialize the distinct estimate bit map - Probabilistic Counting Algorithms for Data

   // Base Applications (Flajolet and Martin)

   //

   // The bitmap is a 64bit(1st index) x 32bit(2nd index) matrix.

   // So, the string length of 256 byte is enough.

   // The layout is:

   //   row  1: 8bit 8bit 8bit 8bit

   //   row  2: 8bit 8bit 8bit 8bit

   //   ...     ..

   //   ...     ..

   //   row 64: 8bit 8bit 8bit 8bit

   //

   // Using 32bit length, we can count up to 10^8. This will not be enough for Fact table

   // primary key, but once we approach the limit, we could interpret the result as

   // "every row is distinct".

   //

   // We use "string" type for DISTINCT_PC function so that we can use the string

   // slot to hold the bitmaps.

   dst->is_null = false;

   int str_len = NUM_PC_BITMAPS * PC_BITMAP_LENGTH / 8;

   dst->ptr = c->Allocate(str_len);

   dst->len = str_len;

   memset(dst->ptr, 0, str_len);

 }


 static inline void SetDistinctEstimateBit(uint8_t* bitmap,

     uint32_t row_index, uint32_t bit_index) {

   // We need to convert Bitmap[alpha,index] into the index of the string.

   // alpha tells which of the 32bit we've to jump to.

   // index then lead us to the byte and bit.

   uint32_t *int_bitmap = reinterpret_cast<uint32_t*>(bitmap);

   int_bitmap[row_index] |= (1 << bit_index);

 }


 static inline bool GetDistinctEstimateBit(uint8_t* bitmap,

     uint32_t row_index, uint32_t bit_index) {

   uint32_t *int_bitmap = reinterpret_cast<uint32_t*>(bitmap);

   return ((int_bitmap[row_index] & (1 << bit_index)) > 0);

 }


 template<typename T>

 void AggregateFunctions::PcUpdate(FunctionContext* c, const T& input, StringVal* dst) {

   if (input.is_null) return;

   // Core of the algorithm. This is a direct translation of the code in the paper.

   // Please see the paper for details. For simple averaging, we need to compute hash

   // values NUM_PC_BITMAPS times using NUM_PC_BITMAPS different hash functions (by using a

   // different seed).

   for (int i = 0; i < NUM_PC_BITMAPS; ++i) {

     uint32_t hash_value = AnyValUtil::Hash(input, *c->GetArgType(0), i);

     int bit_index = __builtin_ctz(hash_value);

     if (UNLIKELY(hash_value == 0)) bit_index = PC_BITMAP_LENGTH - 1;

     // Set bitmap[i, bit_index] to 1

     SetDistinctEstimateBit(dst->ptr, i, bit_index);

   }

 }


 template<typename T>

 void AggregateFunctions::PcsaUpdate(FunctionContext* c, const T& input, StringVal* dst) {

   if (input.is_null) return;


   // Core of the algorithm. This is a direct translation of the code in the paper.

   // Please see the paper for details. Using stochastic averaging, we only need to

   // the hash value once for each row.

   uint32_t hash_value = AnyValUtil::Hash(input, *c->GetArgType(0), 0);

   uint32_t row_index = hash_value % NUM_PC_BITMAPS;


   // We want the zero-based position of the least significant 1-bit in binary

   // representation of hash_value. __builtin_ctz does exactly this because it returns

   // the number of trailing 0-bits in x (or undefined if x is zero).

   int bit_index = __builtin_ctz(hash_value / NUM_PC_BITMAPS);

   if (UNLIKELY(hash_value == 0)) bit_index = PC_BITMAP_LENGTH - 1;


   // Set bitmap[row_index, bit_index] to 1

   SetDistinctEstimateBit(dst->ptr, row_index, bit_index);

 }


 string DistinctEstimateBitMapToString(uint8_t* v) {

   stringstream debugstr;

   for (int i = 0; i < NUM_PC_BITMAPS; ++i) {

     for (int j = 0; j < PC_BITMAP_LENGTH; ++j) {

       // print bitmap[i][j]

       debugstr << GetDistinctEstimateBit(v, i, j);

     }

     debugstr << "\n";

   }

   debugstr << "\n";

   return debugstr.str();

 }


 void AggregateFunctions::PcMerge(FunctionContext* c,

     const StringVal& src, StringVal* dst) {

   DCHECK(!src.is_null);

   DCHECK(!dst->is_null);

   DCHECK_EQ(src.len, NUM_PC_BITMAPS * PC_BITMAP_LENGTH / 8);


   // Merge the bits

   // I think _mm_or_ps can do it, but perf doesn't really matter here. We call this only

   // once group per node.

   for (int i = 0; i < NUM_PC_BITMAPS * PC_BITMAP_LENGTH / 8; ++i) {

     *(dst->ptr + i) |= *(src.ptr + i);

   }


   VLOG_ROW << "UpdateMergeEstimateSlot Src Bit map:\n"

            << DistinctEstimateBitMapToString(src.ptr);

   VLOG_ROW << "UpdateMergeEstimateSlot Dst Bit map:\n"

            << DistinctEstimateBitMapToString(dst->ptr);

 }


 double DistinceEstimateFinalize(const StringVal& src) {

   DCHECK(!src.is_null);

   DCHECK_EQ(src.len, NUM_PC_BITMAPS * PC_BITMAP_LENGTH / 8);

   VLOG_ROW << "FinalizeEstimateSlot Bit map:\n"

            << DistinctEstimateBitMapToString(src.ptr);


   // We haven't processed any rows if none of the bits are set. Therefore, we have zero

   // distinct rows. We're overwriting the result in the same string buffer we've

   // allocated.

   bool is_empty = true;

   for (int i = 0; i < NUM_PC_BITMAPS * PC_BITMAP_LENGTH / 8; ++i) {

     if (src.ptr[i] != 0) {

       is_empty = false;

       break;

     }

   }

   if (is_empty) return 0;


   // Convert the bitmap to a number, please see the paper for details

   // In short, we count the average number of leading 1s (per row) in the bit map.

   // The number is proportional to the log2(1/NUM_PC_BITMAPS of  the actual number of

   // distinct).

   // To get the actual number of distinct, we'll do 2^avg / PC_THETA.

   // PC_THETA is a magic number.

   int sum = 0;

   for (int i = 0; i < NUM_PC_BITMAPS; ++i) {

     int row_bit_count = 0;

     // Count the number of leading ones for each row in the bitmap

     // We could have used the build in __builtin_clz to count of number of leading zeros

     // but we first need to invert the 1 and 0.

     while (GetDistinctEstimateBit(src.ptr, i, row_bit_count) &&

         row_bit_count < PC_BITMAP_LENGTH) {

       ++row_bit_count;

     }

     sum += row_bit_count;

   }

   double avg = static_cast<double>(sum) / static_cast<double>(NUM_PC_BITMAPS);

   double result = pow(static_cast<double>(2), avg) / PC_THETA;

   return result;

 }


 BigIntVal AggregateFunctions::PcFinalize(FunctionContext* c, const StringVal& src) {

   DCHECK(!src.is_null);

   double estimate = DistinceEstimateFinalize(src);

   c->Free(src.ptr);

   return static_cast<int64_t>(estimate);

 }


 BigIntVal AggregateFunctions::PcsaFinalize(FunctionContext* c, const StringVal& src) {

   DCHECK(!src.is_null);

   // When using stochastic averaging, the result has to be multiplied by NUM_PC_BITMAPS.

   double estimate = DistinceEstimateFinalize(src) * NUM_PC_BITMAPS;

   c->Free(src.ptr);

   return static_cast<int64_t>(estimate);

 }


 // Histogram constants

 // TODO: Expose as constant argument parameters to the UDA.

 const static int NUM_BUCKETS = 100;

 const static int NUM_SAMPLES_PER_BUCKET = 200;

 const static int NUM_SAMPLES = NUM_BUCKETS * NUM_SAMPLES_PER_BUCKET;

 const static int MAX_STRING_SAMPLE_LEN = 10;


 template <typename T>

 struct ReservoirSample {

   // Sample value

   T val;

   // Key on which the samples are sorted.

   double key;


   ReservoirSample() : key(-1) { }

   ReservoirSample(const T& val) : val(val), key(-1) { }


   // Gets a copy of the sample value that allocates memory from ctx, if necessary.

   T GetValue(FunctionContext* ctx) { return val; }

 };


 // Template specialization for StringVal because we do not store the StringVal itself.

 // Instead, we keep fixed size arrays and truncate longer strings if necessary.

 template <>

 struct ReservoirSample<StringVal> {

   uint8_t val[MAX_STRING_SAMPLE_LEN];

   int len; // Size of string (up to MAX_STRING_SAMPLE_LEN)

   double key;


   ReservoirSample() : len(0), key(-1) { }


   ReservoirSample(const StringVal& string_val) : key(-1) {

     len = min(string_val.len, MAX_STRING_SAMPLE_LEN);

     memcpy(&val[0], string_val.ptr, len);

   }


   // Gets a copy of the sample value that allocates memory from ctx, if necessary.

   StringVal GetValue(FunctionContext* ctx) {

     StringVal result = StringVal(ctx, len);

     memcpy(result.ptr, &val[0], len);

     return result;

   }

 };


 template <typename T>

 struct ReservoirSampleState {

   ReservoirSample<T> samples[NUM_SAMPLES];


   // Number of collected samples.

   int num_samples;


   // Number of values over which the samples were collected.

   int64_t source_size;


   // Random number generator for generating 64-bit integers

   // TODO: Replace with mt19937_64 when upgrading boost

   ranlux64_3 rng;


   int64_t GetNext64(int64_t max) {

     uniform_int<int64_t> dist(0, max);

     return dist(rng);

   }

 };


 template <typename T>

 void AggregateFunctions::ReservoirSampleInit(FunctionContext* ctx, StringVal* dst) {

   int str_len = sizeof(ReservoirSampleState<T>);

   dst->is_null = false;

   dst->ptr = ctx->Allocate(str_len);

   dst->len = str_len;

   memset(dst->ptr, 0, str_len);

   *reinterpret_cast<ReservoirSampleState<T>*>(dst->ptr) = ReservoirSampleState<T>();

 }


 template <typename T>

 void AggregateFunctions::ReservoirSampleUpdate(FunctionContext* ctx, const T& src,

     StringVal* dst) {

   if (src.is_null) return;

   DCHECK(!dst->is_null);

   DCHECK_EQ(dst->len, sizeof(ReservoirSampleState<T>));

   ReservoirSampleState<T>* state = reinterpret_cast<ReservoirSampleState<T>*>(dst->ptr);


   if (state->num_samples < NUM_SAMPLES) {

     state->samples[state->num_samples++] = ReservoirSample<T>(src);

   } else {

     int64_t r = state->GetNext64(state->source_size);

     if (r < NUM_SAMPLES) state->samples[r] = ReservoirSample<T>(src);

   }

   ++state->source_size;

 }


 template <typename T>

 const StringVal AggregateFunctions::ReservoirSampleSerialize(FunctionContext* ctx,

     const StringVal& src) {

   if (src.is_null) return src;

   StringVal result(ctx, src.len);

   memcpy(result.ptr, src.ptr, src.len);

   ctx->Free(src.ptr);


   ReservoirSampleState<T>* state = reinterpret_cast<ReservoirSampleState<T>*>(result.ptr);

   // Assign keys to the samples that haven't been set (i.e. if serializing after

   // Update()). In weighted reservoir sampling the keys are typically assigned as the

   // sources are being sampled, but this requires maintaining the samples in sorted order

   // (by key) and it accomplishes the same thing at this point because all data points

   // coming into Update() get the same weight. When the samples are later merged, they do

   // have different weights (set here) that are proportional to the source_size, i.e.

   // samples selected from a larger stream are more likely to end up in the final sample

   // set. In order to avoid the extra overhead in Update(), we approximate the keys by

   // picking random numbers in the range [(SOURCE_SIZE - SAMPLE_SIZE)/(SOURCE_SIZE), 1].

   // This weights the keys by SOURCE_SIZE and implies that the samples picked had the

   // highest keys, because values not sampled would have keys between 0 and

   // (SOURCE_SIZE - SAMPLE_SIZE)/(SOURCE_SIZE).

   for (int i = 0; i < state->num_samples; ++i) {

     if (state->samples[i].key >= 0) continue;

     int r = rand() % state->num_samples;

     state->samples[i].key = ((double) state->source_size - r) / state->source_size;

   }

   return result;

 }


 template <typename T>

 bool SampleValLess(const ReservoirSample<T>& i, const ReservoirSample<T>& j) {

   return i.val.val < j.val.val;

 }


 template <>

 bool SampleValLess(const ReservoirSample<StringVal>& i,

     const ReservoirSample<StringVal>& j) {

   int n = min(i.len, j.len);

   int result = memcmp(&i.val[0], &j.val[0], n);

   if (result == 0) return i.len < j.len;

   return result < 0;

 }


 template <>

 bool SampleValLess(const ReservoirSample<DecimalVal>& i,

     const ReservoirSample<DecimalVal>& j) {

   return i.val.val16 < j.val.val16;

 }


 template <>

 bool SampleValLess(const ReservoirSample<TimestampVal>& i,

     const ReservoirSample<TimestampVal>& j) {

   if (i.val.date == j.val.date) return i.val.time_of_day < j.val.time_of_day;

   else return i.val.date < j.val.date;

 }


 template <typename T>

 bool SampleKeyGreater(const ReservoirSample<T>& i, const ReservoirSample<T>& j) {

   return i.key > j.key;

 }


 template <typename T>

 void AggregateFunctions::ReservoirSampleMerge(FunctionContext* ctx,

     const StringVal& src_val, StringVal* dst_val) {

   if (src_val.is_null) return;

   DCHECK(!dst_val->is_null);

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(ReservoirSampleState<T>));

   DCHECK_EQ(dst_val->len, sizeof(ReservoirSampleState<T>));

   ReservoirSampleState<T>* src = reinterpret_cast<ReservoirSampleState<T>*>(src_val.ptr);

   ReservoirSampleState<T>* dst = reinterpret_cast<ReservoirSampleState<T>*>(dst_val->ptr);


   int src_idx = 0;

   int src_max = src->num_samples;

   // First, fill up the dst samples if they don't already exist. The samples are now

   // ordered as a min-heap on the key.

   while (dst->num_samples < NUM_SAMPLES && src_idx < src_max) {

     DCHECK_GE(src->samples[src_idx].key, 0);

     dst->samples[dst->num_samples++] = src->samples[src_idx++];

     push_heap(dst->samples, dst->samples + dst->num_samples, SampleKeyGreater<T>);

   }

   // Then for every sample from source, take the sample if the key is greater than

   // the minimum key in the min-heap.

   while (src_idx < src_max) {

     DCHECK_GE(src->samples[src_idx].key, 0);

     if (src->samples[src_idx].key > dst->samples[0].key) {

       pop_heap(dst->samples, dst->samples + NUM_SAMPLES, SampleKeyGreater<T>);

       dst->samples[NUM_SAMPLES - 1] = src->samples[src_idx];

       push_heap(dst->samples, dst->samples + NUM_SAMPLES, SampleKeyGreater<T>);

     }

     ++src_idx;

   }

   dst->source_size += src->source_size;

 }


 template <typename T>

 void PrintSample(const ReservoirSample<T>& v, ostream* os) { *os << v.val.val; }


 template <>

 void PrintSample(const ReservoirSample<TinyIntVal>& v, ostream* os) {

   *os << static_cast<int32_t>(v.val.val);

 }


 template <>

 void PrintSample(const ReservoirSample<StringVal>& v, ostream* os) {

   string s(reinterpret_cast<const char*>(&v.val[0]), v.len);

   *os << s;

 }


 template <>

 void PrintSample(const ReservoirSample<DecimalVal>& v, ostream* os) {

   *os << v.val.val16;

 }


 template <>

 void PrintSample(const ReservoirSample<TimestampVal>& v, ostream* os) {

   *os << TimestampValue::FromTimestampVal(v.val).DebugString();

 }


 template <typename T>

 StringVal AggregateFunctions::ReservoirSampleFinalize(FunctionContext* ctx,

     const StringVal& src_val) {

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(ReservoirSampleState<T>));

   ReservoirSampleState<T>* src = reinterpret_cast<ReservoirSampleState<T>*>(src_val.ptr);


   stringstream out;

   for (int i = 0; i < src->num_samples; ++i) {

     PrintSample<T>(src->samples[i], &out);

     if (i < (src->num_samples - 1)) out << ", ";

   }

   const string& out_str = out.str();

   StringVal result_str(ctx, out_str.size());

   memcpy(result_str.ptr, out_str.c_str(), result_str.len);

   ctx->Free(src_val.ptr);

   return result_str;

 }


 template <typename T>

 StringVal AggregateFunctions::HistogramFinalize(FunctionContext* ctx,

     const StringVal& src_val) {

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(ReservoirSampleState<T>));


   ReservoirSampleState<T>* src = reinterpret_cast<ReservoirSampleState<T>*>(src_val.ptr);

   sort(src->samples, src->samples + src->num_samples, SampleValLess<T>);


   stringstream out;

   int num_buckets = min(src->num_samples, NUM_BUCKETS);

   int samples_per_bucket = max(src->num_samples / NUM_BUCKETS, 1);

   for (int bucket_idx = 0; bucket_idx < num_buckets; ++bucket_idx) {

     int sample_idx = (bucket_idx + 1) * samples_per_bucket - 1;

     PrintSample<T>(src->samples[sample_idx], &out);

     if (bucket_idx < (num_buckets - 1)) out << ", ";

   }

   const string& out_str = out.str();

   StringVal result_str(ctx, out_str.size());

   memcpy(result_str.ptr, out_str.c_str(), result_str.len);

   ctx->Free(src_val.ptr);

   return result_str;

 }


 template <typename T>

 T AggregateFunctions::AppxMedianFinalize(FunctionContext* ctx,

     const StringVal& src_val) {

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(ReservoirSampleState<T>));


   ReservoirSampleState<T>* src = reinterpret_cast<ReservoirSampleState<T>*>(src_val.ptr);

   if (src->num_samples == 0) {

     ctx->Free(src_val.ptr);

     return T::null();

   }

   sort(src->samples, src->samples + src->num_samples, SampleValLess<T>);


   T result = src->samples[src->num_samples / 2].GetValue(ctx);

   ctx->Free(src_val.ptr);

   return result;

 }


 void AggregateFunctions::HllInit(FunctionContext* ctx, StringVal* dst) {

   int str_len = HLL_LEN;

   dst->is_null = false;

   dst->ptr = ctx->Allocate(str_len);

   dst->len = str_len;

   memset(dst->ptr, 0, str_len);

 }


 template <typename T>

 void AggregateFunctions::HllUpdate(FunctionContext* ctx, const T& src, StringVal* dst) {

   if (src.is_null) return;

   DCHECK(!dst->is_null);

   DCHECK_EQ(dst->len, HLL_LEN);

   uint64_t hash_value =

       AnyValUtil::Hash64(src, *ctx->GetArgType(0), HashUtil::FNV64_SEED);

   if (hash_value != 0) {

     // Use the lower bits to index into the number of streams and then

     // find the first 1 bit after the index bits.

     int idx = hash_value & (HLL_LEN - 1);

     uint8_t first_one_bit = __builtin_ctzl(hash_value >> HLL_PRECISION) + 1;

     dst->ptr[idx] = ::max(dst->ptr[idx], first_one_bit);

   }

 }


 void AggregateFunctions::HllMerge(FunctionContext* ctx, const StringVal& src,

     StringVal* dst) {

   DCHECK(!dst->is_null);

   DCHECK(!src.is_null);

   DCHECK_EQ(dst->len, HLL_LEN);

   DCHECK_EQ(src.len, HLL_LEN);

   for (int i = 0; i < src.len; ++i) {

     dst->ptr[i] = ::max(dst->ptr[i], src.ptr[i]);

   }

 }


 uint64_t AggregateFunctions::HllFinalEstimate(const uint8_t* buckets,

     int32_t num_buckets) {

   DCHECK_NOTNULL(buckets);

   DCHECK_EQ(num_buckets, HLL_LEN);


   // Empirical constants for the algorithm.

   float alpha = 0;

   if (HLL_LEN == 16) {

     alpha = 0.673f;

   } else if (HLL_LEN == 32) {

     alpha = 0.697f;

   } else if (HLL_LEN == 64) {

     alpha = 0.709f;

   } else {

     alpha = 0.7213f / (1 + 1.079f / HLL_LEN);

   }


   float harmonic_mean = 0;

   int num_zero_registers = 0;

   // TODO: Consider improving this loop (e.g. replacing 'if' with arithmetic op).

   for (int i = 0; i < num_buckets; ++i) {

     harmonic_mean += powf(2.0f, -buckets[i]);

     if (buckets[i] == 0) ++num_zero_registers;

   }

   harmonic_mean = 1.0f / harmonic_mean;

   int64_t estimate = alpha * HLL_LEN * HLL_LEN * harmonic_mean;


   if (num_zero_registers != 0) {

     // Estimated cardinality is too low. Hll is too inaccurate here, instead use

     // linear counting.

     estimate = HLL_LEN * log(static_cast<float>(HLL_LEN) / num_zero_registers);

   }


   return estimate;

 }


 BigIntVal AggregateFunctions::HllFinalize(FunctionContext* ctx, const StringVal& src) {

   DCHECK(!src.is_null);

   uint64_t estimate = HllFinalEstimate(src.ptr, src.len);

   ctx->Free(src.ptr);

   return estimate;

 }


 // An implementation of a simple single pass variance algorithm. A standard UDA must

 // be single pass (i.e. does not scan the table more than once), so the most canonical

 // two pass approach is not practical.

 struct KnuthVarianceState {

   double mean;

   double m2;

   int64_t count;

 };


 // Set pop=true for population variance, false for sample variance

 double ComputeKnuthVariance(const KnuthVarianceState& state, bool pop) {

   // Return zero for 1 tuple specified by

   // http://docs.oracle.com/cd/B19306_01/server.102/b14200/functions212.htm

   if (state.count == 1) return 0.0;

   if (pop) return state.m2 / state.count;

   return state.m2 / (state.count - 1);

 }


 void AggregateFunctions::KnuthVarInit(FunctionContext* ctx, StringVal* dst) {

   dst->is_null = false;

   DCHECK_EQ(dst->len, sizeof(KnuthVarianceState));

   memset(dst->ptr, 0, dst->len);

 }


 template <typename T>

 void AggregateFunctions::KnuthVarUpdate(FunctionContext* ctx, const T& src,

                                         StringVal* dst) {

   DCHECK(!dst->is_null);

   DCHECK_EQ(dst->len, sizeof(KnuthVarianceState));

   if (src.is_null) return;

   KnuthVarianceState* state = reinterpret_cast<KnuthVarianceState*>(dst->ptr);

   double temp = 1 + state->count;

   double delta = src.val - state->mean;

   double r = delta / temp;

   state->mean += r;

   state->m2 += state->count * delta * r;

   state->count = temp;

 }


 void AggregateFunctions::KnuthVarMerge(FunctionContext* ctx, const StringVal& src,

                                        StringVal* dst) {

   DCHECK(!dst->is_null);

   DCHECK_EQ(dst->len, sizeof(KnuthVarianceState));

   DCHECK(!src.is_null);

   DCHECK_EQ(src.len, sizeof(KnuthVarianceState));

   // Reference implementation:

   // http://en.wikipedia.org/wiki/Algorithms_for_calculating_variance#Parallel_algorithm

   KnuthVarianceState* src_state = reinterpret_cast<KnuthVarianceState*>(src.ptr);

   KnuthVarianceState* dst_state = reinterpret_cast<KnuthVarianceState*>(dst->ptr);

   if (src_state->count == 0) return;

   double delta = dst_state->mean - src_state->mean;

   double sum_count = dst_state->count + src_state->count;

   dst_state->mean = src_state->mean + delta * (dst_state->count / sum_count);

   dst_state->m2 = (src_state->m2) + dst_state->m2 +

       (delta * delta) * (src_state->count * dst_state->count / sum_count);

   dst_state->count = sum_count;

 }


 DoubleVal AggregateFunctions::KnuthVarFinalize(

     FunctionContext* ctx, const StringVal& state_sv) {

   KnuthVarianceState* state = reinterpret_cast<KnuthVarianceState*>(state_sv.ptr);

   if (state->count == 0) return DoubleVal::null();

   double variance = ComputeKnuthVariance(*state, false);

   return DoubleVal(variance);

 }


 DoubleVal AggregateFunctions::KnuthVarPopFinalize(FunctionContext* ctx,

                                                   const StringVal& state_sv) {

   DCHECK(!state_sv.is_null);

   DCHECK_EQ(state_sv.len, sizeof(KnuthVarianceState));

   KnuthVarianceState* state = reinterpret_cast<KnuthVarianceState*>(state_sv.ptr);

   if (state->count == 0) return DoubleVal::null();

   return ComputeKnuthVariance(*state, true);

 }


 DoubleVal AggregateFunctions::KnuthStddevFinalize(FunctionContext* ctx,

                                                   const StringVal& state_sv) {

   DCHECK(!state_sv.is_null);

   DCHECK_EQ(state_sv.len, sizeof(KnuthVarianceState));

   KnuthVarianceState* state = reinterpret_cast<KnuthVarianceState*>(state_sv.ptr);

   if (state->count == 0) return DoubleVal::null();

   return sqrt(ComputeKnuthVariance(*state, false));

 }


 DoubleVal AggregateFunctions::KnuthStddevPopFinalize(FunctionContext* ctx,

                                                      const StringVal& state_sv) {

   DCHECK(!state_sv.is_null);

   DCHECK_EQ(state_sv.len, sizeof(KnuthVarianceState));

   KnuthVarianceState* state = reinterpret_cast<KnuthVarianceState*>(state_sv.ptr);

   if (state->count == 0) return DoubleVal::null();

   return sqrt(ComputeKnuthVariance(*state, true));

 }


 struct RankState {

   int64_t rank;

   int64_t count;

   RankState() : rank(1), count(0) { }

 };


 void AggregateFunctions::RankInit(FunctionContext* ctx, StringVal* dst) {

   int str_len = sizeof(RankState);

   dst->is_null = false;

   dst->ptr = ctx->Allocate(str_len);

   dst->len = str_len;

   *reinterpret_cast<RankState*>(dst->ptr) = RankState();

 }


 void AggregateFunctions::RankUpdate(FunctionContext* ctx, StringVal* dst) {

   DCHECK(!dst->is_null);

   DCHECK_EQ(dst->len, sizeof(RankState));

   RankState* state = reinterpret_cast<RankState*>(dst->ptr);

   ++state->count;

 }


 void AggregateFunctions::DenseRankUpdate(FunctionContext* ctx, StringVal* dst) { }


 BigIntVal AggregateFunctions::RankGetValue(FunctionContext* ctx,

     StringVal& src_val) {

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(RankState));

   RankState* state = reinterpret_cast<RankState*>(src_val.ptr);

   DCHECK_GT(state->count, 0);

   DCHECK_GT(state->rank, 0);

   int64_t result = state->rank;


   // Prepares future calls for the next rank

   state->rank += state->count;

   state->count = 0;

   return BigIntVal(result);

 }


 BigIntVal AggregateFunctions::DenseRankGetValue(FunctionContext* ctx,

     StringVal& src_val) {

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(RankState));

   RankState* state = reinterpret_cast<RankState*>(src_val.ptr);

   DCHECK_EQ(state->count, 0);

   DCHECK_GT(state->rank, 0);

   int64_t result = state->rank;


   // Prepares future calls for the next rank

   ++state->rank;

   return BigIntVal(result);

 }


 BigIntVal AggregateFunctions::RankFinalize(FunctionContext* ctx,

     StringVal& src_val) {

   DCHECK(!src_val.is_null);

   DCHECK_EQ(src_val.len, sizeof(RankState));

   RankState* state = reinterpret_cast<RankState*>(src_val.ptr);

   int64_t result = state->rank;

   ctx->Free(src_val.ptr);

   return BigIntVal(result);

 }


 template <typename T>

 void AggregateFunctions::LastValUpdate(FunctionContext* ctx, const T& src, T* dst) {

   *dst = src;

 }


 template <>

 void AggregateFunctions::LastValUpdate(FunctionContext* ctx, const StringVal& src,

     StringVal* dst) {

   if (src.is_null) {

     if (!dst->is_null) ctx->Free(dst->ptr);

     *dst = StringVal::null();

     return;

   }


   if (dst->is_null) {

     dst->ptr = ctx->Allocate(src.len);

     dst->is_null = false;

   } else {

     dst->ptr = ctx->Reallocate(dst->ptr, src.len);

   }

   memcpy(dst->ptr, src.ptr, src.len);

   dst->len = src.len;

 }


 template <typename T>

 void AggregateFunctions::LastValRemove(FunctionContext* ctx, const T& src, T* dst) {

   if (ctx->impl()->num_removes() >= ctx->impl()->num_updates()) *dst = T::null();

 }


 template <>

 void AggregateFunctions::LastValRemove(FunctionContext* ctx, const StringVal& src,

     StringVal* dst) {

   if (ctx->impl()->num_removes() >= ctx->impl()->num_updates()) {

     if (!dst->is_null) ctx->Free(dst->ptr);

     *dst = StringVal::null();

   }

 }


 template <typename T>

 void AggregateFunctions::FirstValUpdate(FunctionContext* ctx, const T& src, T* dst) {

   // The first call to FirstValUpdate sets the value of dst.

   if (ctx->impl()->num_updates() > 1) return;

   // num_updates is incremented before calling Update(), so it should never be 0.

   // Remove() should never be called for FIRST_VALUE.

   DCHECK_GT(ctx->impl()->num_updates(), 0);

   DCHECK_EQ(ctx->impl()->num_removes(), 0);

   *dst = src;

 }


 template <>

 void AggregateFunctions::FirstValUpdate(FunctionContext* ctx, const StringVal& src,

     StringVal* dst) {

   if (ctx->impl()->num_updates() > 1) return;

   DCHECK_GT(ctx->impl()->num_updates(), 0);

   DCHECK_EQ(ctx->impl()->num_removes(), 0);

   if (src.is_null) {

     *dst = StringVal::null();

     return;

   }

   *dst = StringVal(ctx->Allocate(src.len), src.len);

   memcpy(dst->ptr, src.ptr, src.len);

 }


 template <typename T>

 void AggregateFunctions::FirstValRewriteUpdate(FunctionContext* ctx, const T& src,

     const BigIntVal&, T* dst) {

   LastValUpdate<T>(ctx, src, dst);

 }


 template <typename T>

 void AggregateFunctions::OffsetFnInit(FunctionContext* ctx, T* dst) {

   DCHECK_EQ(ctx->GetNumArgs(), 3);

   DCHECK(ctx->IsArgConstant(1));

   DCHECK(ctx->IsArgConstant(2));

   DCHECK_EQ(ctx->GetArgType(0)->type, ctx->GetArgType(2)->type);

   *dst = *static_cast<T*>(ctx->GetConstantArg(2));

 }


 template <typename T>

 void AggregateFunctions::OffsetFnUpdate(FunctionContext* ctx, const T& src,

     const BigIntVal&, const T& default_value, T* dst) {

   *dst = src;

 }


 // Stamp out the templates for the types we need.

 template void AggregateFunctions::InitZero<BigIntVal>(FunctionContext*, BigIntVal* dst);


 template void AggregateFunctions::AvgUpdate<BigIntVal>(

     FunctionContext* ctx, const BigIntVal& input, StringVal* dst);

 template void AggregateFunctions::AvgUpdate<DoubleVal>(

     FunctionContext* ctx, const DoubleVal& input, StringVal* dst);

 template void AggregateFunctions::AvgRemove<BigIntVal>(

     FunctionContext* ctx, const BigIntVal& input, StringVal* dst);

 template void AggregateFunctions::AvgRemove<DoubleVal>(

     FunctionContext* ctx, const DoubleVal& input, StringVal* dst);


 template void AggregateFunctions::SumUpdate<TinyIntVal, BigIntVal>(

     FunctionContext*, const TinyIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumUpdate<SmallIntVal, BigIntVal>(

     FunctionContext*, const SmallIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumUpdate<IntVal, BigIntVal>(

     FunctionContext*, const IntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumUpdate<BigIntVal, BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumUpdate<FloatVal, DoubleVal>(

     FunctionContext*, const FloatVal& src, DoubleVal* dst);

 template void AggregateFunctions::SumUpdate<DoubleVal, DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);


 template void AggregateFunctions::SumRemove<TinyIntVal, BigIntVal>(

     FunctionContext*, const TinyIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumRemove<SmallIntVal, BigIntVal>(

     FunctionContext*, const SmallIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumRemove<IntVal, BigIntVal>(

     FunctionContext*, const IntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumRemove<BigIntVal, BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::SumRemove<FloatVal, DoubleVal>(

     FunctionContext*, const FloatVal& src, DoubleVal* dst);

 template void AggregateFunctions::SumRemove<DoubleVal, DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);


 template void AggregateFunctions::Min<BooleanVal>(

     FunctionContext*, const BooleanVal& src, BooleanVal* dst);

 template void AggregateFunctions::Min<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, TinyIntVal* dst);

 template void AggregateFunctions::Min<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, SmallIntVal* dst);

 template void AggregateFunctions::Min<IntVal>(

     FunctionContext*, const IntVal& src, IntVal* dst);

 template void AggregateFunctions::Min<BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::Min<FloatVal>(

     FunctionContext*, const FloatVal& src, FloatVal* dst);

 template void AggregateFunctions::Min<DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);

 template void AggregateFunctions::Min<StringVal>(

     FunctionContext*, const StringVal& src, StringVal* dst);

 template void AggregateFunctions::Min<DecimalVal>(

     FunctionContext*, const DecimalVal& src, DecimalVal* dst);


 template void AggregateFunctions::Max<BooleanVal>(

     FunctionContext*, const BooleanVal& src, BooleanVal* dst);

 template void AggregateFunctions::Max<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, TinyIntVal* dst);

 template void AggregateFunctions::Max<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, SmallIntVal* dst);

 template void AggregateFunctions::Max<IntVal>(

     FunctionContext*, const IntVal& src, IntVal* dst);

 template void AggregateFunctions::Max<BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::Max<FloatVal>(

     FunctionContext*, const FloatVal& src, FloatVal* dst);

 template void AggregateFunctions::Max<DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);

 template void AggregateFunctions::Max<StringVal>(

     FunctionContext*, const StringVal& src, StringVal* dst);

 template void AggregateFunctions::Max<DecimalVal>(

     FunctionContext*, const DecimalVal& src, DecimalVal* dst);


 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const BooleanVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const TinyIntVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const SmallIntVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const IntVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const BigIntVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const FloatVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const DoubleVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const TimestampVal&, StringVal*);

 template void AggregateFunctions::PcUpdate(

     FunctionContext*, const DecimalVal&, StringVal*);


 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const BooleanVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const TinyIntVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const SmallIntVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const IntVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const BigIntVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const FloatVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const DoubleVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const TimestampVal&, StringVal*);

 template void AggregateFunctions::PcsaUpdate(

     FunctionContext*, const DecimalVal&, StringVal*);


 template void AggregateFunctions::ReservoirSampleInit<BooleanVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<TinyIntVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<SmallIntVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<IntVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<BigIntVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<FloatVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<DoubleVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<StringVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<TimestampVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::ReservoirSampleInit<DecimalVal>(

     FunctionContext*, StringVal*);


 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const BooleanVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const TinyIntVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const SmallIntVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const IntVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const BigIntVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const FloatVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const DoubleVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const TimestampVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleUpdate(

     FunctionContext*, const DecimalVal&, StringVal*);


 template const StringVal AggregateFunctions::ReservoirSampleSerialize<BooleanVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<TinyIntVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<SmallIntVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<IntVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<BigIntVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<FloatVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<DoubleVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<StringVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<TimestampVal>(

     FunctionContext*, const StringVal&);

 template const StringVal AggregateFunctions::ReservoirSampleSerialize<DecimalVal>(

     FunctionContext*, const StringVal&);


 template void AggregateFunctions::ReservoirSampleMerge<BooleanVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<TinyIntVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<SmallIntVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<IntVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<BigIntVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<FloatVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<DoubleVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<StringVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<TimestampVal>(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::ReservoirSampleMerge<DecimalVal>(

     FunctionContext*, const StringVal&, StringVal*);


 template StringVal AggregateFunctions::ReservoirSampleFinalize<BooleanVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<TinyIntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<SmallIntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<IntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<BigIntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<FloatVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<DoubleVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<StringVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<TimestampVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::ReservoirSampleFinalize<DecimalVal>(

     FunctionContext*, const StringVal&);


 template StringVal AggregateFunctions::HistogramFinalize<BooleanVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<TinyIntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<SmallIntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<IntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<BigIntVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<FloatVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<DoubleVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<StringVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<TimestampVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::HistogramFinalize<DecimalVal>(

     FunctionContext*, const StringVal&);


 template BooleanVal AggregateFunctions::AppxMedianFinalize<BooleanVal>(

     FunctionContext*, const StringVal&);

 template TinyIntVal AggregateFunctions::AppxMedianFinalize<TinyIntVal>(

     FunctionContext*, const StringVal&);

 template SmallIntVal AggregateFunctions::AppxMedianFinalize<SmallIntVal>(

     FunctionContext*, const StringVal&);

 template IntVal AggregateFunctions::AppxMedianFinalize<IntVal>(

     FunctionContext*, const StringVal&);

 template BigIntVal AggregateFunctions::AppxMedianFinalize<BigIntVal>(

     FunctionContext*, const StringVal&);

 template FloatVal AggregateFunctions::AppxMedianFinalize<FloatVal>(

     FunctionContext*, const StringVal&);

 template DoubleVal AggregateFunctions::AppxMedianFinalize<DoubleVal>(

     FunctionContext*, const StringVal&);

 template StringVal AggregateFunctions::AppxMedianFinalize<StringVal>(

     FunctionContext*, const StringVal&);

 template TimestampVal AggregateFunctions::AppxMedianFinalize<TimestampVal>(

     FunctionContext*, const StringVal&);

 template DecimalVal AggregateFunctions::AppxMedianFinalize<DecimalVal>(

     FunctionContext*, const StringVal&);


 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const BooleanVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const TinyIntVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const SmallIntVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const IntVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const BigIntVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const FloatVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const DoubleVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const StringVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const TimestampVal&, StringVal*);

 template void AggregateFunctions::HllUpdate(

     FunctionContext*, const DecimalVal&, StringVal*);


 template void AggregateFunctions::KnuthVarUpdate(

     FunctionContext*, const TinyIntVal&, StringVal*);

 template void AggregateFunctions::KnuthVarUpdate(

     FunctionContext*, const SmallIntVal&, StringVal*);

 template void AggregateFunctions::KnuthVarUpdate(

     FunctionContext*, const IntVal&, StringVal*);

 template void AggregateFunctions::KnuthVarUpdate(

     FunctionContext*, const BigIntVal&, StringVal*);

 template void AggregateFunctions::KnuthVarUpdate(

     FunctionContext*, const FloatVal&, StringVal*);

 template void AggregateFunctions::KnuthVarUpdate(

     FunctionContext*, const DoubleVal&, StringVal*);


 template void AggregateFunctions::LastValUpdate<BooleanVal>(

     FunctionContext*, const BooleanVal& src, BooleanVal* dst);

 template void AggregateFunctions::LastValUpdate<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, TinyIntVal* dst);

 template void AggregateFunctions::LastValUpdate<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, SmallIntVal* dst);

 template void AggregateFunctions::LastValUpdate<IntVal>(

     FunctionContext*, const IntVal& src, IntVal* dst);

 template void AggregateFunctions::LastValUpdate<BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::LastValUpdate<FloatVal>(

     FunctionContext*, const FloatVal& src, FloatVal* dst);

 template void AggregateFunctions::LastValUpdate<DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);

 template void AggregateFunctions::LastValUpdate<StringVal>(

     FunctionContext*, const StringVal& src, StringVal* dst);

 template void AggregateFunctions::LastValUpdate<TimestampVal>(

     FunctionContext*, const TimestampVal& src, TimestampVal* dst);

 template void AggregateFunctions::LastValUpdate<DecimalVal>(

     FunctionContext*, const DecimalVal& src, DecimalVal* dst);


 template void AggregateFunctions::LastValRemove<BooleanVal>(

     FunctionContext*, const BooleanVal& src, BooleanVal* dst);

 template void AggregateFunctions::LastValRemove<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, TinyIntVal* dst);

 template void AggregateFunctions::LastValRemove<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, SmallIntVal* dst);

 template void AggregateFunctions::LastValRemove<IntVal>(

     FunctionContext*, const IntVal& src, IntVal* dst);

 template void AggregateFunctions::LastValRemove<BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::LastValRemove<FloatVal>(

     FunctionContext*, const FloatVal& src, FloatVal* dst);

 template void AggregateFunctions::LastValRemove<DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);

 template void AggregateFunctions::LastValRemove<StringVal>(

     FunctionContext*, const StringVal& src, StringVal* dst);

 template void AggregateFunctions::LastValRemove<TimestampVal>(

     FunctionContext*, const TimestampVal& src, TimestampVal* dst);

 template void AggregateFunctions::LastValRemove<DecimalVal>(

     FunctionContext*, const DecimalVal& src, DecimalVal* dst);


 template void AggregateFunctions::FirstValUpdate<BooleanVal>(

     FunctionContext*, const BooleanVal& src, BooleanVal* dst);

 template void AggregateFunctions::FirstValUpdate<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, TinyIntVal* dst);

 template void AggregateFunctions::FirstValUpdate<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, SmallIntVal* dst);

 template void AggregateFunctions::FirstValUpdate<IntVal>(

     FunctionContext*, const IntVal& src, IntVal* dst);

 template void AggregateFunctions::FirstValUpdate<BigIntVal>(

     FunctionContext*, const BigIntVal& src, BigIntVal* dst);

 template void AggregateFunctions::FirstValUpdate<FloatVal>(

     FunctionContext*, const FloatVal& src, FloatVal* dst);

 template void AggregateFunctions::FirstValUpdate<DoubleVal>(

     FunctionContext*, const DoubleVal& src, DoubleVal* dst);

 template void AggregateFunctions::FirstValUpdate<StringVal>(

     FunctionContext*, const StringVal& src, StringVal* dst);

 template void AggregateFunctions::FirstValUpdate<TimestampVal>(

     FunctionContext*, const TimestampVal& src, TimestampVal* dst);

 template void AggregateFunctions::FirstValUpdate<DecimalVal>(

     FunctionContext*, const DecimalVal& src, DecimalVal* dst);


 template void AggregateFunctions::FirstValRewriteUpdate<BooleanVal>(

     FunctionContext*, const BooleanVal& src, const BigIntVal&, BooleanVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, const BigIntVal&, TinyIntVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, const BigIntVal&, SmallIntVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<IntVal>(

     FunctionContext*, const IntVal& src, const BigIntVal&, IntVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<BigIntVal>(

     FunctionContext*, const BigIntVal& src, const BigIntVal&, BigIntVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<FloatVal>(

     FunctionContext*, const FloatVal& src, const BigIntVal&, FloatVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<DoubleVal>(

     FunctionContext*, const DoubleVal& src, const BigIntVal&, DoubleVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<StringVal>(

     FunctionContext*, const StringVal& src, const BigIntVal&, StringVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<TimestampVal>(

     FunctionContext*, const TimestampVal& src, const BigIntVal&, TimestampVal* dst);

 template void AggregateFunctions::FirstValRewriteUpdate<DecimalVal>(

     FunctionContext*, const DecimalVal& src, const BigIntVal&, DecimalVal* dst);


 template void AggregateFunctions::OffsetFnInit<BooleanVal>(

     FunctionContext*, BooleanVal*);

 template void AggregateFunctions::OffsetFnInit<TinyIntVal>(

     FunctionContext*, TinyIntVal*);

 template void AggregateFunctions::OffsetFnInit<SmallIntVal>(

     FunctionContext*, SmallIntVal*);

 template void AggregateFunctions::OffsetFnInit<IntVal>(

     FunctionContext*, IntVal*);

 template void AggregateFunctions::OffsetFnInit<BigIntVal>(

     FunctionContext*, BigIntVal*);

 template void AggregateFunctions::OffsetFnInit<FloatVal>(

     FunctionContext*, FloatVal*);

 template void AggregateFunctions::OffsetFnInit<DoubleVal>(

     FunctionContext*, DoubleVal*);

 template void AggregateFunctions::OffsetFnInit<StringVal>(

     FunctionContext*, StringVal*);

 template void AggregateFunctions::OffsetFnInit<TimestampVal>(

     FunctionContext*, TimestampVal*);

 template void AggregateFunctions::OffsetFnInit<DecimalVal>(

     FunctionContext*, DecimalVal*);


 template void AggregateFunctions::OffsetFnUpdate<BooleanVal>(

     FunctionContext*, const BooleanVal& src, const BigIntVal&, const BooleanVal&,

     BooleanVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<TinyIntVal>(

     FunctionContext*, const TinyIntVal& src, const BigIntVal&, const TinyIntVal&,

     TinyIntVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<SmallIntVal>(

     FunctionContext*, const SmallIntVal& src, const BigIntVal&, const SmallIntVal&,

     SmallIntVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<IntVal>(

     FunctionContext*, const IntVal& src, const BigIntVal&, const IntVal&, IntVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<BigIntVal>(

     FunctionContext*, const BigIntVal& src, const BigIntVal&, const BigIntVal&,

     BigIntVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<FloatVal>(

     FunctionContext*, const FloatVal& src, const BigIntVal&, const FloatVal&,

     FloatVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<DoubleVal>(

     FunctionContext*, const DoubleVal& src, const BigIntVal&, const DoubleVal&,

     DoubleVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<StringVal>(

     FunctionContext*, const StringVal& src, const BigIntVal&, const StringVal&,

     StringVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<TimestampVal>(

     FunctionContext*, const TimestampVal& src, const BigIntVal&, const TimestampVal&,

     TimestampVal* dst);

 template void AggregateFunctions::OffsetFnUpdate<DecimalVal>(

     FunctionContext*, const DecimalVal& src, const BigIntVal&, const DecimalVal&,

     DecimalVal* dst);

 }

impala::AggregateFunctions::SumDecimalAddOrSubtract
static void SumDecimalAddOrSubtract(FunctionContext *, const DecimalVal &src, DecimalVal *dst, bool subtract=false)
Adds or or subtracts src from dst. Implements Update() and Remove().
Definition: aggregate-functions.cc:362

impala_udf::TinyIntVal::val
int8_t val
Definition: udf.h:383

impala::ReservoirSample::ReservoirSample
ReservoirSample(const T &val)
Definition: aggregate-functions.cc:742

impala::AggregateFunctions::ReservoirSampleUpdate
static void ReservoirSampleUpdate(FunctionContext *, const T &src, StringVal *dst)
Definition: aggregate-functions.cc:802

impala::DecimalValue::value
const T & value() const
Definition: decimal-value.h:285

impala::ReservoirSample< StringVal >::ReservoirSample
ReservoirSample(const StringVal &string_val)
Definition: aggregate-functions.cc:758

impala_udf::FunctionContext::TypeDesc::precision
int precision
Only valid if type == TYPE_DECIMAL.
Definition: udf.h:75

impala::AggregateFunctions::OffsetFnUpdate
static void OffsetFnUpdate(FunctionContext *, const T &src, const BigIntVal &, const T &, T *dst)
Definition: aggregate-functions.cc:1310

impala::AggregateFunctions::SumDecimalRemove
static void SumDecimalRemove(FunctionContext *, const DecimalVal &src, DecimalVal *dst)
Definition: aggregate-functions.cc:353

impala::AggregateFunctions::DecimalAvgGetValue
static DecimalVal DecimalAvgGetValue(FunctionContext *ctx, const StringVal &val)
Definition: aggregate-functions.cc:290

timestamp-value.h

impala_udf::TimestampVal::time_of_day
int64_t time_of_day
Nanoseconds in current day.
Definition: udf.h:499

impala::AggregateFunctions::RankUpdate
static void RankUpdate(FunctionContext *, StringVal *dst)
Update state for RANK.
Definition: aggregate-functions.cc:1183

impala::ReservoirSample
Definition: aggregate-functions.cc:735

impala::NUM_SAMPLES_PER_BUCKET
static const int NUM_SAMPLES_PER_BUCKET
Definition: aggregate-functions.cc:730

impala::AggregateFunctions::PcInit
static void PcInit(FunctionContext *, StringVal *slot)
Definition: aggregate-functions.cc:562

impala::NUM_BUCKETS
static const int NUM_BUCKETS
Definition: aggregate-functions.cc:729

impala::ReservoirSampleState
Definition: aggregate-functions.cc:772

impala::DistinctEstimateBitMapToString
string DistinctEstimateBitMapToString(uint8_t *v)
Definition: aggregate-functions.cc:639

impala::AggregateFunctions::CountStarRemove
static void CountStarRemove(FunctionContext *, BigIntVal *dst)
Definition: aggregate-functions.cc:113

impala::AggregateFunctions::DecimalAvgUpdate
static void DecimalAvgUpdate(FunctionContext *ctx, const DecimalVal &src, StringVal *dst)
Definition: aggregate-functions.cc:235

impala::ReservoirSample::ReservoirSample
ReservoirSample()
Definition: aggregate-functions.cc:741

impala_udf::FunctionContext::impl
impala::FunctionContextImpl * impl()
TODO: Add mechanism for UDAs to update stats similar to runtime profile counters. ...
Definition: udf.h:202

impala::RankState::RankState
RankState()
Definition: aggregate-functions.cc:1172

impala::AnyValUtil::Hash
static uint32_t Hash(const BooleanVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:34

impala::AggregateFunctions::InitZero
static void InitZero(FunctionContext *, T *dst)
Initializes dst to 0.
Definition: aggregate-functions.cc:67

impala::RankState::count
int64_t count
Definition: aggregate-functions.cc:1171

impala_udf::FunctionContext::GetReturnType
const TypeDesc & GetReturnType() const
Definition: udf-ir.cc:34

impala::AggregateFunctions::InitNull
static void InitNull(FunctionContext *, AnyVal *dst)
Initializes dst to NULL.
Definition: aggregate-functions.cc:62

impala::AvgState::count
int64_t count
Definition: aggregate-functions.cc:128

impala_udf::AnyVal
Definition: udf.h:358

impala::AggregateFunctions::FirstValUpdate
static void FirstValUpdate(FunctionContext *, const T &src, T *dst)
Implements FIRST_VALUE.
Definition: aggregate-functions.cc:1270

impala::KnuthVarianceState
Definition: aggregate-functions.cc:1079

impala::AggregateFunctions::DecimalAvgAddOrRemove
static void DecimalAvgAddOrRemove(FunctionContext *ctx, const DecimalVal &src, StringVal *dst, bool remove=false)
Definition: aggregate-functions.cc:245

impala::AnyValUtil::TypeDescToColumnType
static ColumnType TypeDescToColumnType(const FunctionContext::TypeDesc &type)
Definition: anyval-util.cc:101

impala::AggregateFunctions::Max
static void Max(FunctionContext *, const T &src, T *dst)
MaxUpdate/MaxMerge.
Definition: aggregate-functions.cc:393

impala_udf::DecimalVal::val16
__int128_t val16
Definition: udf.h:572

aggregate-functions.h

impala::AggregateFunctions::RankInit
static void RankInit(FunctionContext *, StringVal *slot)
Initializes the state for RANK and DENSE_RANK.
Definition: aggregate-functions.cc:1175

impala::ReservoirSample::val
T val
Definition: aggregate-functions.cc:737

impala::ReservoirSample< StringVal >::ReservoirSample
ReservoirSample()
Definition: aggregate-functions.cc:756

impala_udf::DoubleVal
Definition: udf.h:475

impala::AggregateFunctions::CountStarUpdate
static void CountStarUpdate(FunctionContext *, BigIntVal *dst)
Definition: aggregate-functions.cc:99

impala::AggregateFunctions::HllInit
static void HllInit(FunctionContext *, StringVal *slot)
Definition: aggregate-functions.cc:998

impala::AggregateFunctions::KnuthVarFinalize
static DoubleVal KnuthVarFinalize(FunctionContext *context, const StringVal &val)
Definition: aggregate-functions.cc:1134

impala::DecimalAvgState::count
int64_t count
Definition: aggregate-functions.cc:225

impala::AggregateFunctions::ReservoirSampleMerge
static void ReservoirSampleMerge(FunctionContext *, const StringVal &src, StringVal *dst)
Definition: aggregate-functions.cc:880

impala::ReservoirSampleState::samples
ReservoirSample< T > samples[NUM_SAMPLES]
Definition: aggregate-functions.cc:773

impala::AggregateFunctions::PcFinalize
static BigIntVal PcFinalize(FunctionContext *, const StringVal &src)
Definition: aggregate-functions.cc:712

impala::AggregateFunctions::HllUpdate
static void HllUpdate(FunctionContext *, const T &src, StringVal *dst)
Definition: aggregate-functions.cc:1007

impala::AggregateFunctions::AppxMedianFinalize
static T AppxMedianFinalize(FunctionContext *, const StringVal &src)
Returns an approximate median using reservoir sampling.
Definition: aggregate-functions.cc:981

impala::ToStringVal
StringVal ToStringVal(FunctionContext *context, T val)
Definition: aggregate-functions.cc:45

impala_udf::DecimalVal::val4
int32_t val4
Definition: udf.h:570

impala_udf::TimestampVal::date
int32_t date
Gregorian date. This has the same binary format as boost::gregorian::date.
Definition: udf.h:497

impala::MAX_STRING_SAMPLE_LEN
static const int MAX_STRING_SAMPLE_LEN
Definition: aggregate-functions.cc:732

impala::DEFAULT_STRING_CONCAT_DELIM
static const StringVal DEFAULT_STRING_CONCAT_DELIM((uint8_t *)", ", 2)

impala::ReservoirSample< StringVal >::GetValue
StringVal GetValue(FunctionContext *ctx)
Definition: aggregate-functions.cc:764

impala::PC_BITMAP_LENGTH
static const int PC_BITMAP_LENGTH
Definition: aggregate-functions.cc:559

impala_udf::TimestampVal
This object has a compatible storage format with boost::ptime.
Definition: udf.h:495

logging.h

impala::AggregateFunctions::LastValRemove
static void LastValRemove(FunctionContext *, const T &src, T *dst)
Definition: aggregate-functions.cc:1256

impala::FunctionContextImpl::num_updates
int64_t num_updates() const
Definition: udf-internal.h:86

impala::AggregateFunctions::OffsetFnInit
static void OffsetFnInit(FunctionContext *, T *dst)
Definition: aggregate-functions.cc:1301

impala_udf::StringVal::ptr
uint8_t * ptr
Definition: udf.h:523

impala::ReservoirSampleState::source_size
int64_t source_size
Definition: aggregate-functions.cc:779

impala::AggregateFunctions::CountUpdate
static void CountUpdate(FunctionContext *, const AnyVal &src, BigIntVal *dst)
Implementation of Count and Count(*)
Definition: aggregate-functions.cc:93

impala::hash_value
std::size_t hash_value(const Decimal4Value &v)
This function must be called 'hash_value' to be picked up by boost.
Definition: decimal-value.h:397

impala::ReservoirSample::key
double key
Definition: aggregate-functions.cc:739

impala::PrintSample
void PrintSample(const ReservoirSample< T > &v, ostream *os)
Definition: aggregate-functions.cc:914

impala::AggregateFunctions::StringConcatMerge
static void StringConcatMerge(FunctionContext *, const StringVal &src, StringVal *result)
Definition: aggregate-functions.cc:515

impala::AggregateFunctions::HLL_LEN
static const int HLL_LEN
Definition: aggregate-functions.h:175

impala::DecimalAvgState::sum
DecimalVal sum
Definition: aggregate-functions.cc:224

impala::ReservoirSample< StringVal >::key
double key
Definition: aggregate-functions.cc:754

impala::StringConcatHeader
int StringConcatHeader
Definition: aggregate-functions.cc:488

impala::TimestampValue::ToTimestampVal
void ToTimestampVal(impala_udf::TimestampVal *tv) const
Definition: timestamp-value.h:121

impala::ReservoirSample< StringVal >::val
uint8_t val[MAX_STRING_SAMPLE_LEN]
Definition: aggregate-functions.cc:752

impala::AggregateFunctions::SumDecimalMerge
static void SumDecimalMerge(FunctionContext *, const DecimalVal &src, DecimalVal *dst)
Definition: aggregate-functions.cc:379

impala::AggregateFunctions::HllFinalize
static BigIntVal HllFinalize(FunctionContext *, const StringVal &src)
Definition: aggregate-functions.cc:1069

impala_udf::FunctionContext
Definition: udf.h:47

impala_udf::FunctionContext::AddWarning
bool AddWarning(const char *warning_msg)
Definition: udf.cc:345

impala_udf::FunctionContext::TypeDesc::type
Type type
Definition: udf.h:72

impala_udf::AnyVal::is_null
bool is_null
Definition: udf.h:359

impala::AggregateFunctions::ReservoirSampleFinalize
static StringVal ReservoirSampleFinalize(FunctionContext *, const StringVal &src)
Returns 20,000 unsorted samples as a list of comma-separated values.
Definition: aggregate-functions.cc:938

impala::AggregateFunctions::ReservoirSampleSerialize
static const StringVal ReservoirSampleSerialize(FunctionContext *, const StringVal &src)
Definition: aggregate-functions.cc:819

impala_udf::TinyIntVal
Definition: udf.h:382

impala_udf::FloatVal
Definition: udf.h:458

impala::AggregateFunctions::AvgInit
static void AvgInit(FunctionContext *ctx, StringVal *dst)
Definition: aggregate-functions.cc:131

impala::ColumnType::DebugString
std::string DebugString() const
Definition: types.cc:194

impala::RankState::rank
int64_t rank
Definition: aggregate-functions.cc:1170

impala::AggregateFunctions::SumRemove
static void SumRemove(FunctionContext *, const SRC_VAL &src, DST_VAL *dst)
Definition: aggregate-functions.cc:335

impala::ReservoirSampleState::num_samples
int num_samples
Definition: aggregate-functions.cc:776

impala::AggregateFunctions::AvgUpdate
static void AvgUpdate(FunctionContext *ctx, const T &src, StringVal *dst)
Definition: aggregate-functions.cc:139

impala::FunctionContextImpl::IncrementNumUpdates
void IncrementNumUpdates(int64_t n=1)
Definition: udf-internal.h:90

impala_udf::FunctionContext::TypeDesc
Definition: udf.h:71

anyval-util.h

impala_udf::FunctionContext::GetArgType
const TypeDesc * GetArgType(int arg_idx) const
Definition: udf.cc:425

impala_udf::SmallIntVal
Definition: udf.h:401

impala::AggregateFunctions::SumDecimalUpdate
static void SumDecimalUpdate(FunctionContext *, const DecimalVal &src, DecimalVal *dst)
Sum for decimals.
Definition: aggregate-functions.cc:348

impala::SetDistinctEstimateBit
static void SetDistinctEstimateBit(uint8_t *bitmap, uint32_t row_index, uint32_t bit_index)
Definition: aggregate-functions.cc:588

impala::AggregateFunctions::HllMerge
static void HllMerge(FunctionContext *, const StringVal &src, StringVal *dst)
Definition: aggregate-functions.cc:1022

impala_udf::FunctionContext::TypeDesc::scale
int scale
Definition: udf.h:76

impala::KnuthVarianceState::m2
double m2
Definition: aggregate-functions.cc:1081

impala::AggregateFunctions::DenseRankUpdate
static void DenseRankUpdate(FunctionContext *, StringVal *dst)
Update state for DENSE_RANK.
Definition: aggregate-functions.cc:1190

impala::DecimalAvgState
Definition: aggregate-functions.cc:223

impala::AggregateFunctions::AvgRemove
static void AvgRemove(FunctionContext *ctx, const T &src, StringVal *dst)
Definition: aggregate-functions.cc:149

impala::RankState
Definition: aggregate-functions.cc:1169

impala::AggregateFunctions::KnuthVarUpdate
static void KnuthVarUpdate(FunctionContext *context, const T &input, StringVal *val)
Definition: aggregate-functions.cc:1101

impala::ReservoirSampleState::rng
ranlux64_3 rng
Definition: aggregate-functions.cc:783

impala::AggregateFunctions::KnuthVarPopFinalize
static DoubleVal KnuthVarPopFinalize(FunctionContext *context, const StringVal &val)
Calculates the biased variance, uses KnuthVar Init-Update-Merge functions.
Definition: aggregate-functions.cc:1142

impala::HashUtil::FNV64_SEED
static const uint64_t FNV64_SEED
Definition: hash-util.h:101

impala::TimestampValue
Definition: timestamp-value.h:65

impala::DecimalValue< int128_t >

impala_udf::DecimalVal
Definition: udf.h:556

impala::KnuthVarianceState::mean
double mean
Definition: aggregate-functions.cc:1080

impala::AggregateFunctions::TimestampAvgUpdate
static void TimestampAvgUpdate(FunctionContext *ctx, const TimestampVal &src, StringVal *dst)
Avg for timestamp. Uses AvgInit() and AvgMerge().
Definition: aggregate-functions.cc:183

impala::ColumnType::GetByteSize
int GetByteSize() const
Returns the byte size of this type. Returns 0 for variable length types.
Definition: types.h:178

uint64_t

impala_udf::FunctionContext::Free
void Free(uint8_t *buffer)
Frees a buffer returned from Allocate() or Reallocate()
Definition: udf.cc:291

impala_udf::BigIntVal::val
int64_t val
Definition: udf.h:440

impala::AggregateFunctions::Min
static void Min(FunctionContext *, const T &src, T *dst)
MinUpdate/MinMerge.
Definition: aggregate-functions.cc:387

impala_udf::StringVal
Definition: udf.h:521

impala::AggregateFunctions::CountMerge
static void CountMerge(FunctionContext *, const BigIntVal &src, BigIntVal *dst)
Definition: aggregate-functions.cc:119

impala::AggregateFunctions::KnuthVarInit
static void KnuthVarInit(FunctionContext *context, StringVal *val)
Definition: aggregate-functions.cc:1094

impala_udf::DecimalVal::val8
int64_t val8
Definition: udf.h:571

impala::AggregateFunctions::PcMerge
static void PcMerge(FunctionContext *, const StringVal &src, StringVal *dst)
Definition: aggregate-functions.cc:652

impala_udf::IntVal
Definition: udf.h:420

impala::ComputeKnuthVariance
double ComputeKnuthVariance(const KnuthVarianceState &state, bool pop)
Definition: aggregate-functions.cc:1086

impala::GetDistinctEstimateBit
static bool GetDistinctEstimateBit(uint8_t *bitmap, uint32_t row_index, uint32_t bit_index)
Definition: aggregate-functions.cc:597

impala::AggregateFunctions::StringConcatFinalize
static StringVal StringConcatFinalize(FunctionContext *, const StringVal &src)
Definition: aggregate-functions.cc:533

VLOG_ROW
#define VLOG_ROW
Definition: logging.h:59

impala::AggregateFunctions::DecimalAvgMerge
static void DecimalAvgMerge(FunctionContext *ctx, const StringVal &src, StringVal *dst)
Definition: aggregate-functions.cc:279

impala::DecimalValue::Divide
DecimalValue< RESULT_T > Divide(const ColumnType &this_type, const DecimalValue &other, const ColumnType &other_type, int result_scale, bool *is_nan, bool *overflow) const
is_nan is set to true if 'other' is 0. The value returned is undefined.
Definition: decimal-value.h:205

impala::AggregateFunctions::PcsaUpdate
static void PcsaUpdate(FunctionContext *, const T &src, StringVal *dst)
Definition: aggregate-functions.cc:620

impala::AggregateFunctions::DecimalAvgInit
static void DecimalAvgInit(FunctionContext *ctx, StringVal *dst)
Avg for decimals.
Definition: aggregate-functions.cc:228

impala_udf::FunctionContext::IsArgConstant
bool IsArgConstant(int arg_idx) const
Definition: udf-ir.cc:20

impala::FunctionContextImpl::num_removes
int64_t num_removes() const
Definition: udf-internal.h:87

impala::AnyValUtil::Hash64
static uint64_t Hash64(const BooleanVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:85

impala::KnuthVarianceState::count
int64_t count
Definition: aggregate-functions.cc:1082

impala::AggregateFunctions::StringValSerializeOrFinalize
static StringVal StringValSerializeOrFinalize(FunctionContext *ctx, const StringVal &src)
StringVal Serialize/Finalize function that copies and frees src.
Definition: aggregate-functions.cc:86

count
uint64_t count
Definition: partitioning-throughput-test.cc:35

impala::AggregateFunctions::KnuthStddevPopFinalize
static DoubleVal KnuthStddevPopFinalize(FunctionContext *context, const StringVal &val)
Calculates the biased STDDEV, uses KnuthVar Init-Update-Merge functions.
Definition: aggregate-functions.cc:1160

impala::AggregateFunctions::LastValUpdate
static void LastValUpdate(FunctionContext *, const T &src, T *dst)
Implements LAST_VALUE.
Definition: aggregate-functions.cc:1232

impala::ReservoirSample::GetValue
T GetValue(FunctionContext *ctx)
Definition: aggregate-functions.cc:745

impala_udf::FunctionContext::GetNumArgs
int GetNumArgs() const
Definition: udf-ir.cc:30

impala::TimestampValue::FromTimestampVal
static TimestampValue FromTimestampVal(const impala_udf::TimestampVal &udf_value)
Definition: timestamp-value.h:111

impala_udf::FunctionContext::Reallocate
uint8_t * Reallocate(uint8_t *ptr, int byte_size)
Definition: udf.cc:276

impala::AggregateFunctions::HLL_PRECISION
static const int HLL_PRECISION
Definition: aggregate-functions.h:174

impala::TimestampValue::ToSubsecondUnixTime
double ToSubsecondUnixTime() const
Definition: timestamp-value.h:175

impala::AggregateFunctions::SumUpdate
static void SumUpdate(FunctionContext *, const SRC_VAL &src, DST_VAL *dst)
SumUpdate, SumMerge.
Definition: aggregate-functions.cc:323

impala_udf::FunctionContext::Allocate
uint8_t * Allocate(int byte_size)
Definition: udf.cc:262

impala::ReservoirSample< StringVal >
Definition: aggregate-functions.cc:751

impala::AggregateFunctions::FirstValRewriteUpdate
static void FirstValRewriteUpdate(FunctionContext *, const T &src, const BigIntVal &, T *dst)
Definition: aggregate-functions.cc:1295

UNLIKELY
#define UNLIKELY(expr)
Definition: compiler-util.h:33

impala::AggregateFunctions::TimestampAvgFinalize
static TimestampVal TimestampAvgFinalize(FunctionContext *ctx, const StringVal &val)
Definition: aggregate-functions.cc:216

impala::AvgState
Definition: aggregate-functions.cc:126

impala::AvgState::sum
double sum
Definition: aggregate-functions.cc:127

impala_udf::BigIntVal
Definition: udf.h:439

impala::StringValue::FromStringVal
static StringValue FromStringVal(const impala_udf::StringVal &sv)
Definition: string-value.h:103

impala::ColumnType
Definition: types.h:59

decimal-value.h

impala::ReservoirSample< StringVal >::len
int len
Definition: aggregate-functions.cc:753

impala::AggregateFunctions::ReservoirSampleInit
static void ReservoirSampleInit(FunctionContext *, StringVal *slot)
Definition: aggregate-functions.cc:792

impala::AggregateFunctions::AvgGetValue
static DoubleVal AvgGetValue(FunctionContext *ctx, const StringVal &val)
Definition: aggregate-functions.cc:171

impala::AggregateFunctions::PcsaFinalize
static BigIntVal PcsaFinalize(FunctionContext *, const StringVal &src)
Definition: aggregate-functions.cc:719

names.h

impala::AggregateFunctions::InitNullString
static void InitNullString(FunctionContext *c, StringVal *dst)
Initializes dst to NULL and sets dst->ptr to NULL.
Definition: aggregate-functions.cc:398

impala::AggregateFunctions::RankGetValue
static BigIntVal RankGetValue(FunctionContext *, StringVal &src)
Returns the result for RANK and prepares the state for the next Update().
Definition: aggregate-functions.cc:1192

impala::AggregateFunctions::AvgFinalize
static DoubleVal AvgFinalize(FunctionContext *ctx, const StringVal &val)
Definition: aggregate-functions.cc:177

impala::SampleKeyGreater
bool SampleKeyGreater(const ReservoirSample< T > &i, const ReservoirSample< T > &j)
Definition: aggregate-functions.cc:875

impala::SampleValLess
bool SampleValLess(const ReservoirSample< T > &i, const ReservoirSample< T > &j)
Definition: aggregate-functions.cc:848

impala::AggregateFunctions::TimestampAvgRemove
static void TimestampAvgRemove(FunctionContext *ctx, const TimestampVal &src, StringVal *dst)
Definition: aggregate-functions.cc:194

impala::AggregateFunctions::RankFinalize
static BigIntVal RankFinalize(FunctionContext *, StringVal &src)
Returns the result for RANK and DENSE_RANK and cleans up intermediate state in src.
Definition: aggregate-functions.cc:1221

impala::AggregateFunctions::PcUpdate
static void PcUpdate(FunctionContext *, const T &src, StringVal *dst)
Definition: aggregate-functions.cc:604

impala::AggregateFunctions::TimestampAvgGetValue
static TimestampVal TimestampAvgGetValue(FunctionContext *ctx, const StringVal &val)
Definition: aggregate-functions.cc:206

gen_ir_descriptions.idx
int idx
Definition: gen_ir_descriptions.py:215

impala::ColumnType::CreateDecimalType
static ColumnType CreateDecimalType(int precision, int scale)
Definition: types.h:103

impala::AggregateFunctions::KnuthVarMerge
static void KnuthVarMerge(FunctionContext *context, const StringVal &src, StringVal *dst)
Definition: aggregate-functions.cc:1115

impala::NUM_PC_BITMAPS
static const int NUM_PC_BITMAPS
Definition: aggregate-functions.cc:558

impala::AggregateFunctions::DenseRankGetValue
static BigIntVal DenseRankGetValue(FunctionContext *, StringVal &src)
Definition: aggregate-functions.cc:1207

impala_udf::FunctionContext::GetConstantArg
AnyVal * GetConstantArg(int arg_idx) const
Definition: udf-ir.cc:25

impala::AggregateFunctions::HistogramFinalize
static StringVal HistogramFinalize(FunctionContext *, const StringVal &src)
Definition: aggregate-functions.cc:957

impala::NUM_SAMPLES
static const int NUM_SAMPLES
Definition: aggregate-functions.cc:731

impala::AggregateFunctions::CountRemove
static void CountRemove(FunctionContext *, const AnyVal &src, BigIntVal *dst)
Definition: aggregate-functions.cc:104

impala::AggregateFunctions::DecimalAvgRemove
static void DecimalAvgRemove(FunctionContext *ctx, const DecimalVal &src, StringVal *dst)
Definition: aggregate-functions.cc:240

impala::AggregateFunctions::StringValGetValue
static StringVal StringValGetValue(FunctionContext *ctx, const StringVal &src)
StringVal GetValue() function that returns a copy of src.
Definition: aggregate-functions.cc:78

impala::AggregateFunctions::KnuthStddevFinalize
static DoubleVal KnuthStddevFinalize(FunctionContext *context, const StringVal &val)
Calculates STDDEV, uses KnuthVar Init-Update-Merge functions.
Definition: aggregate-functions.cc:1151

impala::FunctionContextImpl::IncrementNumRemoves
void IncrementNumRemoves(int64_t n=1)
Definition: udf-internal.h:91

impala::DistinceEstimateFinalize
double DistinceEstimateFinalize(const StringVal &src)
Definition: aggregate-functions.cc:671

impala_udf::StringVal::len
int len
Definition: udf.h:522

string-value.h

impala::AggregateFunctions::AvgMerge
static void AvgMerge(FunctionContext *ctx, const StringVal &src, StringVal *dst)
Definition: aggregate-functions.cc:161

impala::ReservoirSampleState::GetNext64
int64_t GetNext64(int64_t max)
Definition: aggregate-functions.cc:785

impala::AggregateFunctions::HllFinalEstimate
static uint64_t HllFinalEstimate(const uint8_t *buckets, int32_t num_buckets)
Definition: aggregate-functions.cc:1033

impala::PC_THETA
static const float PC_THETA
Definition: aggregate-functions.cc:560

impala::AggregateFunctions::DecimalAvgFinalize
static DecimalVal DecimalAvgFinalize(FunctionContext *ctx, const StringVal &val)
Definition: aggregate-functions.cc:315

impala::AggregateFunctions::StringConcatUpdate
static void StringConcatUpdate(FunctionContext *, const StringVal &src, StringVal *result)
String concat.
Definition: aggregate-functions.cc:490

impala::TYPE_DECIMAL
Definition: types.h:42

impala_udf::BooleanVal
Definition: udf.h:363

impala::TimestampValue::DebugString
std::string DebugString() const
Definition: timestamp-value.h:137

impala::int128_t
__int128_t int128_t
We use the c++ int128_t type. This is stored using 16 bytes and very performant.
Definition: multi-precision.h:51