doc/html/agg-fn-evaluator_8cc_source.html

 // Copyright 2012 Cloudera Inc.

 //

 // Licensed under the Apache License, Version 2.0 (the "License");

 // you may not use this file except in compliance with the License.

 // You may obtain a copy of the License at

 //

 // http://www.apache.org/licenses/LICENSE-2.0

 //

 // Unless required by applicable law or agreed to in writing, software

 // distributed under the License is distributed on an "AS IS" BASIS,

 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 // See the License for the specific language governing permissions and

 // limitations under the License.


 #include "exprs/agg-fn-evaluator.h"


 #include <sstream>


 #include "codegen/llvm-codegen.h"

 #include "common/logging.h"

 #include "exec/aggregation-node.h"

 #include "exprs/aggregate-functions.h"

 #include "exprs/expr-context.h"

 #include "exprs/anyval-util.h"

 #include "runtime/lib-cache.h"

 #include "runtime/runtime-state.h"

 #include "udf/udf-internal.h"

 #include "util/debug-util.h"


 #include <thrift/protocol/TDebugProtocol.h>


 #include "common/names.h"


 using namespace impala;

 using namespace impala_udf;

 using namespace llvm;


 // typedef for builtin aggregate functions. Unfortunately, these type defs don't

 // really work since the actual builtin is implemented not in terms of the base

 // AnyVal* type. Due to this, there are lots of casts when we use these typedefs.

 // TODO: these typedefs exists as wrappers to go from (TupleRow, Tuple) to the

 // types the aggregation functions need. This needs to be done with codegen instead.

 typedef void (*InitFn)(FunctionContext*, AnyVal*);

 typedef void (*UpdateFn0)(FunctionContext*, AnyVal*);

 typedef void (*UpdateFn1)(FunctionContext*, const AnyVal&, AnyVal*);

 typedef void (*UpdateFn2)(FunctionContext*, const AnyVal&, const AnyVal&, AnyVal*);

 typedef void (*UpdateFn3)(FunctionContext*, const AnyVal&, const AnyVal&,

     const AnyVal&, AnyVal*);

 typedef void (*UpdateFn4)(FunctionContext*, const AnyVal&, const AnyVal&,

     const AnyVal&, const AnyVal&, AnyVal*);

 typedef void (*UpdateFn5)(FunctionContext*, const AnyVal&, const AnyVal&,

     const AnyVal&, const AnyVal&, const AnyVal&, AnyVal*);

 typedef void (*UpdateFn6)(FunctionContext*, const AnyVal&, const AnyVal&,

     const AnyVal&, const AnyVal&, const AnyVal&, const AnyVal&, AnyVal*);

 typedef void (*UpdateFn7)(FunctionContext*, const AnyVal&, const AnyVal&,

     const AnyVal&, const AnyVal&, const AnyVal&, const AnyVal&, const AnyVal&, AnyVal*);

 typedef void (*UpdateFn8)(FunctionContext*, const AnyVal&, const AnyVal&,

     const AnyVal&, const AnyVal&, const AnyVal&, const AnyVal&, const AnyVal&,

     const AnyVal&, AnyVal*);

 typedef StringVal (*SerializeFn)(FunctionContext*, const StringVal&);

 typedef AnyVal (*GetValueFn)(FunctionContext*, const AnyVal&);

 typedef AnyVal (*FinalizeFn)(FunctionContext*, const AnyVal&);


 Status AggFnEvaluator::Create(ObjectPool* pool, const TExpr& desc,

     AggFnEvaluator** result) {

   return Create(pool, desc, false, result);

 }


 Status AggFnEvaluator::Create(ObjectPool* pool, const TExpr& desc,

     bool is_analytic_fn, AggFnEvaluator** result) {

   DCHECK_GT(desc.nodes.size(), 0);

   *result = pool->Add(new AggFnEvaluator(desc.nodes[0], is_analytic_fn));

   int node_idx = 0;

   for (int i = 0; i < desc.nodes[0].num_children; ++i) {

     ++node_idx;

     Expr* expr = NULL;

     ExprContext* ctx = NULL;

     RETURN_IF_ERROR(Expr::CreateTreeFromThrift(

         pool, desc.nodes, NULL, &node_idx, &expr, &ctx));

     (*result)->input_expr_ctxs_.push_back(ctx);

   }

   return Status::OK;

 }


 AggFnEvaluator::AggFnEvaluator(const TExprNode& desc, bool is_analytic_fn)

   : fn_(desc.fn),

     is_merge_(desc.agg_expr.is_merge_agg),

     is_analytic_fn_(is_analytic_fn),

     intermediate_slot_desc_(NULL),

     output_slot_desc_(NULL),

     cache_entry_(NULL),

     init_fn_(NULL),

     update_fn_(NULL),

     remove_fn_(NULL),

     merge_fn_(NULL),

     serialize_fn_(NULL),

     get_value_fn_(NULL),

     finalize_fn_(NULL) {

   DCHECK(desc.fn.__isset.aggregate_fn);

   DCHECK(desc.node_type == TExprNodeType::AGGREGATE_EXPR);

   // TODO: remove. See comment with AggregationOp

   if (fn_.name.function_name == "count") {

     agg_op_ = COUNT;

   } else if (fn_.name.function_name == "min") {

     agg_op_ = MIN;

   } else if (fn_.name.function_name == "max") {

     agg_op_ = MAX;

   } else if (fn_.name.function_name == "sum") {

     agg_op_ = SUM;

   } else if (fn_.name.function_name == "avg") {

     agg_op_ = AVG;

   } else if (fn_.name.function_name == "ndv" ||

       fn_.name.function_name == "ndv_no_finalize") {

     agg_op_ = NDV;

   } else {

     agg_op_ = OTHER;

   }

 }


 AggFnEvaluator::~AggFnEvaluator() {

   DCHECK(cache_entry_ == NULL) << "Need to call Close()";

 }


 Status AggFnEvaluator::Prepare(RuntimeState* state, const RowDescriptor& desc,

       const SlotDescriptor* intermediate_slot_desc,

       const SlotDescriptor* output_slot_desc,

       MemPool* agg_fn_pool, FunctionContext** agg_fn_ctx) {

   DCHECK(intermediate_slot_desc != NULL);

   DCHECK_EQ(intermediate_slot_desc->type().type,

       ColumnType(fn_.aggregate_fn.intermediate_type).type);

   DCHECK(intermediate_slot_desc_ == NULL);

   intermediate_slot_desc_ = intermediate_slot_desc;


   DCHECK(output_slot_desc != NULL);

   DCHECK_EQ(output_slot_desc->type().type, ColumnType(fn_.ret_type).type);

   DCHECK(output_slot_desc_ == NULL);

   output_slot_desc_ = output_slot_desc;


   RETURN_IF_ERROR(

       Expr::Prepare(input_expr_ctxs_, state, desc, agg_fn_pool->mem_tracker()));


   ObjectPool* obj_pool = state->obj_pool();

   for (int i = 0; i < input_expr_ctxs_.size(); ++i) {

     staging_input_vals_.push_back(

         CreateAnyVal(obj_pool, input_expr_ctxs_[i]->root()->type()));

   }

   staging_intermediate_val_ = CreateAnyVal(obj_pool, intermediate_type());

   staging_merge_input_val_ = CreateAnyVal(obj_pool, intermediate_type());


   if (is_merge_) {

     DCHECK_EQ(staging_input_vals_.size(), 1) << "Merge should only have 1 input.";

   }


   // Load the function pointers. Merge is not required if this is evaluating an

   // analytic function.

   if (fn_.aggregate_fn.init_fn_symbol.empty() ||

       fn_.aggregate_fn.update_fn_symbol.empty() ||

       (!is_analytic_fn_ && fn_.aggregate_fn.merge_fn_symbol.empty())) {

     // This path is only for partially implemented builtins.

     DCHECK_EQ(fn_.binary_type, TFunctionBinaryType::BUILTIN);

     stringstream ss;

     ss << "Function " << fn_.name.function_name << " is not implemented.";

     return Status(ss.str());

   }


   RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(

       fn_.hdfs_location, fn_.aggregate_fn.init_fn_symbol, &init_fn_, &cache_entry_));

   RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(

       fn_.hdfs_location, fn_.aggregate_fn.update_fn_symbol, &update_fn_, &cache_entry_));


   // Merge() is not loaded if evaluating the agg fn as an analytic function.

   if (!is_analytic_fn_) {

     RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(fn_.hdfs_location,

           fn_.aggregate_fn.merge_fn_symbol, &merge_fn_, &cache_entry_));

   }


   // Serialize(), GetValue(), Remove() and Finalize() are optional

   if (!fn_.aggregate_fn.serialize_fn_symbol.empty()) {

     RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(

         fn_.hdfs_location, fn_.aggregate_fn.serialize_fn_symbol, &serialize_fn_,

         &cache_entry_));

   }

   if (!fn_.aggregate_fn.get_value_fn_symbol.empty()) {

     RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(

         fn_.hdfs_location, fn_.aggregate_fn.get_value_fn_symbol, &get_value_fn_,

         &cache_entry_));

   }

   if (!fn_.aggregate_fn.remove_fn_symbol.empty()) {

     RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(

         fn_.hdfs_location, fn_.aggregate_fn.remove_fn_symbol, &remove_fn_,

         &cache_entry_));

   }

   if (!fn_.aggregate_fn.finalize_fn_symbol.empty()) {

     RETURN_IF_ERROR(LibCache::instance()->GetSoFunctionPtr(

         fn_.hdfs_location, fn_.aggregate_fn.finalize_fn_symbol, &finalize_fn_,

         &cache_entry_));

   }


   vector<FunctionContext::TypeDesc> arg_types;

   for (int i = 0; i < input_expr_ctxs_.size(); ++i) {

     arg_types.push_back(

         AnyValUtil::ColumnTypeToTypeDesc(input_expr_ctxs_[i]->root()->type()));

   }


   FunctionContext::TypeDesc intermediate_type =

       AnyValUtil::ColumnTypeToTypeDesc(intermediate_slot_desc_->type());

   FunctionContext::TypeDesc output_type =

        AnyValUtil::ColumnTypeToTypeDesc(output_slot_desc_->type());

   *agg_fn_ctx = FunctionContextImpl::CreateContext(

       state, agg_fn_pool, intermediate_type, output_type, arg_types);

   return Status::OK;

 }


 Status AggFnEvaluator::Open(RuntimeState* state, FunctionContext* agg_fn_ctx) {

   RETURN_IF_ERROR(Expr::Open(input_expr_ctxs_, state));

   // Now that we have opened all our input exprs, it is safe to evaluate any constant

   // values for the UDA's FunctionContext (we cannot evaluate exprs before calling Open()

   // on them).

   vector<AnyVal*> constant_args(input_expr_ctxs_.size());

   for (int i = 0; i < input_expr_ctxs_.size(); ++i) {

     constant_args[i] = input_expr_ctxs_[i]->root()->GetConstVal(input_expr_ctxs_[i]);

   }

   agg_fn_ctx->impl()->SetConstantArgs(constant_args);

   return Status::OK;

 }


 void AggFnEvaluator::Close(RuntimeState* state) {

   Expr::Close(input_expr_ctxs_, state);


   if (cache_entry_ != NULL) {

     LibCache::instance()->DecrementUseCount(cache_entry_);

     cache_entry_ = NULL;

   }

 }


 inline void AggFnEvaluator::SetDstSlot(FunctionContext* ctx, const AnyVal* src,

     const SlotDescriptor* dst_slot_desc, Tuple* dst) {

   if (src->is_null) {

     dst->SetNull(dst_slot_desc->null_indicator_offset());

     return;

   }


   dst->SetNotNull(dst_slot_desc->null_indicator_offset());

   void* slot = dst->GetSlot(dst_slot_desc->tuple_offset());

   switch (dst_slot_desc->type().type) {

     case TYPE_NULL:

       return;

     case TYPE_BOOLEAN:

       *reinterpret_cast<bool*>(slot) = reinterpret_cast<const BooleanVal*>(src)->val;

       return;

     case TYPE_TINYINT:

       *reinterpret_cast<int8_t*>(slot) = reinterpret_cast<const TinyIntVal*>(src)->val;

       return;

     case TYPE_SMALLINT:

       *reinterpret_cast<int16_t*>(slot) = reinterpret_cast<const SmallIntVal*>(src)->val;

       return;

     case TYPE_INT:

       *reinterpret_cast<int32_t*>(slot) = reinterpret_cast<const IntVal*>(src)->val;

       return;

     case TYPE_BIGINT:

       *reinterpret_cast<int64_t*>(slot) = reinterpret_cast<const BigIntVal*>(src)->val;

       return;

     case TYPE_FLOAT:

       *reinterpret_cast<float*>(slot) = reinterpret_cast<const FloatVal*>(src)->val;

       return;

     case TYPE_DOUBLE:

       *reinterpret_cast<double*>(slot) = reinterpret_cast<const DoubleVal*>(src)->val;

       return;

     case TYPE_STRING:

     case TYPE_VARCHAR:

       *reinterpret_cast<StringValue*>(slot) =

           StringValue::FromStringVal(*reinterpret_cast<const StringVal*>(src));

       return;

     case TYPE_CHAR:

       if (slot != reinterpret_cast<const StringVal*>(src)->ptr) {

         ctx->SetError("UDA should not set pointer of CHAR(N) intermediate");

       }

       return;

     case TYPE_TIMESTAMP:

       *reinterpret_cast<TimestampValue*>(slot) = TimestampValue::FromTimestampVal(

           *reinterpret_cast<const TimestampVal*>(src));

       return;

     case TYPE_DECIMAL:

       switch (dst_slot_desc->type().GetByteSize()) {

         case 4:

           *reinterpret_cast<int32_t*>(slot) =

               reinterpret_cast<const DecimalVal*>(src)->val4;

           return;

         case 8:

           *reinterpret_cast<int64_t*>(slot) =

               reinterpret_cast<const DecimalVal*>(src)->val8;

           return;

         case 16:

 #if __BYTE_ORDER == __LITTLE_ENDIAN

           // On little endian, &val4, &val8, &val16 are the same address.

           // This code seems to trip up clang causing it to generate code that crashes.

           // Be careful when modifying this. See IMPALA-959 for more details.

           // I suspect an issue with xmm registers not reading from aligned memory.

           memcpy(slot, &reinterpret_cast<const DecimalVal*>(src)->val4,

               dst_slot_desc->type().GetByteSize());

 #else

           DCHECK(false) << "Not implemented.";

 #endif

           return;

         default:

           break;

       }

     default:

       DCHECK(false) << "NYI: " << dst_slot_desc->type();

   }

 }


 // This function would be replaced in codegen.

 void AggFnEvaluator::Init(FunctionContext* agg_fn_ctx, Tuple* dst) {

   DCHECK(init_fn_ != NULL);

   if (intermediate_type().type == TYPE_CHAR) {

     // For type char, we want to initialize the staging_intermediate_val_ with

     // a pointer into the tuple (the UDA should not be allocating it).

     void* slot = dst->GetSlot(intermediate_slot_desc_->tuple_offset());

     StringVal* sv = reinterpret_cast<StringVal*>(staging_intermediate_val_);

     sv->is_null = dst->IsNull(intermediate_slot_desc_->null_indicator_offset());

     sv->ptr = reinterpret_cast<uint8_t*>(

         StringValue::CharSlotToPtr(slot, intermediate_type()));

     sv->len = intermediate_type().len;

   }

   reinterpret_cast<InitFn>(init_fn_)(agg_fn_ctx, staging_intermediate_val_);

   SetDstSlot(agg_fn_ctx, staging_intermediate_val_, intermediate_slot_desc_, dst);

   agg_fn_ctx->impl()->set_num_updates(0);

   agg_fn_ctx->impl()->set_num_removes(0);

 }


 static void SetAnyVal(const SlotDescriptor* desc, Tuple* tuple, AnyVal* dst) {

   bool is_null = tuple->IsNull(desc->null_indicator_offset());

   void* slot = NULL;

   if (!is_null) slot = tuple->GetSlot(desc->tuple_offset());

   AnyValUtil::SetAnyVal(slot, desc->type(), dst);

 }


 void AggFnEvaluator::Update(

     FunctionContext* agg_fn_ctx, TupleRow* row, Tuple* dst, void* fn) {

   if (fn == NULL) return;


   SetAnyVal(intermediate_slot_desc_, dst, staging_intermediate_val_);


   for (int i = 0; i < input_expr_ctxs_.size(); ++i) {

     void* src_slot = input_expr_ctxs_[i]->GetValue(row);

     AnyValUtil::SetAnyVal(

         src_slot, input_expr_ctxs_[i]->root()->type(), staging_input_vals_[i]);

   }


   // TODO: this part is not so good and not scalable. It can be replaced with

   // codegen but we can also consider leaving it for the first few cases for

   // debugging.

   switch (input_expr_ctxs_.size()) {

     case 0:

       reinterpret_cast<UpdateFn0>(fn)(agg_fn_ctx, staging_intermediate_val_);

       break;

     case 1:

       reinterpret_cast<UpdateFn1>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], staging_intermediate_val_);

       break;

     case 2:

       reinterpret_cast<UpdateFn2>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1], staging_intermediate_val_);

       break;

     case 3:

       reinterpret_cast<UpdateFn3>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1],

           *staging_input_vals_[2], staging_intermediate_val_);

       break;

     case 4:

       reinterpret_cast<UpdateFn4>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1],

           *staging_input_vals_[2], *staging_input_vals_[3], staging_intermediate_val_);

       break;

     case 5:

       reinterpret_cast<UpdateFn5>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1],

           *staging_input_vals_[2], *staging_input_vals_[3],

           *staging_input_vals_[4], staging_intermediate_val_);

       break;

     case 6:

       reinterpret_cast<UpdateFn6>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1],

           *staging_input_vals_[2], *staging_input_vals_[3],

           *staging_input_vals_[4], *staging_input_vals_[5], staging_intermediate_val_);

       break;

     case 7:

       reinterpret_cast<UpdateFn7>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1],

           *staging_input_vals_[2], *staging_input_vals_[3],

           *staging_input_vals_[4], *staging_input_vals_[5],

           *staging_input_vals_[6], staging_intermediate_val_);

       break;

     case 8:

       reinterpret_cast<UpdateFn8>(fn)(agg_fn_ctx,

           *staging_input_vals_[0], *staging_input_vals_[1],

           *staging_input_vals_[2], *staging_input_vals_[3],

           *staging_input_vals_[4], *staging_input_vals_[5],

           *staging_input_vals_[6], *staging_input_vals_[7],

           staging_intermediate_val_);

       break;

     default:

       DCHECK(false) << "NYI";

   }

   SetDstSlot(agg_fn_ctx, staging_intermediate_val_, intermediate_slot_desc_, dst);

 }


 void AggFnEvaluator::Merge(FunctionContext* agg_fn_ctx, Tuple* src, Tuple* dst) {

   DCHECK(merge_fn_ != NULL);


   SetAnyVal(intermediate_slot_desc_, dst, staging_intermediate_val_);

   SetAnyVal(intermediate_slot_desc_, src, staging_merge_input_val_);


   // The merge fn always takes one input argument.

   reinterpret_cast<UpdateFn1>(merge_fn_)(agg_fn_ctx,

       *staging_merge_input_val_, staging_intermediate_val_);

   SetDstSlot(agg_fn_ctx, staging_intermediate_val_, intermediate_slot_desc_, dst);

 }


 void AggFnEvaluator::SerializeOrFinalize(FunctionContext* agg_fn_ctx, Tuple* src,

     const SlotDescriptor* dst_slot_desc, Tuple* dst, void* fn) {

   // No fn was given and the src and dst are identical. Nothing to be done.

   if (fn == NULL && src == dst) return;

   // src != dst means we are performing a Finalize(), so even if fn == null we

   // still must copy the value of the src slot into dst.


   bool src_slot_null = src->IsNull(intermediate_slot_desc_->null_indicator_offset());

   void* src_slot = NULL;

   if (!src_slot_null) src_slot = src->GetSlot(intermediate_slot_desc_->tuple_offset());


   // No fn was given but the src and dst tuples are different (doing a Finalize()).

   // Just copy the src slot into the dst tuple.

   if (fn == NULL) {

     DCHECK_EQ(intermediate_type(), dst_slot_desc->type());

     RawValue::Write(src_slot, dst, dst_slot_desc, NULL);

     return;

   }


   AnyValUtil::SetAnyVal(src_slot, intermediate_type(), staging_intermediate_val_);

   switch (dst_slot_desc->type().type) {

     case TYPE_BOOLEAN: {

       typedef BooleanVal(*Fn)(FunctionContext*, AnyVal*);

       BooleanVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_TINYINT: {

       typedef TinyIntVal(*Fn)(FunctionContext*, AnyVal*);

       TinyIntVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_SMALLINT: {

       typedef SmallIntVal(*Fn)(FunctionContext*, AnyVal*);

       SmallIntVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_INT: {

       typedef IntVal(*Fn)(FunctionContext*, AnyVal*);

       IntVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_BIGINT: {

       typedef BigIntVal(*Fn)(FunctionContext*, AnyVal*);

       BigIntVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_FLOAT: {

       typedef FloatVal(*Fn)(FunctionContext*, AnyVal*);

       FloatVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_DOUBLE: {

       typedef DoubleVal(*Fn)(FunctionContext*, AnyVal*);

       DoubleVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_STRING:

     case TYPE_VARCHAR: {

       typedef StringVal(*Fn)(FunctionContext*, AnyVal*);

       StringVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_DECIMAL: {

       typedef DecimalVal(*Fn)(FunctionContext*, AnyVal*);

       DecimalVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     case TYPE_TIMESTAMP: {

       typedef TimestampVal(*Fn)(FunctionContext*, AnyVal*);

       TimestampVal v = reinterpret_cast<Fn>(fn)(agg_fn_ctx, staging_intermediate_val_);

       SetDstSlot(agg_fn_ctx, &v, dst_slot_desc, dst);

       break;

     }

     default:

       DCHECK(false) << "NYI";

   }

 }


 string AggFnEvaluator::DebugString(const vector<AggFnEvaluator*>& exprs) {

   stringstream out;

   out << "[";

   for (int i = 0; i < exprs.size(); ++i) {

     out << (i == 0 ? "" : " ") << exprs[i]->DebugString();

   }

   out << "]";

   return out.str();

 }


 string AggFnEvaluator::DebugString() const {

   stringstream out;

   out << "AggFnEvaluator(op=" << agg_op_;

   for (int i = 0; i < input_expr_ctxs_.size(); ++i) {

     out << " " << input_expr_ctxs_[i]->root()->DebugString() << ")";

   }

   out << ")";

   return out.str();

 }

UpdateFn8
void(* UpdateFn8)(FunctionContext *, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:57

impala::CreateAnyVal
AnyVal * CreateAnyVal(ObjectPool *pool, const ColumnType &type)
Creates the corresponding AnyVal subclass for type. The object is added to the pool.
Definition: anyval-util.cc:26

impala::AggFnEvaluator::Update
void Update(FunctionContext *agg_fn_ctx, TupleRow *row, Tuple *dst, void *fn)
Definition: agg-fn-evaluator.cc:339

agg-fn-evaluator.h

impala::AggFnEvaluator::Prepare
Status Prepare(RuntimeState *state, const RowDescriptor &desc, const SlotDescriptor *intermediate_slot_desc, const SlotDescriptor *output_slot_desc, MemPool *agg_fn_pool, FunctionContext **agg_fn_ctx)
Definition: agg-fn-evaluator.cc:124

impala::TYPE_DOUBLE
Definition: types.h:36

impala::AnyValUtil::ColumnTypeToTypeDesc
static FunctionContext::TypeDesc ColumnTypeToTypeDesc(const ColumnType &type)
Definition: anyval-util.cc:52

impala::Expr::CreateTreeFromThrift
static Status CreateTreeFromThrift(ObjectPool *pool, const std::vector< TExprNode > &nodes, Expr *parent, int *node_idx, Expr **root_expr, ExprContext **ctx)
Definition: expr.cc:160

impala::Tuple::SetNull
void SetNull(const NullIndicatorOffset &offset)
Definition: tuple.h:101

impala::AggFnEvaluator::intermediate_type
const ColumnType & intermediate_type() const
Definition: agg-fn-evaluator.h:110

impala_udf::FunctionContext::impl
impala::FunctionContextImpl * impl()
TODO: Add mechanism for UDAs to update stats similar to runtime profile counters. ...
Definition: udf.h:202

impala::TYPE_CHAR
Definition: types.h:47

impala::StringValue
Definition: string-value.h:33

lib-cache.h

impala::AggFnEvaluator::finalize_fn_
void * finalize_fn_
Definition: agg-fn-evaluator.h:211

impala::AggFnEvaluator::SUM
Definition: agg-fn-evaluator.h:70

impala::TYPE_VARCHAR
Definition: types.h:48

impala_udf::AnyVal
Definition: udf.h:358

impala::Expr::Open
static Status Open(const std::vector< ExprContext * > &ctxs, RuntimeState *state)
Convenience function for opening multiple expr trees.

impala::AggFnEvaluator
Definition: agg-fn-evaluator.h:62

UpdateFn4
void(* UpdateFn4)(FunctionContext *, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:49

impala::Tuple
A tuple with 0 materialised slots is represented as NULL.
Definition: tuple.h:48

aggregate-functions.h

impala::FunctionContextImpl::SetConstantArgs
void SetConstantArgs(const std::vector< impala_udf::AnyVal * > &constant_args)
Sets constant_args_. The AnyVal* values are owned by the caller.
Definition: udf.cc:414

impala::AggFnEvaluator::SerializeOrFinalize
void SerializeOrFinalize(FunctionContext *agg_fn_ctx, Tuple *src, const SlotDescriptor *dst_slot_desc, Tuple *dst, void *fn)
Definition: agg-fn-evaluator.cc:421

RETURN_IF_ERROR
#define RETURN_IF_ERROR(stmt)
some generally useful macros
Definition: status.h:242

impala_udf::DoubleVal
Definition: udf.h:475

impala::AggFnEvaluator::DebugString
std::string DebugString() const
Definition: agg-fn-evaluator.cc:518

impala::AggFnEvaluator::staging_intermediate_val_
impala_udf::AnyVal * staging_intermediate_val_
Definition: agg-fn-evaluator.h:198

impala::AggFnEvaluator::input_expr_ctxs_
std::vector< ExprContext * > input_expr_ctxs_
Definition: agg-fn-evaluator.h:188

impala::AggFnEvaluator::serialize_fn_
void * serialize_fn_
Definition: agg-fn-evaluator.h:209

impala::ExprContext
Definition: expr-context.h:40

expr-context.h

GetValueFn
AnyVal(* GetValueFn)(FunctionContext *, const AnyVal &)
Definition: agg-fn-evaluator.cc:61

impala::Tuple::GetSlot
void * GetSlot(int offset)
Definition: tuple.h:118

impala::AggFnEvaluator::NDV
Definition: agg-fn-evaluator.h:72

impala::RowDescriptor
Definition: descriptors.h:373

impala::ObjectPool
Definition: object-pool.h:30

impala::AggFnEvaluator::is_merge_
const bool is_merge_
Indicates whether to Update() or Merge()
Definition: agg-fn-evaluator.h:177

impala::AggFnEvaluator::MAX
Definition: agg-fn-evaluator.h:69

impala::SlotDescriptor
Definition: descriptors.h:75

impala::AggFnEvaluator::Create
static Status Create(ObjectPool *pool, const TExpr &desc, AggFnEvaluator **result)
Definition: agg-fn-evaluator.cc:64

FinalizeFn
AnyVal(* FinalizeFn)(FunctionContext *, const AnyVal &)
Definition: agg-fn-evaluator.cc:62

llvm-codegen.h

impala_udf::TimestampVal
This object has a compatible storage format with boost::ptime.
Definition: udf.h:495

logging.h

impala::AggFnEvaluator::Open
Status Open(RuntimeState *state, FunctionContext *agg_fn_ctx)
Definition: agg-fn-evaluator.cc:214

impala::AggFnEvaluator::update_fn_
void * update_fn_
Definition: agg-fn-evaluator.h:206

impala::TupleRow
Definition: tuple-row.h:28

impala_udf::StringVal::ptr
uint8_t * ptr
Definition: udf.h:523

impala::SlotDescriptor::null_indicator_offset
const NullIndicatorOffset & null_indicator_offset() const
Definition: descriptors.h:89

impala::AggFnEvaluator::staging_merge_input_val_
impala_udf::AnyVal * staging_merge_input_val_
Definition: agg-fn-evaluator.h:199

impala::TYPE_TIMESTAMP
Definition: types.h:37

impala::AggFnEvaluator::staging_input_vals_
std::vector< impala_udf::AnyVal * > staging_input_vals_
Definition: agg-fn-evaluator.h:197

impala::AggFnEvaluator::Merge
void Merge(FunctionContext *agg_fn_ctx, Tuple *src, Tuple *dst)
Definition: agg-fn-evaluator.cc:409

impala::AggFnEvaluator::AggFnEvaluator
AggFnEvaluator(const TExprNode &desc, bool is_analytic_fn)
Use Create() instead.
Definition: agg-fn-evaluator.cc:85

impala::AggFnEvaluator::Close
void Close(RuntimeState *state)
Definition: agg-fn-evaluator.cc:227

impala::AggFnEvaluator::get_value_fn_
void * get_value_fn_
Definition: agg-fn-evaluator.h:210

impala::AggFnEvaluator::fn_
const TFunction fn_
Definition: agg-fn-evaluator.h:175

impala::Expr::Close
static void Close(const std::vector< ExprContext * > &ctxs, RuntimeState *state)
Convenience function for closing multiple expr trees.

impala::Tuple::IsNull
bool IsNull(const NullIndicatorOffset &offset) const
Definition: tuple.h:112

impala::obj_pool
ObjectPool * obj_pool()
Returns a local object pool.
Definition: coordinator.h:263

impala_udf::FunctionContext
Definition: udf.h:47

impala_udf::AnyVal::is_null
bool is_null
Definition: udf.h:359

impala_udf::TinyIntVal
Definition: udf.h:382

impala_udf::FloatVal
Definition: udf.h:458

impala::Status
Definition: status.h:81

impala::AggFnEvaluator::~AggFnEvaluator
~AggFnEvaluator()
Definition: agg-fn-evaluator.cc:120

impala::TYPE_INT
Definition: types.h:33

impala::ColumnType::type
PrimitiveType type
Definition: types.h:60

impala::MemPool
Definition: mem-pool.h:77

impala_udf::FunctionContext::TypeDesc
Definition: udf.h:71

impala::MemPool::mem_tracker
MemTracker * mem_tracker()
Definition: mem-pool.h:151

anyval-util.h

SerializeFn
StringVal(* SerializeFn)(FunctionContext *, const StringVal &)
Definition: agg-fn-evaluator.cc:60

impala::RuntimeState
Definition: runtime-state.h:69

impala_udf::SmallIntVal
Definition: udf.h:401

impala::SlotDescriptor::type
const ColumnType & type() const
Definition: descriptors.h:78

impala::TYPE_SMALLINT
Definition: types.h:32

impala::AggFnEvaluator::is_analytic_fn_
const bool is_analytic_fn_
Indicates which functions must be loaded.
Definition: agg-fn-evaluator.h:179

impala::AggFnEvaluator::OTHER
Definition: agg-fn-evaluator.h:73

impala::RuntimeState::obj_pool
ObjectPool * obj_pool() const
Definition: runtime-state.h:92

impala::AggFnEvaluator::COUNT
Definition: agg-fn-evaluator.h:67

debug-util.h

pool
ObjectPool pool
Definition: expr-benchmark.cc:89

aggregation-node.h

impala::TimestampValue
Definition: timestamp-value.h:65

impala_udf::DecimalVal
Definition: udf.h:556

impala::AggFnEvaluator::Init
void Init(FunctionContext *agg_fn_ctx, Tuple *dst)
Functions for different phases of the aggregation.
Definition: agg-fn-evaluator.cc:314

impala::FunctionContextImpl::set_num_removes
void set_num_removes(int64_t n)
Definition: udf-internal.h:89

impala::Fn
function< void(int64_t, int64_t, AtomicInt< int > *)> Fn
Definition: atomic-test.cc:104

impala::ColumnType::GetByteSize
int GetByteSize() const
Returns the byte size of this type. Returns 0 for variable length types.
Definition: types.h:178

impala::AggFnEvaluator::intermediate_slot_desc_
const SlotDescriptor * intermediate_slot_desc_
Slot into which Update()/Merge()/Serialize() write their result. Not owned.
Definition: agg-fn-evaluator.h:182

impala::AggFnEvaluator::SetDstSlot
void SetDstSlot(FunctionContext *ctx, const impala_udf::AnyVal *src, const SlotDescriptor *dst_slot_desc, Tuple *dst)
Writes the result in src into dst pointed to by dst_slot_desc.
Definition: agg-fn-evaluator.cc:236

impala::FunctionContextImpl::set_num_updates
void set_num_updates(int64_t n)
Definition: udf-internal.h:88

impala_udf::StringVal
Definition: udf.h:521

impala::ColumnType::len
int len
Only set if type == TYPE_CHAR or type == TYPE_VARCHAR.
Definition: types.h:62

impala::RawValue::Write
static void Write(const void *value, Tuple *tuple, const SlotDescriptor *slot_desc, MemPool *pool)
Definition: raw-value.cc:303

impala_udf::IntVal
Definition: udf.h:420

impala::Expr
This is the superclass of all expr evaluation nodes.
Definition: expr.h:116

impala::TYPE_BOOLEAN
Definition: types.h:30

impala::LibCache::instance
static LibCache * instance()
Definition: lib-cache.h:63

impala::AggFnEvaluator::agg_op_
AggregationOp agg_op_
The enum for some of the builtins that still require special cased logic.
Definition: agg-fn-evaluator.h:191

impala::TYPE_BIGINT
Definition: types.h:34

runtime-state.h

UpdateFn6
void(* UpdateFn6)(FunctionContext *, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:53

impala::AggFnEvaluator::remove_fn_
void * remove_fn_
Definition: agg-fn-evaluator.h:207

UpdateFn7
void(* UpdateFn7)(FunctionContext *, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:55

UpdateFn2
void(* UpdateFn2)(FunctionContext *, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:46

impala::TimestampValue::FromTimestampVal
static TimestampValue FromTimestampVal(const impala_udf::TimestampVal &udf_value)
Definition: timestamp-value.h:111

InitFn
void(* InitFn)(FunctionContext *, AnyVal *)
Definition: agg-fn-evaluator.cc:43

impala::AggFnEvaluator::init_fn_
void * init_fn_
Function ptrs for the different phases of the aggregate function.
Definition: agg-fn-evaluator.h:205

impala::AggFnEvaluator::output_slot_desc_
const SlotDescriptor * output_slot_desc_
Definition: agg-fn-evaluator.h:186

impala::TYPE_NULL
Definition: types.h:29

impala::FunctionContextImpl::CreateContext
static impala_udf::FunctionContext * CreateContext(RuntimeState *state, MemPool *pool, const impala_udf::FunctionContext::TypeDesc &return_type, const std::vector< impala_udf::FunctionContext::TypeDesc > &arg_types, int varargs_buffer_size=0, bool debug=false)
Create a FunctionContext for a UDF. Caller is responsible for deleting it.

impala_udf::BigIntVal
Definition: udf.h:439

impala::StringValue::FromStringVal
static StringValue FromStringVal(const impala_udf::StringVal &sv)
Definition: string-value.h:103

impala::ColumnType
Definition: types.h:59

impala::Status::OK
static const Status OK
Definition: status.h:87

impala::StringValue::CharSlotToPtr
static char * CharSlotToPtr(void *slot, const ColumnType &type)
Definition: string-value.inline.h:115

impala::AggFnEvaluator::AVG
Definition: agg-fn-evaluator.h:71

impala::SlotDescriptor::tuple_offset
int tuple_offset() const
Definition: descriptors.h:88

names.h

impala::ObjectPool::Add
T * Add(T *t)
Definition: object-pool.h:42

UpdateFn0
void(* UpdateFn0)(FunctionContext *, AnyVal *)
Definition: agg-fn-evaluator.cc:44

UpdateFn3
void(* UpdateFn3)(FunctionContext *, const AnyVal &, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:47

impala::TYPE_STRING
Definition: types.h:38

impala::AggFnEvaluator::MIN
Definition: agg-fn-evaluator.h:68

impala::Expr::Prepare
static Status Prepare(const std::vector< ExprContext * > &ctxs, RuntimeState *state, const RowDescriptor &row_desc, MemTracker *tracker)

impala::AggFnEvaluator::merge_fn_
void * merge_fn_
Definition: agg-fn-evaluator.h:208

impala::LibCache::DecrementUseCount
void DecrementUseCount(LibCacheEntry *entry)
See comment in GetSoFunctionPtr().
Definition: lib-cache.cc:170

UpdateFn1
void(* UpdateFn1)(FunctionContext *, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:45

impala_udf::FunctionContext::SetError
void SetError(const char *error_msg)
Definition: udf.cc:332

impala::TYPE_TINYINT
Definition: types.h:31

impala::AggFnEvaluator::cache_entry_
LibCache::LibCacheEntry * cache_entry_
Cache entry for the library containing the function ptrs.
Definition: agg-fn-evaluator.h:202

impala::AnyValUtil::SetAnyVal
static void SetAnyVal(const void *slot, const ColumnType &type, AnyVal *dst)
Utility to put val into an AnyVal struct.
Definition: anyval-util.h:205

udf-internal.h

impala_udf::StringVal::len
int len
Definition: udf.h:522

UpdateFn5
void(* UpdateFn5)(FunctionContext *, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, const AnyVal &, AnyVal *)
Definition: agg-fn-evaluator.cc:51

impala::TYPE_FLOAT
Definition: types.h:35

SetAnyVal
static void SetAnyVal(const SlotDescriptor *desc, Tuple *tuple, AnyVal *dst)
Definition: agg-fn-evaluator.cc:332

impala::Tuple::SetNotNull
void SetNotNull(const NullIndicatorOffset &offset)
Turn null indicator bit off.
Definition: tuple.h:107

impala::TYPE_DECIMAL
Definition: types.h:42

impala_udf::BooleanVal
Definition: udf.h:363