doc/html/anyval-util_8h_source.html

 // Copyright 2012 Cloudera Inc.

 //

 // Licensed under the Apache License, Version 2.0 (the "License");

 // you may not use this file except in compliance with the License.

 // You may obtain a copy of the License at

 //

 // http://www.apache.org/licenses/LICENSE-2.0

 //

 // Unless required by applicable law or agreed to in writing, software

 // distributed under the License is distributed on an "AS IS" BASIS,

 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 // See the License for the specific language governing permissions and

 // limitations under the License.


 #ifndef IMPALA_EXPRS_ANYVAL_UTIL_H

 #define IMPALA_EXPRS_ANYVAL_UTIL_H


 #include "runtime/timestamp-value.h"

 #include "udf/udf-internal.h"

 #include "util/hash-util.h"


 #include "common/names.h"


 using namespace impala_udf;


 namespace impala {


 class ObjectPool;


 class AnyValUtil {

  public:

   static uint32_t Hash(const BooleanVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 1, seed);

   }


   static uint32_t Hash(const TinyIntVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 1, seed);

   }


   static uint32_t Hash(const SmallIntVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 2, seed);

   }


   static uint32_t Hash(const IntVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 4, seed);

   }


   static uint32_t Hash(const BigIntVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 8, seed);

   }


   static uint32_t Hash(const FloatVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 4, seed);

   }


   static uint32_t Hash(const DoubleVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(&v.val, 8, seed);

   }


   static uint32_t Hash(const StringVal& v, const FunctionContext::TypeDesc&, int seed) {

     return HashUtil::Hash(v.ptr, v.len, seed);

   }


   static uint32_t Hash(const TimestampVal& v, const FunctionContext::TypeDesc&,

       int seed) {

     TimestampValue tv = TimestampValue::FromTimestampVal(v);

     return tv.Hash(seed);

   }


   static uint64_t Hash(const DecimalVal& v, const FunctionContext::TypeDesc& t,

       int64_t seed) {

     DCHECK_GT(t.precision, 0);

     switch (ColumnType::GetDecimalByteSize(t.precision)) {

       case 4: return HashUtil::Hash(&v.val4, 4, seed);

       case 8: return HashUtil::Hash(&v.val8, 8, seed);

       case 16: return HashUtil::Hash(&v.val16, 16, seed);

       default:

         DCHECK(false);

         return 0;

     }

   }


   static uint64_t Hash64(const BooleanVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 1, seed);

   }


   static uint64_t Hash64(const TinyIntVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 1, seed);

   }


   static uint64_t Hash64(const SmallIntVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 2, seed);

   }


   static uint64_t Hash64(const IntVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 4, seed);

   }


   static uint64_t Hash64(const BigIntVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 8, seed);

   }


   static uint64_t Hash64(const FloatVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 4, seed);

   }


   static uint64_t Hash64(const DoubleVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(&v.val, 8, seed);

   }


   static uint64_t Hash64(const StringVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     return HashUtil::FnvHash64(v.ptr, v.len, seed);

   }


   static uint64_t Hash64(const TimestampVal& v, const FunctionContext::TypeDesc&,

       int64_t seed) {

     TimestampValue tv = TimestampValue::FromTimestampVal(v);

     return HashUtil::FnvHash64(&tv, 12, seed);

   }


   static uint64_t Hash64(const DecimalVal& v, const FunctionContext::TypeDesc& t,

       int64_t seed) {

     switch (ColumnType::GetDecimalByteSize(t.precision)) {

       case 4: return HashUtil::FnvHash64(&v.val4, 4, seed);

       case 8: return HashUtil::FnvHash64(&v.val8, 8, seed);

       case 16: return HashUtil::FnvHash64(&v.val16, 16, seed);

       default:

         DCHECK(false);

         return 0;

     }

   }


   template<typename T>

   static inline bool Equals(const FunctionContext::TypeDesc* type, const T& x, const T& y) {

     DCHECK_NOTNULL(type);

     return Equals(TypeDescToColumnType(*type), x, y);

   }


   template<typename T>

   static inline bool Equals(const ColumnType& type, const T& x, const T& y) {

     DCHECK(!x.is_null);

     DCHECK(!y.is_null);

     return x.val == y.val;

   }


   static int AnyValSize(const ColumnType& t) {

     switch (t.type) {

       case TYPE_BOOLEAN: return sizeof(BooleanVal);

       case TYPE_TINYINT: return sizeof(TinyIntVal);

       case TYPE_SMALLINT: return sizeof(SmallIntVal);

       case TYPE_INT: return sizeof(IntVal);

       case TYPE_BIGINT: return sizeof(BigIntVal);

       case TYPE_FLOAT: return sizeof(FloatVal);

       case TYPE_DOUBLE: return sizeof(DoubleVal);

       case TYPE_STRING:

       case TYPE_VARCHAR:

       case TYPE_CHAR:

         return sizeof(StringVal);

       case TYPE_TIMESTAMP: return sizeof(TimestampVal);

       case TYPE_DECIMAL: return sizeof(DecimalVal);

       default:

         DCHECK(false) << t;

         return 0;

     }

   }


   static std::string ToString(const StringVal& v) {

     return std::string(reinterpret_cast<char*>(v.ptr), v.len);

   }


   static StringVal FromString(FunctionContext* ctx, const std::string& s) {

     StringVal val = FromBuffer(ctx, s.c_str(), s.size());

     return val;

   }


   static void TruncateIfNecessary(const ColumnType& type, StringVal *val) {

     if (type.type == TYPE_VARCHAR) {

       DCHECK(type.len >= 0);

       val->len = min(val->len, type.len);

     }

   }


   static StringVal FromBuffer(FunctionContext* ctx, const char* ptr, int len) {

     StringVal result(ctx, len);

     memcpy(result.ptr, ptr, len);

     return result;

   }


   static FunctionContext::TypeDesc ColumnTypeToTypeDesc(const ColumnType& type);

   static ColumnType TypeDescToColumnType(const FunctionContext::TypeDesc& type);


   static void SetAnyVal(const void* slot, const ColumnType& type, AnyVal* dst) {

     if (slot == NULL) {

       dst->is_null = true;

       return;

     }


     dst->is_null = false;

     switch (type.type) {

       case TYPE_NULL: return;

       case TYPE_BOOLEAN:

         reinterpret_cast<BooleanVal*>(dst)->val = *reinterpret_cast<const bool*>(slot);

         return;

       case TYPE_TINYINT:

         reinterpret_cast<TinyIntVal*>(dst)->val = *reinterpret_cast<const int8_t*>(slot);

         return;

       case TYPE_SMALLINT:

         reinterpret_cast<SmallIntVal*>(dst)->val = *reinterpret_cast<const int16_t*>(slot);

         return;

       case TYPE_INT:

         reinterpret_cast<IntVal*>(dst)->val = *reinterpret_cast<const int32_t*>(slot);

         return;

       case TYPE_BIGINT:

         reinterpret_cast<BigIntVal*>(dst)->val = *reinterpret_cast<const int64_t*>(slot);

         return;

       case TYPE_FLOAT:

         reinterpret_cast<FloatVal*>(dst)->val = *reinterpret_cast<const float*>(slot);

         return;

       case TYPE_DOUBLE:

         reinterpret_cast<DoubleVal*>(dst)->val = *reinterpret_cast<const double*>(slot);

         return;

       case TYPE_STRING:

       case TYPE_VARCHAR:

       case TYPE_CHAR: {

         if (type.IsVarLen()) {

           reinterpret_cast<const StringValue*>(slot)->ToStringVal(

               reinterpret_cast<StringVal*>(dst));

           if (type.type == TYPE_VARCHAR) {

             StringVal* sv = reinterpret_cast<StringVal*>(dst);

             DCHECK(type.len >= 0);

             DCHECK_LE(sv->len, type.len);

           }

         } else {

           DCHECK_EQ(type.type, TYPE_CHAR);

           StringVal* sv = reinterpret_cast<StringVal*>(dst);

           sv->ptr = const_cast<uint8_t*>(reinterpret_cast<const uint8_t*>(slot));

           sv->len = type.len;

         }

         return;

       }

       case TYPE_TIMESTAMP:

         reinterpret_cast<const TimestampValue*>(slot)->ToTimestampVal(

             reinterpret_cast<TimestampVal*>(dst));

         return;

       case TYPE_DECIMAL:

         switch (type.GetByteSize()) {

           case 4:

             reinterpret_cast<DecimalVal*>(dst)->val4 =

                 *reinterpret_cast<const int32_t*>(slot);

             return;

           case 8:

             reinterpret_cast<DecimalVal*>(dst)->val8 =

                 *reinterpret_cast<const int64_t*>(slot);

             return;

 #if __BYTE_ORDER == __LITTLE_ENDIAN

           case 16:

             memcpy(&reinterpret_cast<DecimalVal*>(dst)->val4, slot, type.GetByteSize());

 #else

             DCHECK(false) << "Not implemented.";

 #endif

             return;

           default:

             break;

         }

       default:

         DCHECK(false) << "NYI: " << type;

     }

   }

 };


 impala_udf::AnyVal* CreateAnyVal(ObjectPool* pool, const ColumnType& type);


 impala_udf::AnyVal* CreateAnyVal(const ColumnType& type);


 template<> inline bool AnyValUtil::Equals(

     const ColumnType& type, const StringVal& x, const StringVal& y) {

   DCHECK(!x.is_null);

   DCHECK(!y.is_null);

   StringValue x_sv = StringValue::FromStringVal(x);

   StringValue y_sv = StringValue::FromStringVal(y);

   return x_sv == y_sv;

 }


 template<> inline bool AnyValUtil::Equals(

     const ColumnType& type, const TimestampVal& x, const TimestampVal& y) {

   DCHECK(!x.is_null);

   DCHECK(!y.is_null);

   TimestampValue x_tv = TimestampValue::FromTimestampVal(x);

   TimestampValue y_tv = TimestampValue::FromTimestampVal(y);

   return x_tv == y_tv;

 }


 template<> inline bool AnyValUtil::Equals(

     const ColumnType& type, const DecimalVal& x, const DecimalVal& y) {

   DCHECK(!x.is_null);

   DCHECK(!y.is_null);

   if (type.precision <= ColumnType::MAX_DECIMAL4_PRECISION) {

     return x.val4 == y.val4;

   } else if (type.precision <= ColumnType::MAX_DECIMAL8_PRECISION) {

     return x.val8 == y.val8;

   } else {

     return x.val16 == y.val16;

   }

 }


 }


 #endif

impala_udf::TinyIntVal::val
int8_t val
Definition: udf.h:383

impala_udf::FunctionContext::TypeDesc::precision
int precision
Only valid if type == TYPE_DECIMAL.
Definition: udf.h:75

impala::ColumnType::IsVarLen
bool IsVarLen() const
Definition: types.h:172

impala::CreateAnyVal
AnyVal * CreateAnyVal(ObjectPool *pool, const ColumnType &type)
Creates the corresponding AnyVal subclass for type. The object is added to the pool.
Definition: anyval-util.cc:26

timestamp-value.h

impala::TYPE_DOUBLE
Definition: types.h:36

impala::AnyValUtil::TruncateIfNecessary
static void TruncateIfNecessary(const ColumnType &type, StringVal *val)
Definition: anyval-util.h:188

impala_udf::DoubleVal::val
double val
Definition: udf.h:476

impala::TYPE_CHAR
Definition: types.h:47

impala::StringValue
Definition: string-value.h:33

impala::AnyValUtil::Hash
static uint32_t Hash(const BooleanVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:34

impala::AnyValUtil::Hash
static uint32_t Hash(const StringVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:62

impala::TYPE_VARCHAR
Definition: types.h:48

impala_udf::AnyVal
Definition: udf.h:358

impala::AnyValUtil::FromBuffer
static StringVal FromBuffer(FunctionContext *ctx, const char *ptr, int len)
Definition: anyval-util.h:195

impala_udf::DecimalVal::val16
__int128_t val16
Definition: udf.h:572

impala::ColumnType::precision
int precision
Only set if type == TYPE_DECIMAL.
Definition: types.h:68

impala::AnyValUtil::Equals
static bool Equals(const FunctionContext::TypeDesc *type, const T &x, const T &y)
Templated equality functions. These assume the input values are not NULL.
Definition: anyval-util.h:145

impala_udf::IntVal::val
int32_t val
Definition: udf.h:421

impala_udf::DoubleVal
Definition: udf.h:475

impala::AnyValUtil::Hash64
static uint64_t Hash64(const BigIntVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:105

impala::ToStringVal
StringVal ToStringVal(FunctionContext *context, T val)
Definition: aggregate-functions.cc:45

impala_udf::DecimalVal::val4
int32_t val4
Definition: udf.h:570

impala::AnyValUtil::Hash64
static uint64_t Hash64(const SmallIntVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:95

hash-util.h

impala_udf::BooleanVal::val
bool val
Definition: udf.h:364

impala_udf::TimestampVal
This object has a compatible storage format with boost::ptime.
Definition: udf.h:495

impala_udf::StringVal::ptr
uint8_t * ptr
Definition: udf.h:523

impala::TYPE_TIMESTAMP
Definition: types.h:37

impala::AnyValUtil::Hash64
static uint64_t Hash64(const DecimalVal &v, const FunctionContext::TypeDesc &t, int64_t seed)
Definition: anyval-util.h:131

impala::AnyValUtil
Utilities for AnyVals.
Definition: anyval-util.h:32

impala::AnyValUtil::Hash
static uint32_t Hash(const IntVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:46

impala_udf::FunctionContext
Definition: udf.h:47

impala_udf::AnyVal::is_null
bool is_null
Definition: udf.h:359

impala_udf::TinyIntVal
Definition: udf.h:382

impala_udf::FloatVal
Definition: udf.h:458

impala::TYPE_INT
Definition: types.h:33

impala::ColumnType::type
PrimitiveType type
Definition: types.h:60

impala_udf::FunctionContext::TypeDesc
Definition: udf.h:71

impala_udf::SmallIntVal
Definition: udf.h:401

impala_udf::SmallIntVal::val
int16_t val
Definition: udf.h:402

impala::TYPE_SMALLINT
Definition: types.h:32

impala::AnyValUtil::Hash
static uint64_t Hash(const DecimalVal &v, const FunctionContext::TypeDesc &t, int64_t seed)
Definition: anyval-util.h:72

pool
ObjectPool pool
Definition: expr-benchmark.cc:89

impala::TimestampValue::Hash
uint32_t Hash(int seed=0) const
Definition: timestamp-value.h:223

impala::TimestampValue
Definition: timestamp-value.h:65

impala_udf::DecimalVal
Definition: udf.h:556

impala::ColumnType::GetByteSize
int GetByteSize() const
Returns the byte size of this type. Returns 0 for variable length types.
Definition: types.h:178

uint64_t

impala::AnyValUtil::Hash
static uint32_t Hash(const TimestampVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:66

impala_udf::BigIntVal::val
int64_t val
Definition: udf.h:440

impala_udf::StringVal
Definition: udf.h:521

impala::AnyValUtil::Hash64
static uint64_t Hash64(const FloatVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:110

impala_udf::FloatVal::val
float val
Definition: udf.h:459

impala::ColumnType::len
int len
Only set if type == TYPE_CHAR or type == TYPE_VARCHAR.
Definition: types.h:62

impala::AnyValUtil::FromString
static StringVal FromString(FunctionContext *ctx, const std::string &s)
Definition: anyval-util.h:183

impala_udf::DecimalVal::val8
int64_t val8
Definition: udf.h:571

impala_udf::IntVal
Definition: udf.h:420

impala::AnyValUtil::Hash
static uint32_t Hash(const BigIntVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:50

impala::TYPE_BOOLEAN
Definition: types.h:30

Hash
static uint64_t Hash(const IntVal &v)
Definition: hyperloglog-uda.cc:56

impala::TYPE_BIGINT
Definition: types.h:34

impala::AnyValUtil::Hash
static uint32_t Hash(const DoubleVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:58

impala::AnyValUtil::Hash64
static uint64_t Hash64(const BooleanVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:85

impala::AnyValUtil::ToString
static std::string ToString(const StringVal &v)
Definition: anyval-util.h:179

impala::AnyValUtil::Equals
static bool Equals(const ColumnType &type, const T &x, const T &y)
Definition: anyval-util.h:151

impala::TYPE_NULL
Definition: types.h:29

impala::AnyValUtil::Hash
static uint32_t Hash(const FloatVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:54

impala::AnyValUtil::Hash64
static uint64_t Hash64(const IntVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:100

impala_udf::BigIntVal
Definition: udf.h:439

impala::AnyValUtil::Hash64
static uint64_t Hash64(const TimestampVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:125

impala::AnyValUtil::Hash
static uint32_t Hash(const TinyIntVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:38

impala::ColumnType
Definition: types.h:59

impala::AnyValUtil::Hash64
static uint64_t Hash64(const StringVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:120

impala::AnyValUtil::Hash64
static uint64_t Hash64(const TinyIntVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:90

names.h

impala::TYPE_STRING
Definition: types.h:38

impala::AnyValUtil::Hash
static uint32_t Hash(const SmallIntVal &v, const FunctionContext::TypeDesc &, int seed)
Definition: anyval-util.h:42

impala::TYPE_TINYINT
Definition: types.h:31

impala::AnyValUtil::AnyValSize
static int AnyValSize(const ColumnType &t)
Returns the byte size of *Val for type t.
Definition: anyval-util.h:158

impala::AnyValUtil::SetAnyVal
static void SetAnyVal(const void *slot, const ColumnType &type, AnyVal *dst)
Utility to put val into an AnyVal struct.
Definition: anyval-util.h:205

udf-internal.h

impala_udf::StringVal::len
int len
Definition: udf.h:522

impala::TYPE_FLOAT
Definition: types.h:35

impala::TYPE_DECIMAL
Definition: types.h:42

impala_udf::BooleanVal
Definition: udf.h:363

impala::AnyValUtil::Hash64
static uint64_t Hash64(const DoubleVal &v, const FunctionContext::TypeDesc &, int64_t seed)
Definition: anyval-util.h:115