doc/html/buffered-tuple-stream_8h_source.html

 // Copyright 2013 Cloudera Inc.

 //

 // Licensed under the Apache License, Version 2.0 (the "License");

 // you may not use this file except in compliance with the License.

 // You may obtain a copy of the License at

 //

 // http://www.apache.org/licenses/LICENSE-2.0

 //

 // Unless required by applicable law or agreed to in writing, software

 // distributed under the License is distributed on an "AS IS" BASIS,

 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 // See the License for the specific language governing permissions and

 // limitations under the License.


 #ifndef IMPALA_RUNTIME_BUFFERED_TUPLE_STREAM_H

 #define IMPALA_RUNTIME_BUFFERED_TUPLE_STREAM_H


 #include "common/status.h"

 #include "runtime/buffered-block-mgr.h"


 namespace impala {


 class BufferedBlockMgr;

 class RuntimeProfile;

 class RuntimeState;

 class RowBatch;

 class RowDescriptor;

 class SlotDescriptor;

 class TupleRow;


 //

 //

 //

 //

 //

 //

 //

 //

 class BufferedTupleStream {

  public:

   struct RowIdx {

     static const uint64_t BLOCK_MASK  = 0xFFFF;

     static const uint64_t BLOCK_SHIFT = 0;

     static const uint64_t OFFSET_MASK  = 0xFFFFFF0000;

     static const uint64_t OFFSET_SHIFT = 16;

     static const uint64_t IDX_MASK  = 0xFFFFFF0000000000;

     static const uint64_t IDX_SHIFT = 40;


     uint64_t block() const {

       return (data & BLOCK_MASK);

     };


     uint64_t offset() const {

       return (data & OFFSET_MASK) >> OFFSET_SHIFT;

     };


     uint64_t idx() const {

       return (data & IDX_MASK) >> IDX_SHIFT;

     }


     uint64_t set(uint64_t block, uint64_t offset, uint64_t idx) {

       DCHECK_LE(block, BLOCK_MASK)

           << "Cannot have more than 2^16 = 64K blocks in a tuple stream.";

       DCHECK_LE(offset, OFFSET_MASK >> OFFSET_SHIFT)

           << "Cannot have blocks larger than 2^24 = 16MB";

       DCHECK_LE(idx, IDX_MASK >> IDX_SHIFT)

           << "Cannot have more than 2^24 = 16M rows in a block.";

       data = block | (offset << OFFSET_SHIFT) | (idx << IDX_SHIFT);

       return data;

     }


     std::string DebugString() const;


     uint64_t data;

   };


   BufferedTupleStream(RuntimeState* state, const RowDescriptor& row_desc,

       BufferedBlockMgr* block_mgr, BufferedBlockMgr::Client* client,

       bool use_initial_small_buffers = true,

       bool delete_on_read = false, bool read_write = false);


   Status Init(RuntimeProfile* profile = NULL, bool pinned = true);


   Status SwitchToIoBuffers(bool* got_buffer);


   bool AddRow(TupleRow* row, uint8_t** dst = NULL);


   uint8_t* AllocateRow(int size);


   void GetTupleRow(const RowIdx& idx, TupleRow* row) const;


   Status PrepareForRead(bool* got_buffer = NULL);


   Status PinStream(bool already_reserved, bool* pinned);


   Status UnpinStream(bool all = false);


   Status GetNext(RowBatch* batch, bool* eos, std::vector<RowIdx>* indices = NULL);


   Status GetRows(boost::scoped_ptr<RowBatch>* batch, bool* got_rows);


   void Close();


   Status status() const { return status_; }


   int64_t num_rows() const { return num_rows_; }


   int64_t rows_returned() const { return rows_returned_; }


   int64_t byte_size() const { return total_byte_size_; }


   int64_t bytes_in_mem(bool ignore_current) const;


   bool is_pinned() const { return pinned_; }

   int blocks_pinned() const { return num_pinned_; }

   int blocks_unpinned() const { return blocks_.size() - num_pinned_ - num_small_blocks_; }

   bool has_read_block() const { return read_block_ != blocks_.end(); }

   bool has_write_block() const { return write_block_ != NULL; }

   bool using_small_buffers() const { return use_small_buffers_; }


   std::string DebugString() const;


  private:

   bool use_small_buffers_;


   const bool delete_on_read_;


   const bool read_write_;


   RuntimeState* const state_;


   const RowDescriptor& desc_;


   const bool nullable_tuple_;


   int fixed_tuple_row_size_;


   uint32_t null_indicators_read_block_;

   uint32_t null_indicators_write_block_;


   std::vector<std::pair<int, std::vector<SlotDescriptor*> > > string_slots_;


   BufferedBlockMgr* block_mgr_;

   BufferedBlockMgr::Client* block_mgr_client_;


   std::list<BufferedBlockMgr::Block*> blocks_;


   int64_t total_byte_size_;


   std::list<BufferedBlockMgr::Block*>::iterator read_block_;


   std::vector<uint8_t*> block_start_idx_;


   uint8_t* read_ptr_;


   uint32_t read_tuple_idx_;


   uint32_t write_tuple_idx_;


   int64_t read_bytes_;


   int64_t rows_returned_;


   int read_block_idx_;


   BufferedBlockMgr::Block* write_block_;


   int num_pinned_;


   int num_small_blocks_;


   bool closed_; // Used for debugging.

   Status status_;


   int64_t num_rows_;


   bool pinned_;


   RuntimeProfile::Counter* pin_timer_;

   RuntimeProfile::Counter* unpin_timer_;

   RuntimeProfile::Counter* get_new_block_timer_;


   template <bool HasNullableTuple>

   bool DeepCopyInternal(TupleRow* row, uint8_t** dst);


   bool DeepCopy(TupleRow* row, uint8_t** dst);


   Status NewBlockForWrite(int min_size, bool* got_block);


   Status NextBlockForRead();


   int ComputeRowSize(TupleRow* row) const;


   Status UnpinBlock(BufferedBlockMgr::Block* block);


   template <bool HasNullableTuple>

   Status GetNextInternal(RowBatch* batch, bool* eos, std::vector<RowIdx>* indices);


   int ComputeNumNullIndicatorBytes(int block_size) const;

 };


 }


 #endif

impala::BufferedTupleStream::num_pinned_
int num_pinned_
Definition: buffered-tuple-stream.h:330

impala::BufferedTupleStream
The underlying memory management is done by the BufferedBlockMgr.
Definition: buffered-tuple-stream.h:109

impala::BufferedTupleStream::read_ptr_
uint8_t * read_ptr_
Current ptr offset in read_block_'s buffer.
Definition: buffered-tuple-stream.h:307

impala::BufferedTupleStream::null_indicators_read_block_
uint32_t null_indicators_read_block_
Definition: buffered-tuple-stream.h:281

impala::BufferedTupleStream::RowIdx::OFFSET_SHIFT
static const uint64_t OFFSET_SHIFT
Definition: buffered-tuple-stream.h:125

impala::BufferedTupleStream::total_byte_size_
int64_t total_byte_size_
Total size of blocks_, including small blocks.
Definition: buffered-tuple-stream.h:295

impala::BufferedTupleStream::has_write_block
bool has_write_block() const
Definition: buffered-tuple-stream.h:247

impala::BufferedTupleStream::Close
void Close()
Must be called once at the end to cleanup all resources. Idempotent.
Definition: buffered-tuple-stream.cc:145

impala::BufferedTupleStream::block_start_idx_
std::vector< uint8_t * > block_start_idx_
Definition: buffered-tuple-stream.h:304

impala::BufferedTupleStream::read_block_
std::list< BufferedBlockMgr::Block * >::iterator read_block_
Definition: buffered-tuple-stream.h:299

impala::BufferedTupleStream::blocks_pinned
int blocks_pinned() const
Definition: buffered-tuple-stream.h:244

impala::BufferedBlockMgr
Definition: buffered-block-mgr.h:92

impala::BufferedTupleStream::RowIdx::DebugString
std::string DebugString() const
Definition: buffered-tuple-stream.cc:37

impala::BufferedTupleStream::rows_returned
int64_t rows_returned() const
Number of rows returned via GetNext().
Definition: buffered-tuple-stream.h:234

impala::BufferedTupleStream::PinStream
Status PinStream(bool already_reserved, bool *pinned)
Definition: buffered-tuple-stream.cc:357

impala::BufferedTupleStream::GetNextInternal
Status GetNextInternal(RowBatch *batch, bool *eos, std::vector< RowIdx > *indices)
Templated GetNext implementation.

impala::BufferedTupleStream::RowIdx::BLOCK_SHIFT
static const uint64_t BLOCK_SHIFT
Definition: buffered-tuple-stream.h:123

impala::BufferedTupleStream::RowIdx::offset
uint64_t offset() const
Definition: buffered-tuple-stream.h:133

impala::BufferedTupleStream::unpin_timer_
RuntimeProfile::Counter * unpin_timer_
Definition: buffered-tuple-stream.h:349

impala::BufferedBlockMgr::Client
Definition: buffered-block-mgr.cc:45

impala::BufferedTupleStream::BufferedTupleStream
BufferedTupleStream(RuntimeState *state, const RowDescriptor &row_desc, BufferedBlockMgr *block_mgr, BufferedBlockMgr::Client *client, bool use_initial_small_buffers=true, bool delete_on_read=false, bool read_write=false)
Definition: buffered-tuple-stream.cc:43

impala::BufferedTupleStream::status_
Status status_
Definition: buffered-tuple-stream.h:336

impala::RowDescriptor
Definition: descriptors.h:373

impala::BufferedTupleStream::DeepCopy
bool DeepCopy(TupleRow *row, uint8_t **dst)
Wrapper of the templated DeepCopyInternal() function.
Definition: buffered-tuple-stream-ir.cc:22

impala::BufferedTupleStream::fixed_tuple_row_size_
int fixed_tuple_row_size_
Sum of the fixed length portion of all the tuples in desc_.
Definition: buffered-tuple-stream.h:274

impala::BufferedTupleStream::RowIdx::set
uint64_t set(uint64_t block, uint64_t offset, uint64_t idx)
Definition: buffered-tuple-stream.h:141

impala::BufferedTupleStream::closed_
bool closed_
Definition: buffered-tuple-stream.h:335

impala::BufferedTupleStream::NextBlockForRead
Status NextBlockForRead()
Definition: buffered-tuple-stream.cc:248

impala::BufferedTupleStream::string_slots_
std::vector< std::pair< int, std::vector< SlotDescriptor * > > > string_slots_
Vector of all the strings slots grouped by tuple_idx.
Definition: buffered-tuple-stream.h:285

impala::BufferedTupleStream::desc_
const RowDescriptor & desc_
Description of rows stored in the stream.
Definition: buffered-tuple-stream.h:268

impala::BufferedTupleStream::use_small_buffers_
bool use_small_buffers_
If true, this stream is still using small buffers.
Definition: buffered-tuple-stream.h:254

impala::BufferedTupleStream::read_write_
const bool read_write_
Definition: buffered-tuple-stream.h:262

impala::TupleRow
Definition: tuple-row.h:28

impala::RuntimeProfile::Counter
Definition: runtime-profile.h:85

impala::BufferedTupleStream::RowIdx::BLOCK_MASK
static const uint64_t BLOCK_MASK
Definition: buffered-tuple-stream.h:122

impala::BufferedTupleStream::byte_size
int64_t byte_size() const
Returns the byte size necessary to store the entire stream in memory.
Definition: buffered-tuple-stream.h:237

impala::BufferedBlockMgr::Block
Definition: buffered-block-mgr.h:136

impala::BufferedTupleStream::RowIdx::IDX_MASK
static const uint64_t IDX_MASK
Definition: buffered-tuple-stream.h:126

impala::BufferedTupleStream::RowIdx::IDX_SHIFT
static const uint64_t IDX_SHIFT
Definition: buffered-tuple-stream.h:127

impala::BufferedTupleStream::read_block_idx_
int read_block_idx_
The block index of the current read block.
Definition: buffered-tuple-stream.h:322

impala::Status
Definition: status.h:81

impala::BufferedTupleStream::blocks_unpinned
int blocks_unpinned() const
Definition: buffered-tuple-stream.h:245

impala::BufferedTupleStream::DeepCopyInternal
bool DeepCopyInternal(TupleRow *row, uint8_t **dst)
Definition: buffered-tuple-stream-ir.cc:32

impala::BufferedTupleStream::write_tuple_idx_
uint32_t write_tuple_idx_
Current idx of the tuple written at the write_block_ buffer.
Definition: buffered-tuple-stream.h:313

impala::BufferedTupleStream::ComputeNumNullIndicatorBytes
int ComputeNumNullIndicatorBytes(int block_size) const
Computes the number of bytes needed for null indicators for a block of 'block_size'.
Definition: buffered-tuple-stream.cc:415

impala::BufferedTupleStream::block_mgr_client_
BufferedBlockMgr::Client * block_mgr_client_
Definition: buffered-tuple-stream.h:289

impala::BufferedTupleStream::read_tuple_idx_
uint32_t read_tuple_idx_
Current idx of the tuple read from the read_block_ buffer.
Definition: buffered-tuple-stream.h:310

impala::RuntimeState
Definition: runtime-state.h:69

impala::BufferedTupleStream::RowIdx::OFFSET_MASK
static const uint64_t OFFSET_MASK
Definition: buffered-tuple-stream.h:124

impala::BufferedTupleStream::has_read_block
bool has_read_block() const
Definition: buffered-tuple-stream.h:246

impala::BufferedTupleStream::delete_on_read_
const bool delete_on_read_
If true, blocks are deleted after they are read.
Definition: buffered-tuple-stream.h:257

impala::BufferedTupleStream::nullable_tuple_
const bool nullable_tuple_
Whether any tuple in the rows is nullable.
Definition: buffered-tuple-stream.h:271

uint64_t

impala::BufferedTupleStream::write_block_
BufferedBlockMgr::Block * write_block_
The current block for writing. NULL if there is no available block to write to.
Definition: buffered-tuple-stream.h:325

impala::BufferedTupleStream::using_small_buffers
bool using_small_buffers() const
Definition: buffered-tuple-stream.h:248

impala::RowBatch
Definition: row-batch.h:66

impala::BufferedTupleStream::GetRows
Status GetRows(boost::scoped_ptr< RowBatch > *batch, bool *got_rows)
Definition: buffered-tuple-stream.cc:431

impala::row_desc
const RowDescriptor & row_desc() const

impala::BufferedTupleStream::pinned_
bool pinned_
Definition: buffered-tuple-stream.h:345

impala::BufferedTupleStream::UnpinBlock
Status UnpinBlock(BufferedBlockMgr::Block *block)
Unpins block if it is an io sized block and updates tracking stats.
Definition: buffered-tuple-stream.cc:168

status.h

impala::BufferedTupleStream::block_mgr_
BufferedBlockMgr * block_mgr_
Block manager and client used to allocate, pin and release blocks. Not owned.
Definition: buffered-tuple-stream.h:288

impala::RuntimeProfile
Definition: runtime-profile.h:83

impala::BufferedTupleStream::pin_timer_
RuntimeProfile::Counter * pin_timer_
Counters added by this object to the parent runtime profile.
Definition: buffered-tuple-stream.h:348

impala::BufferedTupleStream::null_indicators_write_block_
uint32_t null_indicators_write_block_
Definition: buffered-tuple-stream.h:282

impala::BufferedTupleStream::state_
RuntimeState *const state_
Runtime state instance used to check for cancellation. Not owned.
Definition: buffered-tuple-stream.h:265

impala::BufferedTupleStream::Init
Status Init(RuntimeProfile *profile=NULL, bool pinned=true)
Definition: buffered-tuple-stream.cc:116

impala::BufferedTupleStream::status
Status status() const
Definition: buffered-tuple-stream.h:228

impala::BufferedTupleStream::AddRow
bool AddRow(TupleRow *row, uint8_t **dst=NULL)
Definition: buffered-tuple-stream.inline.h:25

impala::BufferedTupleStream::AllocateRow
uint8_t * AllocateRow(int size)
Definition: buffered-tuple-stream.inline.h:34

impala::BufferedTupleStream::DebugString
std::string DebugString() const
Definition: buffered-tuple-stream.cc:93

impala::BufferedTupleStream::PrepareForRead
Status PrepareForRead(bool *got_buffer=NULL)
Definition: buffered-tuple-stream.cc:314

impala::BufferedTupleStream::is_pinned
bool is_pinned() const
Definition: buffered-tuple-stream.h:243

impala::BufferedTupleStream::RowIdx::data
uint64_t data
Definition: buffered-tuple-stream.h:154

impala::BufferedTupleStream::read_bytes_
int64_t read_bytes_
Bytes read in read_block_.
Definition: buffered-tuple-stream.h:316

impala::BufferedTupleStream::blocks_
std::list< BufferedBlockMgr::Block * > blocks_
List of blocks in the stream.
Definition: buffered-tuple-stream.h:292

impala::BufferedTupleStream::num_rows
int64_t num_rows() const
Number of rows in the stream.
Definition: buffered-tuple-stream.h:231

impala::BufferedTupleStream::NewBlockForWrite
Status NewBlockForWrite(int min_size, bool *got_block)
Definition: buffered-tuple-stream.cc:178

impala::BufferedTupleStream::get_new_block_timer_
RuntimeProfile::Counter * get_new_block_timer_
Definition: buffered-tuple-stream.h:350

impala::BufferedTupleStream::UnpinStream
Status UnpinStream(bool all=false)
Definition: buffered-tuple-stream.cc:396

impala::BufferedTupleStream::SwitchToIoBuffers
Status SwitchToIoBuffers(bool *got_buffer)
Definition: buffered-tuple-stream.cc:136

buffered-block-mgr.h

gen_ir_descriptions.idx
int idx
Definition: gen_ir_descriptions.py:215

impala::BufferedTupleStream::RowIdx
Definition: buffered-tuple-stream.h:121

impala::BufferedTupleStream::RowIdx::idx
uint64_t idx() const
Definition: buffered-tuple-stream.h:137

impala::BufferedTupleStream::num_small_blocks_
int num_small_blocks_
The total number of small blocks in blocks_;.
Definition: buffered-tuple-stream.h:333

impala::BufferedTupleStream::num_rows_
int64_t num_rows_
Number of rows stored in the stream.
Definition: buffered-tuple-stream.h:339

impala::BufferedTupleStream::GetNext
Status GetNext(RowBatch *batch, bool *eos, std::vector< RowIdx > *indices=NULL)
Definition: buffered-tuple-stream.cc:447

impala::BufferedTupleStream::ComputeRowSize
int ComputeRowSize(TupleRow *row) const
Returns the byte size of this row when encoded in a block.
Definition: buffered-tuple-stream.cc:595

impala::BufferedTupleStream::rows_returned_
int64_t rows_returned_
Number of rows returned to the caller from GetNext().
Definition: buffered-tuple-stream.h:319

impala::BufferedTupleStream::bytes_in_mem
int64_t bytes_in_mem(bool ignore_current) const
Definition: buffered-tuple-stream.cc:156

impala::BufferedTupleStream::RowIdx::block
uint64_t block() const
Definition: buffered-tuple-stream.h:129

impala::BufferedTupleStream::GetTupleRow
void GetTupleRow(const RowIdx &idx, TupleRow *row) const
Definition: buffered-tuple-stream.inline.h:49