doc/html/HdfsPartition_8java_source.html

 // Copyright 2012 Cloudera Inc.

 //

 // Licensed under the Apache License, Version 2.0 (the "License");

 // you may not use this file except in compliance with the License.

 // You may obtain a copy of the License at

 //

 // http://www.apache.org/licenses/LICENSE-2.0

 //

 // Unless required by applicable law or agreed to in writing, software

 // distributed under the License is distributed on an "AS IS" BASIS,

 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 // See the License for the specific language governing permissions and

 // limitations under the License.


 package com.cloudera.impala.catalog;


 import java.util.ArrayList;

 import java.util.Arrays;

 import java.util.List;

 import java.util.Map;

 import java.util.concurrent.atomic.AtomicLong;


 import org.apache.commons.lang.ArrayUtils;

 import org.slf4j.Logger;

 import org.slf4j.LoggerFactory;


 import com.cloudera.impala.analysis.Expr;

 import com.cloudera.impala.analysis.LiteralExpr;

 import com.cloudera.impala.analysis.NullLiteral;

 import com.cloudera.impala.analysis.PartitionKeyValue;

 import com.cloudera.impala.analysis.ToSqlUtils;

 import com.cloudera.impala.common.ImpalaException;

 import com.cloudera.impala.thrift.ImpalaInternalServiceConstants;

 import com.cloudera.impala.thrift.TAccessLevel;

 import com.cloudera.impala.thrift.TExpr;

 import com.cloudera.impala.thrift.TExprNode;

 import com.cloudera.impala.thrift.THdfsCompression;

 import com.cloudera.impala.thrift.THdfsFileBlock;

 import com.cloudera.impala.thrift.THdfsFileDesc;

 import com.cloudera.impala.thrift.THdfsPartition;

 import com.cloudera.impala.thrift.TNetworkAddress;

 import com.cloudera.impala.thrift.TPartitionStats;

 import com.cloudera.impala.thrift.TTableStats;

 import com.cloudera.impala.util.HdfsCachingUtil;

 import com.google.common.base.Joiner;

 import com.google.common.base.Objects;

 import com.google.common.base.Preconditions;

 import com.google.common.collect.ImmutableList;

 import com.google.common.collect.ImmutableMap;

 import com.google.common.collect.Lists;

 import com.google.common.collect.Maps;

 import com.google.common.annotations.VisibleForTesting;


 public class HdfsPartition implements Comparable<HdfsPartition> {

   static public class FileDescriptor {

     private final THdfsFileDesc fileDescriptor_;


     public String getFileName() { return fileDescriptor_.getFile_name(); }

     public long getFileLength() { return fileDescriptor_.getLength(); }

     public THdfsCompression getFileCompression() {

       return fileDescriptor_.getCompression();

     }

     public long getModificationTime() {

       return fileDescriptor_.getLast_modification_time();

     }

     public List<THdfsFileBlock> getFileBlocks() {

       return fileDescriptor_.getFile_blocks();

     }


     public THdfsFileDesc toThrift() { return fileDescriptor_; }


     public FileDescriptor(String fileName, long fileLength, long modificationTime) {

       Preconditions.checkNotNull(fileName);

       Preconditions.checkArgument(fileLength >= 0);

       fileDescriptor_ = new THdfsFileDesc();

       fileDescriptor_.setFile_name(fileName);

       fileDescriptor_.setLength(fileLength);

       fileDescriptor_.setLast_modification_time(modificationTime);

       fileDescriptor_.setCompression(

           HdfsCompression.fromFileName(fileName).toThrift());

       List<THdfsFileBlock> emptyFileBlockList = Lists.newArrayList();

       fileDescriptor_.setFile_blocks(emptyFileBlockList);

     }


     private FileDescriptor(THdfsFileDesc fileDesc) {

       this(fileDesc.getFile_name(), fileDesc.length, fileDesc.last_modification_time);

       for (THdfsFileBlock block: fileDesc.getFile_blocks()) {

         fileDescriptor_.addToFile_blocks(block);

       }

     }


     public void addFileBlock(FileBlock blockMd) {

       fileDescriptor_.addToFile_blocks(blockMd.toThrift());

     }


     public static FileDescriptor fromThrift(THdfsFileDesc desc) {

       return new FileDescriptor(desc);

     }


     @Override

     public String toString() {

       return Objects.toStringHelper(this)

           .add("FileName", getFileName())

           .add("Length", getFileLength()).toString();

     }

   }


   public static class BlockReplica {

     private final boolean isCached_;

     private final int hostIdx_;


     public BlockReplica(int hostIdx, boolean isCached) {

       hostIdx_ = hostIdx;

       isCached_ = isCached;

     }


     public static TNetworkAddress parseLocation(String location) {

       Preconditions.checkNotNull(location);

       String[] ip_port = location.split(":");

       if (ip_port.length != 2) return null;

       try {

         return new TNetworkAddress(ip_port[0], Integer.parseInt(ip_port[1]));

       } catch (NumberFormatException e) {

         return null;

       }

     }


     public boolean isCached() { return isCached_; }

     public int getHostIdx() { return hostIdx_; }

   }


   public static class FileBlock {

     private final THdfsFileBlock fileBlock_;

     private boolean isCached_; // Set to true if there is at least one cached replica.


     private FileBlock(THdfsFileBlock fileBlock) {

       fileBlock_ = fileBlock;

       isCached_ = false;

       for (boolean isCached: fileBlock.getIs_replica_cached()) {

         isCached_ |= isCached;

       }

     }


     public FileBlock(long offset, long blockLength,

         List<BlockReplica> replicaHostIdxs) {

       Preconditions.checkNotNull(replicaHostIdxs);

       fileBlock_ = new THdfsFileBlock();

       fileBlock_.setOffset(offset);

       fileBlock_.setLength(blockLength);


       fileBlock_.setReplica_host_idxs(new ArrayList<Integer>(replicaHostIdxs.size()));

       fileBlock_.setIs_replica_cached(new ArrayList<Boolean>(replicaHostIdxs.size()));

       isCached_ = false;

       for (BlockReplica replica: replicaHostIdxs) {

         fileBlock_.addToReplica_host_idxs(replica.getHostIdx());

         fileBlock_.addToIs_replica_cached(replica.isCached());

         isCached_ |= replica.isCached();

       }

     }


     public long getOffset() { return fileBlock_.getOffset(); }

     public long getLength() { return fileBlock_.getLength(); }

     // Returns true if at there at least one cached replica.

     public boolean isCached() { return isCached_; }

     public List<Integer> getReplicaHostIdxs() {

       return fileBlock_.getReplica_host_idxs();

     }


     public static void setDiskIds(int[] diskIds, THdfsFileBlock fileBlock) {

       Preconditions.checkArgument(

           diskIds.length == fileBlock.getReplica_host_idxs().size());

       fileBlock.setDisk_ids(Arrays.asList(ArrayUtils.toObject(diskIds)));

     }


     public int getDiskId(int hostIndex) {

       if (fileBlock_.disk_ids == null) return -1;

       return fileBlock_.getDisk_ids().get(hostIndex);

     }


     public boolean isCached(int hostIndex) {

       return fileBlock_.getIs_replica_cached().get(hostIndex);

     }


     public THdfsFileBlock toThrift() { return fileBlock_; }


     public static FileBlock fromThrift(THdfsFileBlock thriftFileBlock) {

       return new FileBlock(thriftFileBlock);

     }


     @Override

     public String toString() {

       return Objects.toStringHelper(this)

           .add("offset", fileBlock_.offset)

           .add("length", fileBlock_.length)

           .add("#disks", fileBlock_.getDisk_idsSize())

           .toString();

     }

   }


   private final HdfsTable table_;

   private final List<LiteralExpr> partitionKeyValues_;

   // estimated number of rows in partition; -1: unknown

   private long numRows_ = -1;

   private static AtomicLong partitionIdCounter_ = new AtomicLong();


   // A unique ID for each partition, used to identify a partition in the thrift

   // representation of a table.

   private final long id_;


   /*

    * Note: Although you can write multiple formats to a single partition (by changing

    * the format before each write), Hive won't let you read that data and neither should

    * we. We should therefore treat mixing formats inside one partition as user error.

    * It's easy to add per-file metadata to FileDescriptor if this changes.

    */

   private final HdfsStorageDescriptor fileFormatDescriptor_;


   private final List<FileDescriptor> fileDescriptors_;

   private String location_;

   private final static Logger LOG = LoggerFactory.getLogger(HdfsPartition.class);

   private boolean isDirty_ = false;

   // True if this partition is marked as cached. Does not necessarily mean the data is

   // cached.

   private boolean isMarkedCached_ = false;

   private final TAccessLevel accessLevel_;


   // (k,v) pairs of parameters for this partition, stored in the HMS. Used by Impala to

   // store intermediate state for statistics computations.

   private Map<String, String> hmsParameters_;


   public HdfsStorageDescriptor getInputFormatDescriptor() {

     return fileFormatDescriptor_;

   }


   public boolean isDefaultPartition() {

     return id_ == ImpalaInternalServiceConstants.DEFAULT_PARTITION_ID;

   }


   public String getPartitionName() {

     List<String> partitionCols = Lists.newArrayList();

     List<String> partitionValues = Lists.newArrayList();

     for (int i = 0; i < getTable().getNumClusteringCols(); ++i) {

       partitionCols.add(getTable().getColumns().get(i).getName());

     }


     return org.apache.hadoop.hive.common.FileUtils.makePartName(

         partitionCols, getPartitionValuesAsStrings(true));

   }


   public List<String> getPartitionValuesAsStrings(boolean mapNullsToHiveKey) {

     List<String> ret = Lists.newArrayList();

     for (LiteralExpr partValue: getPartitionValues()) {

       if (mapNullsToHiveKey) {

         ret.add(PartitionKeyValue.getPartitionKeyValueString(

                 partValue, getTable().getNullPartitionKeyValue()));

       } else {

         ret.add(partValue.getStringValue());

       }

     }

     return ret;

   }


   public String getConjunctSql() {

     List<String> partitionCols = Lists.newArrayList();

     List<String> partitionValues = Lists.newArrayList();

     for (int i = 0; i < getTable().getNumClusteringCols(); ++i) {

       partitionCols.add(ToSqlUtils.getIdentSql(getTable().getColumns().get(i).getName()));

     }


     List<String> conjuncts = Lists.newArrayList();

     for (int i = 0; i < partitionCols.size(); ++i) {

       LiteralExpr expr = getPartitionValues().get(i);

       String sql = expr.toSql();

       if (expr instanceof NullLiteral || sql.isEmpty()) {

         conjuncts.add(ToSqlUtils.getIdentSql(partitionCols.get(i))

             + " IS NULL");

       } else {

         conjuncts.add(ToSqlUtils.getIdentSql(partitionCols.get(i))

             + "=" + sql);

       }

     }

     return "(" + Joiner.on(" AND " ).join(conjuncts) + ")";

   }


   public String getValuesAsString() {

     StringBuilder partDescription = new StringBuilder();

     for (int i = 0; i < getTable().getNumClusteringCols(); ++i) {

       String columnName = getTable().getColumns().get(i).getName();

       String value = PartitionKeyValue.getPartitionKeyValueString(

           getPartitionValues().get(i),

           getTable().getNullPartitionKeyValue());

       partDescription.append(columnName + "=" + value);

       if (i != getTable().getNumClusteringCols() - 1) partDescription.append("/");

     }

     return partDescription.toString();

   }


   public String getLocation() { return location_; }

   public long getId() { return id_; }

   public HdfsTable getTable() { return table_; }

   public void setNumRows(long numRows) { numRows_ = numRows; }

   public long getNumRows() { return numRows_; }

   public boolean isMarkedCached() { return isMarkedCached_; }

   void markCached() { isMarkedCached_ = true; }


   public void setFileFormat(HdfsFileFormat fileFormat) {

     fileFormatDescriptor_.setFileFormat(fileFormat);

   }


   public void setLocation(String location) { location_ = location; }


   public org.apache.hadoop.hive.metastore.api.SerDeInfo getSerdeInfo() {

     return cachedMsPartitionDescriptor_.sdSerdeInfo;

   }


   // May return null if no per-partition stats were recorded, or if the per-partition

   // stats could not be deserialised from the parameter map.

   public TPartitionStats getPartitionStats() {

     try {

       return PartitionStatsUtil.partStatsFromParameters(hmsParameters_);

     } catch (ImpalaException e) {

       LOG.warn("Could not deserialise incremental stats state for " + getPartitionName() +

           ", consider DROP INCREMENTAL STATS ... PARTITION ... and recomputing " +

           "incremental stats for this table.");

       return null;

     }

   }


   public boolean hasIncrementalStats() {

     TPartitionStats partStats = getPartitionStats();

     return partStats != null && partStats.intermediate_col_stats != null;

   }


   public TAccessLevel getAccessLevel() { return accessLevel_; }


    public String getParameter(String key) {

      return hmsParameters_.get(key);

    }


    public Map<String, String> getParameters() { return hmsParameters_; }


    public void putToParameters(String k, String v) { hmsParameters_.put(k, v); }


   public void markDirty() { isDirty_ = true; }

   public boolean isDirty() { return isDirty_; }


   public List<LiteralExpr> getPartitionValues() { return partitionKeyValues_; }

   public List<HdfsPartition.FileDescriptor> getFileDescriptors() {

     return fileDescriptors_;

   }


   public boolean hasFileDescriptors() { return !fileDescriptors_.isEmpty(); }


   // Struct-style class for caching all the information we need to reconstruct an

   // HMS-compatible Partition object, for use in RPCs to the metastore. We do this rather

   // than cache the Thrift partition object itself as the latter can be large - thanks

   // mostly to the inclusion of the full FieldSchema list. This class is read-only - if

   // any field can be mutated by Impala it should belong to HdfsPartition itself (see

   // HdfsPartition.location_ for an example).

   //

   // TODO: Cache this descriptor in HdfsTable so that identical descriptors are shared

   // between HdfsPartition instances.

   private static class CachedHmsPartitionDescriptor {

     public final String sdOutputFormat;

     public final boolean sdCompressed;

     public final int sdNumBuckets;

     public final org.apache.hadoop.hive.metastore.api.SerDeInfo sdSerdeInfo;

     public final List<String> sdBucketCols;

     public final List<org.apache.hadoop.hive.metastore.api.Order> sdSortCols;

     public final Map<String, String> sdParameters;

     public final int msCreateTime;

     public final int msLastAccessTime;


     public CachedHmsPartitionDescriptor(

         org.apache.hadoop.hive.metastore.api.Partition msPartition) {

       org.apache.hadoop.hive.metastore.api.StorageDescriptor sd = null;

       if (msPartition != null) {

         sd = msPartition.getSd();

         msCreateTime = msPartition.getCreateTime();

         msLastAccessTime = msPartition.getLastAccessTime();

       } else {

         msCreateTime = msLastAccessTime = 0;

       }

       if (sd != null) {

         sdOutputFormat = sd.getOutputFormat();

         sdCompressed = sd.isCompressed();

         sdNumBuckets = sd.getNumBuckets();

         sdSerdeInfo = sd.getSerdeInfo();

         sdBucketCols = ImmutableList.copyOf(sd.getBucketCols());

         sdSortCols = ImmutableList.copyOf(sd.getSortCols());

         sdParameters = ImmutableMap.copyOf(sd.getParameters());

       } else {

         sdOutputFormat = "";

         sdCompressed = false;

         sdNumBuckets = 0;

         sdSerdeInfo = null;

         sdBucketCols = ImmutableList.of();

         sdSortCols = ImmutableList.of();

         sdParameters = ImmutableMap.of();

       }

     }

   }


   private final CachedHmsPartitionDescriptor cachedMsPartitionDescriptor_;


   public org.apache.hadoop.hive.metastore.api.Partition toHmsPartition() {

     if (cachedMsPartitionDescriptor_ == null) return null;

     Preconditions.checkNotNull(table_.getFieldSchemas());

     org.apache.hadoop.hive.metastore.api.StorageDescriptor storageDescriptor =

         new org.apache.hadoop.hive.metastore.api.StorageDescriptor(

             table_.getNonPartitionFieldSchemas(), location_,

             fileFormatDescriptor_.getFileFormat().toJavaClassName(),

             cachedMsPartitionDescriptor_.sdOutputFormat,

             cachedMsPartitionDescriptor_.sdCompressed,

             cachedMsPartitionDescriptor_.sdNumBuckets,

             cachedMsPartitionDescriptor_.sdSerdeInfo,

             cachedMsPartitionDescriptor_.sdBucketCols,

             cachedMsPartitionDescriptor_.sdSortCols,

             cachedMsPartitionDescriptor_.sdParameters);

     org.apache.hadoop.hive.metastore.api.Partition partition =

         new org.apache.hadoop.hive.metastore.api.Partition(

             getPartitionValuesAsStrings(true), getTable().getDb().getName(),

             getTable().getName(), cachedMsPartitionDescriptor_.msCreateTime,

             cachedMsPartitionDescriptor_.msLastAccessTime, storageDescriptor,

             getParameters());

     return partition;

   }


   private HdfsPartition(HdfsTable table,

       org.apache.hadoop.hive.metastore.api.Partition msPartition,

       List<LiteralExpr> partitionKeyValues,

       HdfsStorageDescriptor fileFormatDescriptor,

       List<HdfsPartition.FileDescriptor> fileDescriptors, long id,

       String location, TAccessLevel accessLevel) {

     table_ = table;

     if (msPartition == null) {

       cachedMsPartitionDescriptor_ = null;

     } else {

       cachedMsPartitionDescriptor_ = new CachedHmsPartitionDescriptor(msPartition);

     }

     location_ = location;

     partitionKeyValues_ = ImmutableList.copyOf(partitionKeyValues);

     fileDescriptors_ = ImmutableList.copyOf(fileDescriptors);

     fileFormatDescriptor_ = fileFormatDescriptor;

     id_ = id;

     accessLevel_ = accessLevel;

     if (msPartition != null && msPartition.getParameters() != null) {

       isMarkedCached_ = HdfsCachingUtil.getCacheDirectiveId(

           msPartition.getParameters()) != null;

       hmsParameters_ = msPartition.getParameters();

     } else {

       hmsParameters_ = Maps.newHashMap();

     }


     // TODO: instead of raising an exception, we should consider marking this partition

     // invalid and moving on, so that table loading won't fail and user can query other

     // partitions.

     for (FileDescriptor fileDescriptor: fileDescriptors_) {

       StringBuilder errorMsg = new StringBuilder();

       if (!getInputFormatDescriptor().getFileFormat().isFileCompressionTypeSupported(

           fileDescriptor.getFileName(), errorMsg)) {

         throw new RuntimeException(errorMsg.toString());

       }

     }

   }


   public HdfsPartition(HdfsTable table,

       org.apache.hadoop.hive.metastore.api.Partition msPartition,

       List<LiteralExpr> partitionKeyValues,

       HdfsStorageDescriptor fileFormatDescriptor,

       List<HdfsPartition.FileDescriptor> fileDescriptors, TAccessLevel accessLevel) {

     this(table, msPartition, partitionKeyValues, fileFormatDescriptor, fileDescriptors,

         partitionIdCounter_.getAndIncrement(), msPartition != null ?

             msPartition.getSd().getLocation() : table.getLocation(), accessLevel);

   }


   public static HdfsPartition defaultPartition(

       HdfsTable table, HdfsStorageDescriptor storageDescriptor) {

     List<LiteralExpr> emptyExprList = Lists.newArrayList();

     List<FileDescriptor> emptyFileDescriptorList = Lists.newArrayList();

     return new HdfsPartition(table, null, emptyExprList,

         storageDescriptor, emptyFileDescriptorList,

         ImpalaInternalServiceConstants.DEFAULT_PARTITION_ID, null,

         TAccessLevel.READ_WRITE);

   }


   public long getSize() {

     long result = 0;

     for (HdfsPartition.FileDescriptor fileDescriptor: fileDescriptors_) {

       result += fileDescriptor.getFileLength();

     }

     return result;

   }


   @Override

   public String toString() {

     return Objects.toStringHelper(this)

       .add("fileDescriptors", fileDescriptors_)

       .toString();

   }


   public static HdfsPartition fromThrift(HdfsTable table,

       long id, THdfsPartition thriftPartition) {

     HdfsStorageDescriptor storageDesc = new HdfsStorageDescriptor(table.getName(),

         HdfsFileFormat.fromThrift(thriftPartition.getFileFormat()),

         thriftPartition.lineDelim,

         thriftPartition.fieldDelim,

         thriftPartition.collectionDelim,

         thriftPartition.mapKeyDelim,

         thriftPartition.escapeChar,

         (byte) '"', // TODO: We should probably add quoteChar to THdfsPartition.

         thriftPartition.blockSize);


     List<LiteralExpr> literalExpr = Lists.newArrayList();

     if (id != ImpalaInternalServiceConstants.DEFAULT_PARTITION_ID) {

       List<Column> clusterCols = Lists.newArrayList();

       for (int i = 0; i < table.getNumClusteringCols(); ++i) {

         clusterCols.add(table.getColumns().get(i));

       }


       List<TExprNode> exprNodes = Lists.newArrayList();

       for (TExpr expr: thriftPartition.getPartitionKeyExprs()) {

         for (TExprNode node: expr.getNodes()) {

           exprNodes.add(node);

         }

       }

       Preconditions.checkState(clusterCols.size() == exprNodes.size(),

           String.format("Number of partition columns (%d) does not match number " +

               "of partition key expressions (%d)",

               clusterCols.size(), exprNodes.size()));


       for (int i = 0; i < exprNodes.size(); ++i) {

         literalExpr.add(LiteralExpr.fromThrift(

             exprNodes.get(i), clusterCols.get(i).getType()));

       }

     }


     List<HdfsPartition.FileDescriptor> fileDescriptors = Lists.newArrayList();

     if (thriftPartition.isSetFile_desc()) {

       for (THdfsFileDesc desc: thriftPartition.getFile_desc()) {

         fileDescriptors.add(HdfsPartition.FileDescriptor.fromThrift(desc));

       }

     }


     TAccessLevel accessLevel = thriftPartition.isSetAccess_level() ?

         thriftPartition.getAccess_level() : TAccessLevel.READ_WRITE;

     HdfsPartition partition = new HdfsPartition(table, null, literalExpr, storageDesc,

         fileDescriptors, id, thriftPartition.getLocation(), accessLevel);

     if (thriftPartition.isSetStats()) {

       partition.setNumRows(thriftPartition.getStats().getNum_rows());

     }

     if (thriftPartition.isSetIs_marked_cached()) {

       partition.isMarkedCached_ = thriftPartition.isIs_marked_cached();

     }


     if (thriftPartition.isSetHms_parameters()) {

       partition.hmsParameters_ = thriftPartition.getHms_parameters();

     } else {

       partition.hmsParameters_ = Maps.newHashMap();

     }


     return partition;

   }


   public void checkWellFormed() throws CatalogException {

     try {

       // Validate all the partition key/values to ensure you can convert them toThrift()

       Expr.treesToThrift(getPartitionValues());

     } catch (Exception e) {

       throw new CatalogException("Partition (" + getPartitionName() +

           ") has invalid partition column values: ", e);

     }

   }


   public THdfsPartition toThrift(boolean includeFileDesc) {

     List<TExpr> thriftExprs = Expr.treesToThrift(getPartitionValues());


     THdfsPartition thriftHdfsPart = new THdfsPartition(

         fileFormatDescriptor_.getLineDelim(),

         fileFormatDescriptor_.getFieldDelim(),

         fileFormatDescriptor_.getCollectionDelim(),

         fileFormatDescriptor_.getMapKeyDelim(),

         fileFormatDescriptor_.getEscapeChar(),

         fileFormatDescriptor_.getFileFormat().toThrift(), thriftExprs,

         fileFormatDescriptor_.getBlockSize());

     thriftHdfsPart.setLocation(location_);

     thriftHdfsPart.setStats(new TTableStats(numRows_));

     thriftHdfsPart.setAccess_level(accessLevel_);

     thriftHdfsPart.setIs_marked_cached(isMarkedCached_);

     thriftHdfsPart.setId(getId());

     thriftHdfsPart.setHms_parameters(hmsParameters_);

     if (includeFileDesc) {

       // Add block location information

       for (FileDescriptor fd: fileDescriptors_) {

         thriftHdfsPart.addToFile_desc(fd.toThrift());

       }

     }


     return thriftHdfsPart;

   }


   @Override

   public int compareTo(HdfsPartition o) {

     return comparePartitionKeyValues(partitionKeyValues_, o.getPartitionValues());

   }


   @VisibleForTesting

   public static int comparePartitionKeyValues(List<LiteralExpr> lhs,

       List<LiteralExpr> rhs) {

     int sizeDiff = lhs.size() - rhs.size();

     if (sizeDiff != 0) return sizeDiff;

     for(int i = 0; i < lhs.size(); ++i) {

       int cmp = lhs.get(i).compareTo(rhs.get(i));

       if (cmp != 0) return cmp;

     }

     return 0;

   }

 }

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor
Definition: HdfsPartition.java:65

com.cloudera.impala.catalog.HdfsStorageDescriptor.getLineDelim
byte getLineDelim()
Definition: HdfsStorageDescriptor.java:229

com.cloudera.impala.catalog.HdfsPartition.getPartitionStats
TPartitionStats getPartitionStats()
Definition: HdfsPartition.java:384

com.cloudera.impala.catalog.HdfsPartition.BlockReplica.hostIdx_
final int hostIdx_
Definition: HdfsPartition.java:123

com.cloudera.impala.catalog.HdfsPartition.toString
String toString()
Definition: HdfsPartition.java:584

com.cloudera.impala.catalog.HdfsStorageDescriptor
Definition: HdfsStorageDescriptor.java:33

com.cloudera.impala.catalog.HdfsStorageDescriptor.getEscapeChar
byte getEscapeChar()
Definition: HdfsStorageDescriptor.java:233

com.cloudera.impala.catalog.HdfsPartition.getId
long getId()
Definition: HdfsPartition.java:365

com.cloudera.impala.catalog.HdfsPartition.hasIncrementalStats
boolean hasIncrementalStats()
Definition: HdfsPartition.java:395

com.cloudera.impala.catalog.HdfsPartition.putToParameters
void putToParameters(String k, String v)
Definition: HdfsPartition.java:415

com.cloudera.impala.catalog.HdfsPartition.getSize
long getSize()
Definition: HdfsPartition.java:575

com.cloudera.impala.catalog.HdfsPartition.partitionKeyValues_
final List< LiteralExpr > partitionKeyValues_
Definition: HdfsPartition.java:240

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.toThrift
THdfsFileDesc toThrift()
Definition: HdfsPartition.java:80

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.FileDescriptor
FileDescriptor(THdfsFileDesc fileDesc)
Definition: HdfsPartition.java:95

com.cloudera.impala.catalog.HdfsPartition.getFileDescriptors
List< HdfsPartition.FileDescriptor > getFileDescriptors()
Definition: HdfsPartition.java:429

com.cloudera.impala.catalog.HdfsTable.getLocation
String getLocation()
Definition: HdfsTable.java:451

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.FileDescriptor
FileDescriptor(String fileName, long fileLength, long modificationTime)
Definition: HdfsPartition.java:82

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.getFileCompression
THdfsCompression getFileCompression()
Definition: HdfsPartition.java:70

com.cloudera.impala.catalog.HdfsPartition.getPartitionValuesAsStrings
List< String > getPartitionValuesAsStrings(boolean mapNullsToHiveKey)
Definition: HdfsPartition.java:303

com.cloudera.impala.catalog.HdfsPartition.FileBlock.getOffset
long getOffset()
Definition: HdfsPartition.java:191

com.cloudera.impala.catalog.HdfsPartition.isDirty
boolean isDirty()
Definition: HdfsPartition.java:423

com.cloudera.impala.catalog.HdfsPartition.hmsParameters_
Map< String, String > hmsParameters_
Definition: HdfsPartition.java:268

com.cloudera.impala.catalog.HdfsPartition.FileBlock.setDiskIds
static void setDiskIds(int[] diskIds, THdfsFileBlock fileBlock)
Definition: HdfsPartition.java:204

com.cloudera.impala.catalog.Table.getName
String getName()
Definition: Table.java:342

com.cloudera.impala.analysis.PartitionKeyValue
Definition: PartitionKeyValue.java:24

com.cloudera.impala.catalog.HdfsStorageDescriptor.getFileFormat
HdfsFileFormat getFileFormat()
Definition: HdfsStorageDescriptor.java:235

com.cloudera.impala.catalog.HdfsPartition.FileBlock.toString
String toString()
Definition: HdfsPartition.java:230

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.getModificationTime
long getModificationTime()
Definition: HdfsPartition.java:73

com.cloudera.impala.catalog.HdfsPartition.isMarkedCached_
boolean isMarkedCached_
Definition: HdfsPartition.java:263

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdOutputFormat
final String sdOutputFormat
Definition: HdfsPartition.java:445

com.cloudera.impala.catalog.HdfsPartition
Definition: HdfsPartition.java:60

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdBucketCols
final List< String > sdBucketCols
Definition: HdfsPartition.java:449

com.cloudera.impala.catalog.HdfsPartition.FileBlock.isCached
boolean isCached()
Definition: HdfsPartition.java:194

com.cloudera.impala.catalog.HdfsPartition.FileBlock.getDiskId
int getDiskId(int hostIndex)
Definition: HdfsPartition.java:214

com.cloudera.impala.catalog.HdfsPartition.fileFormatDescriptor_
final HdfsStorageDescriptor fileFormatDescriptor_
Definition: HdfsPartition.java:255

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdNumBuckets
final int sdNumBuckets
Definition: HdfsPartition.java:447

com.cloudera.impala.catalog.HdfsPartition.getParameters
Map< String, String > getParameters()
Definition: HdfsPartition.java:413

com.cloudera.impala.catalog.HdfsPartition.getSerdeInfo
org.apache.hadoop.hive.metastore.api.SerDeInfo getSerdeInfo()
Definition: HdfsPartition.java:378

com.cloudera.impala.catalog.HdfsPartition.FileBlock.toThrift
THdfsFileBlock toThrift()
Definition: HdfsPartition.java:223

com.cloudera.impala.catalog.HdfsPartition.BlockReplica
Definition: HdfsPartition.java:121

com.cloudera.impala.catalog.HdfsPartition.getLocation
String getLocation()
Definition: HdfsPartition.java:364

com.cloudera.impala.catalog.HdfsPartition.numRows_
long numRows_
Definition: HdfsPartition.java:242

com.cloudera.impala.catalog.HdfsPartition.HdfsPartition
HdfsPartition(HdfsTable table, org.apache.hadoop.hive.metastore.api.Partition msPartition, List< LiteralExpr > partitionKeyValues, HdfsStorageDescriptor fileFormatDescriptor, List< HdfsPartition.FileDescriptor > fileDescriptors, TAccessLevel accessLevel)
Definition: HdfsPartition.java:552

com.cloudera.impala.catalog.HdfsPartition.markCached
void markCached()
Definition: HdfsPartition.java:370

com.cloudera.impala.catalog.HdfsPartition.partitionIdCounter_
static AtomicLong partitionIdCounter_
Definition: HdfsPartition.java:243

com.cloudera.impala.catalog.HdfsPartition.FileBlock.fileBlock_
final THdfsFileBlock fileBlock_
Definition: HdfsPartition.java:158

com.cloudera.impala.catalog.HdfsPartition.isDirty_
boolean isDirty_
Definition: HdfsPartition.java:260

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdSortCols
final List< org.apache.hadoop.hive.metastore.api.Order > sdSortCols
Definition: HdfsPartition.java:450

com.cloudera.impala.catalog.HdfsPartition.toHmsPartition
org.apache.hadoop.hive.metastore.api.Partition toHmsPartition()
Definition: HdfsPartition.java:491

com.cloudera.impala.catalog.HdfsPartition.getPartitionName
String getPartitionName()
Definition: HdfsPartition.java:287

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdSerdeInfo
final org.apache.hadoop.hive.metastore.api.SerDeInfo sdSerdeInfo
Definition: HdfsPartition.java:448

com.cloudera.impala.catalog.HdfsPartition.FileBlock.getReplicaHostIdxs
List< Integer > getReplicaHostIdxs()
Definition: HdfsPartition.java:195

com.cloudera.impala.analysis.ToSqlUtils
Definition: ToSqlUtils.java:46

com.cloudera.impala.catalog.HdfsPartition.FileBlock.fromThrift
static FileBlock fromThrift(THdfsFileBlock thriftFileBlock)
Definition: HdfsPartition.java:225

com.cloudera.impala.catalog.HdfsPartition.BlockReplica.BlockReplica
BlockReplica(int hostIdx, boolean isCached)
Definition: HdfsPartition.java:130

com.cloudera.impala.catalog.HdfsPartition.BlockReplica.parseLocation
static TNetworkAddress parseLocation(String location)
Definition: HdfsPartition.java:139

com.cloudera.impala.catalog.HdfsStorageDescriptor.getCollectionDelim
byte getCollectionDelim()
Definition: HdfsStorageDescriptor.java:231

com.cloudera.impala.catalog.HdfsPartition.FileBlock.isCached
boolean isCached(int hostIndex)
Definition: HdfsPartition.java:219

com.cloudera.impala.catalog.HdfsPartition.FileBlock
Definition: HdfsPartition.java:157

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.CachedHmsPartitionDescriptor
CachedHmsPartitionDescriptor(org.apache.hadoop.hive.metastore.api.Partition msPartition)
Definition: HdfsPartition.java:455

com.cloudera.impala.catalog.HdfsPartition.hasFileDescriptors
boolean hasFileDescriptors()
Definition: HdfsPartition.java:433

com.cloudera.impala.catalog.HdfsPartition.HdfsPartition
HdfsPartition(HdfsTable table, org.apache.hadoop.hive.metastore.api.Partition msPartition, List< LiteralExpr > partitionKeyValues, HdfsStorageDescriptor fileFormatDescriptor, List< HdfsPartition.FileDescriptor > fileDescriptors, long id, String location, TAccessLevel accessLevel)
Definition: HdfsPartition.java:514

Comparable

com.cloudera.impala.catalog.HdfsPartition.getPartitionValues
List< LiteralExpr > getPartitionValues()
Definition: HdfsPartition.java:428

com.cloudera.impala.analysis.Expr
Definition: Expr.java:48

com.cloudera.impala.catalog.HdfsPartition.BlockReplica.isCached
boolean isCached()
Definition: HdfsPartition.java:150

com.cloudera.impala.catalog.HdfsPartition.isMarkedCached
boolean isMarkedCached()
Definition: HdfsPartition.java:369

com.cloudera.impala.catalog.HdfsPartition.getNumRows
long getNumRows()
Definition: HdfsPartition.java:368

com.cloudera.impala.catalog.HdfsPartition.FileBlock.FileBlock
FileBlock(THdfsFileBlock fileBlock)
Definition: HdfsPartition.java:161

com.cloudera.impala.catalog.HdfsPartition.toThrift
THdfsPartition toThrift(boolean includeFileDesc)
Definition: HdfsPartition.java:668

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.msCreateTime
final int msCreateTime
Definition: HdfsPartition.java:452

com.cloudera.impala.catalog.HdfsPartition.getInputFormatDescriptor
HdfsStorageDescriptor getInputFormatDescriptor()
Definition: HdfsPartition.java:270

com.cloudera.impala.catalog.HdfsPartition.accessLevel_
final TAccessLevel accessLevel_
Definition: HdfsPartition.java:264

com.cloudera.impala.catalog.HdfsPartition.comparePartitionKeyValues
static int comparePartitionKeyValues(List< LiteralExpr > lhs, List< LiteralExpr > rhs)
Definition: HdfsPartition.java:704

com.cloudera.impala.analysis.LiteralExpr
Definition: LiteralExpr.java:35

com.cloudera.impala.catalog.HdfsTable
Definition: HdfsTable.java:104

com.cloudera.impala.catalog.HdfsPartition.defaultPartition
static HdfsPartition defaultPartition(HdfsTable table, HdfsStorageDescriptor storageDescriptor)
Definition: HdfsPartition.java:562

com.cloudera.impala.analysis.NullLiteral
Definition: NullLiteral.java:23

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdCompressed
final boolean sdCompressed
Definition: HdfsPartition.java:446

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.toString
String toString()
Definition: HdfsPartition.java:111

com.cloudera.impala.catalog.HdfsPartition.markDirty
void markDirty()
Definition: HdfsPartition.java:422

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.addFileBlock
void addFileBlock(FileBlock blockMd)
Definition: HdfsPartition.java:102

com.cloudera.impala.catalog.CatalogException
Definition: CatalogException.java:22

com.cloudera.impala.catalog.HdfsPartition.FileBlock.isCached_
boolean isCached_
Definition: HdfsPartition.java:159

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.msLastAccessTime
final int msLastAccessTime
Definition: HdfsPartition.java:453

com.cloudera.impala.catalog.HdfsPartition.getTable
HdfsTable getTable()
Definition: HdfsPartition.java:366

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.fileDescriptor_
final THdfsFileDesc fileDescriptor_
Definition: HdfsPartition.java:66

com.cloudera.impala.catalog.HdfsPartition.id_
final long id_
Definition: HdfsPartition.java:247

com.cloudera.impala.catalog.HdfsPartition.getValuesAsString
String getValuesAsString()
Definition: HdfsPartition.java:347

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor.sdParameters
final Map< String, String > sdParameters
Definition: HdfsPartition.java:451

com.cloudera.impala.util.HdfsCachingUtil
Definition: HdfsCachingUtil.java:42

offset
uint8_t offset[7 *64-sizeof(uint64_t)]
Definition: partitioning-throughput-test.cc:37

com.cloudera.impala.catalog.HdfsPartition.FileBlock.FileBlock
FileBlock(long offset, long blockLength, List< BlockReplica > replicaHostIdxs)
Definition: HdfsPartition.java:174

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.getFileName
String getFileName()
Definition: HdfsPartition.java:68

com.cloudera.impala.catalog.HdfsFileFormat
Definition: HdfsFileFormat.java:26

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.getFileBlocks
List< THdfsFileBlock > getFileBlocks()
Definition: HdfsPartition.java:76

com.cloudera.impala.catalog.HdfsPartition.setFileFormat
void setFileFormat(HdfsFileFormat fileFormat)
Definition: HdfsPartition.java:372

com.cloudera.impala.catalog.HdfsPartition.BlockReplica.getHostIdx
int getHostIdx()
Definition: HdfsPartition.java:151

com.cloudera.impala.catalog.HdfsPartition.isDefaultPartition
boolean isDefaultPartition()
Definition: HdfsPartition.java:274

com.cloudera.impala.catalog.HdfsPartition.cachedMsPartitionDescriptor_
final CachedHmsPartitionDescriptor cachedMsPartitionDescriptor_
Definition: HdfsPartition.java:485

com.cloudera.impala.catalog.HdfsPartition.setNumRows
void setNumRows(long numRows)
Definition: HdfsPartition.java:367

com.cloudera.impala.catalog.HdfsPartition.fileDescriptors_
final List< FileDescriptor > fileDescriptors_
Definition: HdfsPartition.java:257

com.cloudera.impala.catalog.HdfsPartition.CachedHmsPartitionDescriptor
Definition: HdfsPartition.java:444

com.cloudera.impala.catalog.HdfsPartition.fromThrift
static HdfsPartition fromThrift(HdfsTable table, long id, THdfsPartition thriftPartition)
Definition: HdfsPartition.java:590

com.cloudera.impala.catalog.HdfsPartition.getParameter
String getParameter(String key)
Definition: HdfsPartition.java:409

com.cloudera.impala.catalog.HdfsPartition.location_
String location_
Definition: HdfsPartition.java:258

com.cloudera.impala.catalog.HdfsPartition.LOG
static final Logger LOG
Definition: HdfsPartition.java:259

com.cloudera.impala.catalog.HdfsPartition.FileBlock.getLength
long getLength()
Definition: HdfsPartition.java:192

com.cloudera.impala.catalog.HdfsPartition.BlockReplica.isCached_
final boolean isCached_
Definition: HdfsPartition.java:122

com.cloudera.impala.catalog.HdfsPartition.getConjunctSql
String getConjunctSql()
Definition: HdfsPartition.java:322

com.cloudera.impala.catalog.HdfsPartition.compareTo
int compareTo(HdfsPartition o)
Definition: HdfsPartition.java:699

com.cloudera.impala.common.ImpalaException
Definition: ImpalaException.java:22

com.cloudera.impala.catalog.HdfsPartition.setLocation
void setLocation(String location)
Definition: HdfsPartition.java:376

com.cloudera.impala.catalog.HdfsPartition.checkWellFormed
void checkWellFormed()
Definition: HdfsPartition.java:658

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.getFileLength
long getFileLength()
Definition: HdfsPartition.java:69

com.cloudera.impala.catalog.HdfsPartition.getAccessLevel
TAccessLevel getAccessLevel()
Definition: HdfsPartition.java:404

com.cloudera.impala.catalog.HdfsPartition.table_
final HdfsTable table_
Definition: HdfsPartition.java:239

com.cloudera.impala.catalog.HdfsPartition.FileDescriptor.fromThrift
static FileDescriptor fromThrift(THdfsFileDesc desc)
Definition: HdfsPartition.java:106