doc/html/resource-broker_8cc_source.html

 // Copyright 2012 Cloudera Inc.

 //

 // Licensed under the Apache License, Version 2.0 (the "License");

 // you may not use this file except in compliance with the License.

 // You may obtain a copy of the License at

 //

 // http://www.apache.org/licenses/LICENSE-2.0

 //

 // Unless required by applicable law or agreed to in writing, software

 // distributed under the License is distributed on an "AS IS" BASIS,

 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

 // See the License for the specific language governing permissions and

 // limitations under the License.


 #include "resourcebroker/resource-broker.h"


 #include <boost/algorithm/string/join.hpp>

 #include <boost/foreach.hpp>

 #include <boost/uuid/uuid.hpp>

 #include <boost/uuid/uuid_generators.hpp>

 #include <boost/uuid/uuid_io.hpp>

 #include <boost/lexical_cast.hpp>

 #include <gutil/strings/substitute.h>

 #include <thrift/Thrift.h>


 #include "common/status.h"

 #include "rpc/thrift-util.h"

 #include "rpc/thrift-server.h"

 #include "statestore/query-resource-mgr.h"

 #include "statestore/scheduler.h"

 #include "util/debug-util.h"

 #include "util/stopwatch.h"

 #include "util/uid-util.h"

 #include "util/network-util.h"

 #include "util/llama-util.h"

 #include "util/time.h"

 #include "gen-cpp/ResourceBrokerService.h"

 #include "gen-cpp/Llama_types.h"


 #include "common/names.h"


 using boost::algorithm::join;

 using boost::algorithm::to_lower;

 using boost::uuids::random_generator;

 using namespace ::apache::thrift::server;

 using namespace ::apache::thrift;

 using namespace impala;

 using namespace strings;


 DECLARE_int64(llama_registration_timeout_secs);

 DECLARE_int64(llama_registration_wait_secs);

 DECLARE_int64(llama_max_request_attempts);


 DECLARE_int32(resource_broker_cnxn_attempts);

 DECLARE_int32(resource_broker_cnxn_retry_interval_ms);

 DECLARE_int32(resource_broker_send_timeout);

 DECLARE_int32(resource_broker_recv_timeout);


 static const string LLAMA_KERBEROS_SERVICE_NAME = "llama";


 namespace impala {


 // String to search for in Llama error messages to detect that Llama has restarted,

 // and hence the resource broker must re-register.

 const string LLAMA_RESTART_SEARCH_STRING = "unknown handle";


 class LlamaNotificationThriftIf : public llama::LlamaNotificationServiceIf {

  public:

   LlamaNotificationThriftIf(ResourceBroker* resource_broker)

     : resource_broker_(resource_broker) {}


   virtual void AMNotification(llama::TLlamaAMNotificationResponse& response,

       const llama::TLlamaAMNotificationRequest& request) {

     resource_broker_->AMNotification(request, response);

   }


   virtual void NMNotification(llama::TLlamaNMNotificationResponse& response,

       const llama::TLlamaNMNotificationRequest& request) {

     LOG(WARNING) << "Ignoring node-manager notification. Handling not yet implemented.";

     response.status.__set_status_code(llama::TStatusCode::OK);

   }


   virtual ~LlamaNotificationThriftIf() {}


  private:

   ResourceBroker* resource_broker_;

 };


 ResourceBroker::ResourceBroker(const vector<TNetworkAddress>& llama_addresses,

     const TNetworkAddress& llama_callback_address, MetricGroup* metrics) :

     llama_addresses_(llama_addresses),

     active_llama_addr_idx_(-1),

     llama_callback_address_(llama_callback_address),

     metrics_(metrics),

     scheduler_(NULL),

     llama_callback_thrift_iface_(new LlamaNotificationThriftIf(this)),

     llama_client_cache_(new ClientCache<llama::LlamaAMServiceClient>(

         FLAGS_resource_broker_cnxn_attempts,

         FLAGS_resource_broker_cnxn_retry_interval_ms,

         FLAGS_resource_broker_send_timeout,

         FLAGS_resource_broker_recv_timeout,

         LLAMA_KERBEROS_SERVICE_NAME)) {

   DCHECK(metrics != NULL);

   active_llama_metric_ = metrics->AddProperty<string>(

       "resource-broker.active-llama", "none");

   active_llama_handle_metric_ = metrics->AddProperty<string>(

       "resource-broker.active-llama-handle", "none");


   reservation_rpc_time_metric_ = metrics->RegisterMetric(

       new StatsMetric<double>("resource-broker.reservation-request-rpc-time",

           TUnit::TIME_S, "The time, in seconds, that a Reserve() RPC takes to "

           "Llama"));

   reservation_response_time_metric_ = metrics->RegisterMetric(

       new StatsMetric<double>("resource-broker.reservation-request-response-time",

           TUnit::TIME_S, "The time, in seconds, that a reservation request takes "

           "to be fulfilled by Llama"));

   reservation_requests_total_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.reservation-requests-total", 0, TUnit::UNIT,

       "The total number of reservation requests made by this Impala daemon to Llama");

   reservation_requests_fulfilled_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.reservation-requests-fulfilled", 0, TUnit::UNIT,

       "The number of reservation requests made by this Impala daemon to Llama "

       "which succeeded");

   reservation_requests_failed_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.reservation-requests-failed", 0, TUnit::UNIT,

       "The number of reservation requests made by this Impala daemon to Llama which "

       "failed");

   reservation_requests_rejected_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.reservation-requests-rejected", 0, TUnit::UNIT,

       "The number of reservation requests made by this Impala daemon to Llama "

       "which were rejected");

   reservation_requests_timedout_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.reservation-requests-timedout", 0, TUnit::UNIT,

       "The number of reservation requests made by this Impala daemon to Llama "

       "which timed out");


   expansion_rpc_time_metric_ = metrics->RegisterMetric(

       new StatsMetric<double>("resource-broker.expansion-request-rpc-time",

           TUnit::TIME_S,

           "The time, in seconds, that a Reserve() RPC takes to Llama"));

   expansion_response_time_metric_ = metrics->RegisterMetric(

       new StatsMetric<double>("resource-broker.expansion-request-response-time",

           TUnit::TIME_S, "The time, in seconds, that a expansion request takes "

           "to be fulfilled by Llama"));

   expansion_requests_total_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.expansion-requests-total", 0, TUnit::UNIT,

       "The total number of expansion requests made by this Impala daemon to Llama");

   expansion_requests_fulfilled_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.expansion-requests-fulfilled", 0, TUnit::UNIT,

       "The number of expansion requests made by this Impala daemon to Llama "

       "which succeeded");

   expansion_requests_failed_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.expansion-requests-failed", 0, TUnit::UNIT,

       "The number of expansion requests made by this Impala daemon to Llama which "

       "failed");

   expansion_requests_rejected_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.expansion-requests-rejected", 0, TUnit::UNIT,

       "The number of expansion requests made by this Impala daemon to Llama "

       "which were rejected");

   expansion_requests_timedout_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.expansion-requests-timedout", 0, TUnit::UNIT,

       "The number of expansion requests made by this Impala daemon to Llama "

       "which timed out");


   requests_released_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.requests-released", 0, TUnit::UNIT,

       "The number of resource-release requests received from Llama");


   allocated_memory_metric_ = metrics->AddGauge<uint64_t>(

       "resource-broker.memory-resources-in-use", 0L, TUnit::BYTES, "The total"

       " number of bytes currently allocated to this Impala daemon by Llama");


   allocated_vcpus_metric_ = metrics->AddGauge<uint64_t>(

       "resource-broker.vcpu-resources-in-use", 0, TUnit::UNIT, "The total number "

       "of vcpus currently allocated to this Impala daemon by Llama");


   requests_released_metric_ = metrics->AddCounter<int64_t>(

       "resource-broker.requests-released", 0, TUnit::UNIT, "The total number of "

       "resource allocations released by this Impala daemon");

 }


 Status ResourceBroker::Init() {

   // The scheduler must have been set before calling Init().

   DCHECK(scheduler_ != NULL);

   DCHECK(llama_callback_thrift_iface_ != NULL);

   if (llama_addresses_.size() == 0) {

     return Status("No Llama addresses configured (see --llama_addresses)");

   }


   shared_ptr<TProcessor> llama_callback_proc(

       new llama::LlamaNotificationServiceProcessor(llama_callback_thrift_iface_));

   llama_callback_server_.reset(new ThriftServer("llama-callback", llama_callback_proc,

       llama_callback_address_.port, NULL, metrics_, 5));

   RETURN_IF_ERROR(llama_callback_server_->Start());


   // Generate client id for registration with Llama, and register with LLama.

   random_generator uuid_generator;

   llama_client_id_ = uuid_generator();

   RETURN_IF_ERROR(RegisterWithLlama());

   RETURN_IF_ERROR(RefreshLlamaNodes());

   return Status::OK;

 }


 Status ResourceBroker::RegisterWithLlama() {

   // Remember the current llama_handle_ to detect if another thread has already

   // completed the registration successfully.

   llama::TUniqueId current_llama_handle = llama_handle_;


   // Start time that this thread attempted registration. Used to limit the time that a

   // query will wait for re-registration with the Llama to succeed.

   int64_t start = MonotonicSeconds();

   lock_guard<mutex> l(llama_registration_lock_);

   if (llama_handle_ != current_llama_handle) return Status::OK;


   active_llama_metric_->set_value("none");

   active_llama_handle_metric_->set_value("none");


   int llama_addr_idx = (active_llama_addr_idx_ + 1) % llama_addresses_.size();

   int64_t now = MonotonicSeconds();

   while (FLAGS_llama_registration_timeout_secs == -1 ||

       (now - start) < FLAGS_llama_registration_timeout_secs) {

     // Connect to the Llama at llama_address.

     const TNetworkAddress& llama_address = llama_addresses_[llama_addr_idx];

     // Client status will be ok if a Thrift connection could be successfully established

     // for the returned client at some point in the past. Hence, there is no guarantee

     // that the connection is still valid now and we must check for broken pipes, etc.

     Status client_status;

     ClientConnection<llama::LlamaAMServiceClient> llama_client(llama_client_cache_.get(),

         llama_address, &client_status);

     if (client_status.ok()) {

       // Register this resource broker with Llama.

       llama::TLlamaAMRegisterRequest request;

       request.__set_version(llama::TLlamaServiceVersion::V1);

       llama::TUniqueId llama_uuid;

       UUIDToTUniqueId(llama_client_id_, &llama_uuid);

       request.__set_client_id(llama_uuid);


       llama::TNetworkAddress callback_address;

       callback_address << llama_callback_address_;

       request.__set_notification_callback_service(callback_address);

       llama::TLlamaAMRegisterResponse response;

       LOG(INFO) << "Registering Resource Broker with Llama at " << llama_address;

       Status rpc_status =

           llama_client.DoRpc(&llama::LlamaAMServiceClient::Register, request, &response);

       if (rpc_status.ok()) {

         // TODO: Is there a period where an inactive Llama may respond to RPCs?

         // If so, then we need to keep cycling through Llamas here and not

         // return an error.

         RETURN_IF_ERROR(LlamaStatusToImpalaStatus(

             response.status, "Failed to register Resource Broker with Llama."));

         LOG(INFO) << "Received Llama client handle " << response.am_handle

                   << ((response.am_handle == llama_handle_) ? " (same as old)" : "");

         llama_handle_ = response.am_handle;

         break;

       }

     }

     // Cycle through the list of Llama addresses for Llama failover.

     llama_addr_idx = (llama_addr_idx + 1) % llama_addresses_.size();

     LOG(INFO) << "Failed to connect to Llama at " << llama_address << "." << endl

               << "Error: " << client_status.GetDetail() << endl

               << "Retrying to connect to Llama at "

               << llama_addresses_[llama_addr_idx] << " in "

               << FLAGS_llama_registration_wait_secs << "s.";

     // Sleep to give Llama time to recover/failover before the next attempt.

     SleepForMs(FLAGS_llama_registration_wait_secs * 1000);

     now = MonotonicSeconds();

   }

   DCHECK(FLAGS_llama_registration_timeout_secs != -1);

   if ((now - start) >= FLAGS_llama_registration_timeout_secs) {

     return Status("Failed to (re-)register Resource Broker with Llama.");

   }


   if (llama_addr_idx != active_llama_addr_idx_) {

     // TODO: We've switched to a different Llama (failover). Cancel all queries

     // coordinated by this Impalad to free up physical resources that are not

     // accounted for anymore by Yarn.

   }


   // If we reached this point, (re-)registration was successful.

   active_llama_addr_idx_ = llama_addr_idx;

   active_llama_metric_->set_value(lexical_cast<string>(llama_addresses_[llama_addr_idx]));

   active_llama_handle_metric_->set_value(lexical_cast<string>(llama_handle_));

   return Status::OK;

 }


 bool ResourceBroker::LlamaHasRestarted(const llama::TStatus& status) const {

   if (status.status_code == llama::TStatusCode::OK || !status.__isset.error_msgs) {

     return false;

   }

   // Check whether one of the error messages contains LLAMA_RESTART_SEARCH_STRING.

   for (int i = 0; i < status.error_msgs.size(); ++i) {

     string error_msg = status.error_msgs[i];

     to_lower(error_msg);

     if (error_msg.find(LLAMA_RESTART_SEARCH_STRING) != string::npos) {

       LOG(INFO) << "Assuming Llama restart from error message: " << status.error_msgs[i];

       return true;

     }

   }

   return false;

 }


 void ResourceBroker::Close() {

   // Close connections to all Llama addresses, not just the active one.

   BOOST_FOREACH(const TNetworkAddress& llama_address, llama_addresses_) {

     llama_client_cache_->CloseConnections(llama_address);

   }

   llama_callback_server_->Join();

 }


 void ResourceBroker::CreateLlamaReservationRequest(

     const TResourceBrokerReservationRequest& src,

     llama::TLlamaAMReservationRequest& dest) {

   dest.version = llama::TLlamaServiceVersion::V1;

   dest.am_handle = llama_handle_;

   dest.gang = src.gang;

   // Queue is optional, so must be explicitly set for all versions of Thrift to work

   // together.

   dest.__set_queue(src.queue);

   dest.user = src.user;

   dest.resources = src.resources;

   random_generator uuid_generator;

   llama::TUniqueId request_id;

   UUIDToTUniqueId(uuid_generator(), &request_id);

   dest.__set_reservation_id(request_id);

 }


 // Creates a Llama release request from a resource broker release request.

 void ResourceBroker::CreateLlamaReleaseRequest(const TResourceBrokerReleaseRequest& src,

     llama::TLlamaAMReleaseRequest& dest) {

   dest.version = llama::TLlamaServiceVersion::V1;

   dest.am_handle = llama_handle_;

   dest.reservation_id << src.reservation_id;

 }


 template <typename LlamaReqType, typename LlamaRespType>

 Status ResourceBroker::LlamaRpc(LlamaReqType* request, LlamaRespType* response,

     StatsMetric<double>* rpc_time_metric) {

   int attempts = 0;

   MonotonicStopWatch sw;

   // Indicates whether to re-register with Llama before the next RPC attempt,

   // e.g. because Llama has restarted or become unavailable.

   bool register_with_llama = false;

   while (attempts < FLAGS_llama_max_request_attempts) {

     if (register_with_llama) {

       RETURN_IF_ERROR(ReRegisterWithLlama(*request, response));

       // Set the new Llama handle received from re-registering.

       request->__set_am_handle(llama_handle_);

       VLOG_RPC << "Retrying Llama RPC after re-registration: " << *request;

       register_with_llama = false;

     }

     ++attempts;

     Status rpc_status;

     ClientConnection<llama::LlamaAMServiceClient> llama_client(llama_client_cache_.get(),

         llama_addresses_[active_llama_addr_idx_], &rpc_status);

     if (!rpc_status.ok()) {

       register_with_llama = true;

       continue;

     }


     sw.Start();

     try {

       SendLlamaRpc(&llama_client, *request, response);

     } catch (const TException& e) {

       VLOG_RPC << "Reopening Llama client due to: " << e.what();

       rpc_status = llama_client.Reopen();

       if (!rpc_status.ok()) {

         register_with_llama = true;

         continue;

       }

       VLOG_RPC << "Retrying Llama RPC: " << *request;

       SendLlamaRpc(&llama_client, *request, response);

     }

     if (rpc_time_metric != NULL) {

       rpc_time_metric->Update(sw.ElapsedTime() / (1000.0 * 1000.0 * 1000.0));

     }


     // Check whether Llama has been restarted. If so, re-register with it.

     // Break out of the loop here upon success of the RPC.

     if (!LlamaHasRestarted(response->status)) break;

     register_with_llama = true;

   }

   if (attempts >= FLAGS_llama_max_request_attempts) {

     return Status(Substitute(

         "Request aborted after $0 attempts due to connectivity issues with Llama.",

         FLAGS_llama_max_request_attempts));

   }

   return Status::OK;

 }


 template <typename LlamaReqType, typename LlamaRespType>

 void ResourceBroker::SendLlamaRpc(

     ClientConnection<llama::LlamaAMServiceClient>* llama_client,

     const LlamaReqType& request, LlamaRespType* response) {

   DCHECK(false) << "SendLlamaRpc template function must be specialized.";

 }


 // Template specialization for the Llama GetNodes() RPC.

 template <>

 void ResourceBroker::SendLlamaRpc(

     ClientConnection<llama::LlamaAMServiceClient>* llama_client,

     const llama::TLlamaAMGetNodesRequest& request,

     llama::TLlamaAMGetNodesResponse* response) {

   DCHECK(response != NULL);

   (*llama_client)->GetNodes(*response, request);

 }


 // Template specialization for the Llama Reserve() RPC.

 template <>

 void ResourceBroker::SendLlamaRpc(

     ClientConnection<llama::LlamaAMServiceClient>* llama_client,

     const llama::TLlamaAMReservationRequest& request,

     llama::TLlamaAMReservationResponse* response) {

   DCHECK(response != NULL);

   (*llama_client)->Reserve(*response, request);

 }


 // Template specialization for the Llama Expand() RPC.

 template <>

 void ResourceBroker::SendLlamaRpc(

     ClientConnection<llama::LlamaAMServiceClient>* llama_client,

     const llama::TLlamaAMReservationExpansionRequest& request,

     llama::TLlamaAMReservationExpansionResponse* response) {

   DCHECK(response != NULL);

   (*llama_client)->Expand(*response, request);

 }


 // Template specialization for the Llama Release() RPC.

 template <>

 void ResourceBroker::SendLlamaRpc(

     ClientConnection<llama::LlamaAMServiceClient>* llama_client,

     const llama::TLlamaAMReleaseRequest& request,

     llama::TLlamaAMReleaseResponse* response) {

   DCHECK(response != NULL);

   (*llama_client)->Release(*response, request);

 }


 template <typename LlamaReqType, typename LlamaRespType>

 Status ResourceBroker::ReRegisterWithLlama(const LlamaReqType& request,

     LlamaRespType* response) {

   RETURN_IF_ERROR(RegisterWithLlama());

   return RefreshLlamaNodes();

 }


 template <>

 Status ResourceBroker::ReRegisterWithLlama(const llama::TLlamaAMGetNodesRequest& request,

     llama::TLlamaAMGetNodesResponse* response) {

   return RegisterWithLlama();

 }


 void ResourceBroker::PendingRequest::GetResources(ResourceMap* resources) {

   resources->clear();

   BOOST_FOREACH(const llama::TAllocatedResource& resource, allocated_resources_) {

     TNetworkAddress host = MakeNetworkAddress(resource.location);

     (*resources)[host] = resource;

     VLOG_QUERY << "Getting allocated resource for reservation id "

                << reservation_id_ << " and location " << host;

   }

 }


 void ResourceBroker::PendingRequest::SetResources(

     const vector<llama::TAllocatedResource>& resources) {

   // TODO: Llama returns a dump of all resources that we need to manually group by

   // reservation id. Can Llama do the grouping for us?

   BOOST_FOREACH(const llama::TAllocatedResource& resource, resources) {

     // Ignore resources that don't belong to the given reservation id.

     if (resource.reservation_id == request_id()) {

       allocated_resources_.push_back(resource);

     }

   }

 }


 bool ResourceBroker::WaitForNotification(int64_t timeout, ResourceMap* resources,

     bool* timed_out, PendingRequest* pending_request) {

   bool request_granted = pending_request->promise()->Get(timeout, timed_out);


   // Remove the promise from the pending-requests map.

   {

     lock_guard<mutex> l(pending_requests_lock_);

     pending_requests_.erase(pending_request->request_id());

   }


   if (request_granted && !*timed_out) {

     pending_request->GetResources(resources);

     int64_t total_memory_mb = 0L;

     int32_t total_vcpus = 0;

     BOOST_FOREACH(const ResourceMap::value_type& resource, *resources) {

       total_memory_mb += resource.second.memory_mb;

       total_vcpus += resource.second.v_cpu_cores;

     }

     allocated_memory_metric_->Increment(total_memory_mb * 1024L * 1024L);

     allocated_vcpus_metric_->Increment(total_vcpus);

     {

       lock_guard<mutex> l(allocated_requests_lock_);

       allocated_requests_[pending_request->reservation_id()].push_back(AllocatedRequest(

           pending_request->reservation_id(), total_memory_mb, total_vcpus,

           pending_request->is_expansion()));

     }

   }


   return request_granted;

 }


 Status ResourceBroker::Expand(const TResourceBrokerExpansionRequest& request,

     TResourceBrokerExpansionResponse* response) {

   VLOG_RPC << "Sending expansion request: " << request;

   llama::TLlamaAMReservationExpansionRequest ll_request;

   llama::TLlamaAMReservationExpansionResponse ll_response;


   ll_request.version = llama::TLlamaServiceVersion::V1;

   ll_request.am_handle = llama_handle_;

   ll_request.expansion_of << request.reservation_id;

   random_generator uuid_generator;

   llama::TUniqueId request_id;

   UUIDToTUniqueId(uuid_generator(), &request_id);

   ll_request.__set_expansion_id(request_id);

   ll_request.resource = request.resource;


   PendingRequest* pending_request;

   {

     lock_guard<mutex> l(pending_requests_lock_);

     pending_request =

         new PendingRequest(ll_request.expansion_of, ll_request.expansion_id, true);

     pending_requests_.insert(make_pair(pending_request->request_id(), pending_request));

   }


   MonotonicStopWatch sw;

   sw.Start();

   Status status = LlamaRpc(&ll_request, &ll_response, expansion_rpc_time_metric_);

   // Check the status of the response.

   if (!status.ok()) {

     expansion_requests_failed_metric_->Increment(1);

     return status;

   }


   Status request_status = LlamaStatusToImpalaStatus(ll_response.status);

   if (!request_status.ok()) {

     expansion_requests_failed_metric_->Increment(1);

     return request_status;

   }


   bool timed_out = false;

   bool request_granted = WaitForNotification(request.request_timeout,

       &response->allocated_resources, &timed_out, pending_request);


   if (request_granted) {

     // Only set the reservation ID for successful requests

     response->__set_reservation_id(request.reservation_id);

   }


   if (timed_out) {

     expansion_requests_timedout_metric_->Increment(1);

     return Status(Substitute("Resource expansion request exceeded timeout of $0",

         PrettyPrinter::Print(request.request_timeout * 1000L * 1000L,

         TUnit::TIME_NS)));

   }

   expansion_response_time_metric_->Update(

       sw.ElapsedTime() / (1000.0 * 1000.0 * 1000.0));


   if (!request_granted) {

     expansion_requests_rejected_metric_->Increment(1);

     return Status("Resource expansion request was rejected.");

   }


   VLOG_QUERY << "Fulfilled expansion for id: " << ll_response.expansion_id;

   expansion_requests_fulfilled_metric_->Increment(1);

   return Status::OK;

 }


 Status ResourceBroker::Reserve(const TResourceBrokerReservationRequest& request,

     TResourceBrokerReservationResponse* response) {

   VLOG_QUERY << "Sending reservation request: " << request;

   reservation_requests_total_metric_->Increment(1);


   llama::TLlamaAMReservationRequest ll_request;

   llama::TLlamaAMReservationResponse ll_response;

   CreateLlamaReservationRequest(request, ll_request);


   PendingRequest* pending_request;

   {

     lock_guard<mutex> l(pending_requests_lock_);

     pending_request = new PendingRequest(ll_request.reservation_id,

         ll_request.reservation_id, false);

     pending_requests_.insert(make_pair(pending_request->request_id(), pending_request));

   }


   MonotonicStopWatch sw;

   sw.Start();

   Status status = LlamaRpc(&ll_request, &ll_response, reservation_rpc_time_metric_);

   // Check the status of the response.

   if (!status.ok()) {

     reservation_requests_failed_metric_->Increment(1);

     return status;

   }

   Status request_status = LlamaStatusToImpalaStatus(ll_response.status);

   if (!request_status.ok()) {

     reservation_requests_failed_metric_->Increment(1);

     return request_status;

   }


   VLOG_RPC << "Received reservation response from Llama, waiting for notification on: "

            << pending_request->request_id();


   bool timed_out = false;

   bool request_granted = WaitForNotification(request.request_timeout,

       &response->allocated_resources, &timed_out, pending_request);


   if (request_granted || timed_out) {

     // Set the reservation_id to make sure it eventually gets released - even if when

     // timed out, since the response may arrive later.

     response->__set_reservation_id(

         CastTUniqueId<llama::TUniqueId, TUniqueId>(pending_request->reservation_id()));

   }


   if (timed_out) {

     reservation_requests_timedout_metric_->Increment(1);

     return Status(Substitute("Resource expansion request exceeded timeout of $0",

         PrettyPrinter::Print(request.request_timeout * 1000L * 1000L,

         TUnit::TIME_NS)));

   }

   reservation_response_time_metric_->Update(

       sw.ElapsedTime() / (1000.0 * 1000.0 * 1000.0));


   if (!request_granted) {

     reservation_requests_rejected_metric_->Increment(1);

     return Status("Resource reservation request was rejected.");

   }


   TUniqueId reservation_id;

   reservation_id << pending_request->reservation_id();

   response->__set_reservation_id(reservation_id);

   VLOG_QUERY << "Fulfilled reservation with id: " << pending_request->reservation_id();

   reservation_requests_fulfilled_metric_->Increment(1);

   return Status::OK;

 }


 void ResourceBroker::ClearRequests(const TUniqueId& reservation_id,

     bool include_reservation) {

   int64_t total_memory_bytes = 0L;

   int32_t total_vcpus = 0L;

   llama::TUniqueId llama_id = CastTUniqueId<TUniqueId, llama::TUniqueId>(reservation_id);

   {

     lock_guard<mutex> l(allocated_requests_lock_);

     AllocatedRequestMap::iterator it = allocated_requests_.find(llama_id);

     if (it == allocated_requests_.end()) return;

     vector<AllocatedRequest>::iterator request_it = it->second.begin();

     while (request_it != it->second.end()) {

       DCHECK(request_it->reservation_id() == llama_id);

       if (!request_it->is_expansion() && !include_reservation) {

         // Leave the original reservation

         ++request_it;

         continue;

       }

       total_memory_bytes += (request_it->memory_mb() * 1024L * 1024L);

       total_vcpus += request_it->vcpus();

       request_it = it->second.erase(request_it);

     }

   }


   VLOG_QUERY << "Releasing "

              << PrettyPrinter::Print(total_memory_bytes, TUnit::BYTES)

              << " and " << total_vcpus << " cores for " << llama_id;

   allocated_memory_metric_->Increment(-total_memory_bytes);

   allocated_vcpus_metric_->Increment(-total_vcpus);

 }


 Status ResourceBroker::Release(const TResourceBrokerReleaseRequest& request,

     TResourceBrokerReleaseResponse* response) {

   VLOG_QUERY << "Releasing all resources for reservation: " << request.reservation_id;


   ClearRequests(request.reservation_id, true);


   llama::TLlamaAMReleaseRequest llama_request;

   llama::TLlamaAMReleaseResponse llama_response;

   CreateLlamaReleaseRequest(request, llama_request);


   RETURN_IF_ERROR(LlamaRpc(

           &llama_request, &llama_response,reservation_rpc_time_metric_));

   RETURN_IF_ERROR(LlamaStatusToImpalaStatus(llama_response.status));

   requests_released_metric_->Increment(1);


   {

     lock_guard<mutex> l(allocated_requests_lock_);

     llama::TUniqueId reservation_id =

         CastTUniqueId<TUniqueId, llama::TUniqueId>(request.reservation_id);;

     allocated_requests_.erase(reservation_id);

   }


   return Status::OK;

 }


 void ResourceBroker::AMNotification(const llama::TLlamaAMNotificationRequest& request,

     llama::TLlamaAMNotificationResponse& response) {

   {

     // This Impalad may have restarted, so it is possible Llama is sending notifications

     // while this Impalad is registering with Llama.

     lock_guard<mutex> l(llama_registration_lock_);

     if (request.am_handle != llama_handle_) {

       VLOG_QUERY << "Ignoring Llama AM notification with mismatched AM handle. "

                  << "Known handle: " << llama_handle_ << ". Received handle: "

                  << request.am_handle;

       // Ignore all notifications with mismatched handles.

       return;

     }

   }

   // Nothing to be done for heartbeats.

   if (request.heartbeat) return;

   VLOG_QUERY << "Received non-heartbeat AM notification";


   lock_guard<mutex> l(pending_requests_lock_);


   // Process granted allocations.

   BOOST_FOREACH(const llama::TUniqueId& res_id, request.allocated_reservation_ids) {

     // TODO: Garbage collect fulfillments that live for a long time, since they probably

     // don't correspond to any query.

     PendingRequestMap::iterator it = pending_requests_.find(res_id);

     if (it == pending_requests_.end()) {

       VLOG_RPC << "Allocation for " << res_id << " arrived after timeout";

       // TODO: Release these allocations

       continue;

     }

     LOG(INFO) << "Received allocated resource for reservation id: " << res_id;

     it->second->SetResources(request.allocated_resources);

     it->second->promise()->Set(true);

   }


   // Process rejected allocations.

   BOOST_FOREACH(const llama::TUniqueId& res_id, request.rejected_reservation_ids) {

     PendingRequestMap::iterator it = pending_requests_.find(res_id);

     if (it == pending_requests_.end()) {

       VLOG_RPC << "Rejection for " << res_id << " arrived after timeout";

       continue;

     }

     it->second->promise()->Set(false);

   }


   // TODO: We maybe want a thread pool for handling preemptions to avoid

   // blocking this function on query cancellations.

   // Process preempted reservations.

   BOOST_FOREACH(const llama::TUniqueId& res_id, request.preempted_reservation_ids) {

     TUniqueId impala_res_id;

     impala_res_id << res_id;

     scheduler_->HandlePreemptedReservation(impala_res_id);

   }


   // Process preempted client resources.

   BOOST_FOREACH(const llama::TUniqueId& res_id, request.preempted_client_resource_ids) {

     TUniqueId impala_res_id;

     impala_res_id << res_id;

     scheduler_->HandlePreemptedResource(impala_res_id);

   }


   // Process lost client resources.

   BOOST_FOREACH(const llama::TUniqueId& res_id, request.lost_client_resource_ids) {

     TUniqueId impala_res_id;

     impala_res_id << res_id;

     scheduler_->HandlePreemptedResource(impala_res_id);

   }


   response.status.__set_status_code(llama::TStatusCode::OK);

 }


 void ResourceBroker::NMNotification(const llama::TLlamaNMNotificationRequest& request,

     llama::TLlamaNMNotificationResponse& response) {

 }


 Status ResourceBroker::RefreshLlamaNodes() {

   llama::TLlamaAMGetNodesRequest llama_request;

   llama_request.__set_am_handle(llama_handle_);

   llama_request.__set_version(llama::TLlamaServiceVersion::V1);

   llama::TLlamaAMGetNodesResponse llama_response;


   RETURN_IF_ERROR(LlamaRpc(&llama_request, &llama_response, NULL));

   RETURN_IF_ERROR(LlamaStatusToImpalaStatus(llama_response.status));

   llama_nodes_ = llama_response.nodes;

   LOG(INFO) << "Llama Nodes [" << join(llama_nodes_, ", ") << "]";

   return Status::OK;

 }


 bool ResourceBroker::GetQueryResourceMgr(const TUniqueId& query_id,

     const TUniqueId& reservation_id, const TNetworkAddress& local_resource_address,

     QueryResourceMgr** mgr) {

   lock_guard<mutex> l(query_resource_mgrs_lock_);

   pair<int32_t, QueryResourceMgr*>* entry = &query_resource_mgrs_[query_id];

   if (entry->second == NULL) {

     entry->second =

         new QueryResourceMgr(reservation_id, local_resource_address, query_id);

   }

   *mgr = entry->second;

   // Return true if this is the first reference to this resource mgr.

   return ++entry->first == 1L;

 }


 void ResourceBroker::UnregisterQueryResourceMgr(const TUniqueId& query_id) {

   lock_guard<mutex> l(query_resource_mgrs_lock_);

   QueryResourceMgrsMap::iterator it = query_resource_mgrs_.find(query_id);

   DCHECK(it != query_resource_mgrs_.end())

       << "UnregisterQueryResourceMgr() without corresponding GetQueryResourceMgr()";

   if (--it->second.first == 0) {

     it->second.second->Shutdown();

     delete it->second.second;

     query_resource_mgrs_.erase(it);

   }

 }


 ostream& operator<<(ostream& os,

     const map<TNetworkAddress, llama::TAllocatedResource>& resources) {

   typedef map<TNetworkAddress, llama::TAllocatedResource> ResourceMap;

   int count = 0;

   BOOST_FOREACH(const ResourceMap::value_type& resource, resources) {

     os << "(" << resource.first << "," << resource.second << ")";

     if (++count != resources.size()) os << ",";

   }

   return os;

 }


 ostream& operator<<(ostream& os, const TResourceBrokerReservationRequest& request) {

   os << "Reservation Request("

      << "queue=" << request.queue << " "

      << "user=" << request.user << " "

      << "gang=" << request.gang << " "

      << "request_timeout=" << request.request_timeout << " "

      << "resources=[";

   for (int i = 0; i < request.resources.size(); ++i) {

     os << request.resources[i];

     if (i + 1 != request.resources.size()) os << ",";

   }

   os << "])";

   return os;

 }


 ostream& operator<<(ostream& os, const TResourceBrokerReservationResponse& reservation) {

   os << "Granted Reservation("

      << "reservation id=" << reservation.reservation_id << " "

      << "resources=[" << reservation.allocated_resources << "])";

   return os;

 }


 ostream& operator<<(ostream& os, const TResourceBrokerExpansionRequest& request) {

   os << "Expansion Request("

      << "reservation id=" << request.reservation_id << " "

      << "resource=" << request.resource << " "

      << "request_timeout=" << request.request_timeout << ")";

   return os;

 }


 ostream& operator<<(ostream& os, const TResourceBrokerExpansionResponse& expansion) {

   os << "Expansion Response("

      << "reservation id=" << expansion.reservation_id << " "

      << "resources=[" << expansion.allocated_resources << "])";

   return os;

 }


 }

impala::MetricGroup::AddCounter
SimpleMetric< T, TMetricKind::COUNTER > * AddCounter(const std::string &key, const T &value, const TUnit::type unit=TUnit::UNIT, const std::string &description="")
Definition: metrics.h:239

impala::ResourceBroker::PendingRequest::request_id
const llama::TUniqueId & request_id() const
Definition: resource-broker.h:307

impala::ResourceBroker::PendingRequest::reservation_id
const llama::TUniqueId & reservation_id() const
Definition: resource-broker.h:308

LLAMA_KERBEROS_SERVICE_NAME
static const string LLAMA_KERBEROS_SERVICE_NAME
Definition: resource-broker.cc:59

impala::Status::GetDetail
const std::string GetDetail() const
Definition: status.cc:184

impala::ResourceBroker::llama_callback_address_
TNetworkAddress llama_callback_address_
Definition: resource-broker.h:172

impala::MonotonicStopWatch
Definition: stopwatch.h:74

impala::ResourceBroker::allocated_requests_
AllocatedRequestMap allocated_requests_
Definition: resource-broker.h:378

impala::ResourceBroker::AMNotification
void AMNotification(const llama::TLlamaAMNotificationRequest &request, llama::TLlamaAMNotificationResponse &response)
Definition: resource-broker.cc:691

impala::ResourceBroker::PendingRequest::allocated_resources_
std::vector< llama::TAllocatedResource > allocated_resources_
Definition: resource-broker.h:319

impala::ResourceBroker::reservation_requests_total_metric_
IntCounter * reservation_requests_total_metric_
Total number of reservation requests.
Definition: resource-broker.h:197

impala::ResourceBroker::reservation_requests_timedout_metric_
IntCounter * reservation_requests_timedout_metric_
Definition: resource-broker.h:211

impala::ResourceBroker::llama_registration_lock_
boost::mutex llama_registration_lock_
Definition: resource-broker.h:266

time.h

impala::ResourceBroker::allocated_memory_metric_
UIntGauge * allocated_memory_metric_
Total amount of memory currently allocated by Llama to this node.
Definition: resource-broker.h:241

impala::ClientConnection
Definition: client-cache.h:192

impala::query_id
const TUniqueId & query_id() const
Definition: coordinator.h:152

impala::ResourceBroker::Reserve
Status Reserve(const TResourceBrokerReservationRequest &request, TResourceBrokerReservationResponse *response)
Requests resources from Llama. Blocks until the request has been granted or denied.
Definition: resource-broker.cc:569

RETURN_IF_ERROR
#define RETURN_IF_ERROR(stmt)
some generally useful macros
Definition: status.h:242

query-resource-mgr.h

impala::ResourceBroker::requests_released_metric_
IntCounter * requests_released_metric_
Total number of fulfilled reservation requests that have been released.
Definition: resource-broker.h:247

impala::MetricGroup::RegisterMetric
M * RegisterMetric(M *metric)
Definition: metrics.h:211

impala::ResourceBroker::reservation_rpc_time_metric_
StatsMetric< double > * reservation_rpc_time_metric_
Definition: resource-broker.h:188

impala::ResourceBroker::Close
void Close()
Closes the llama_client_cache_ and joins the llama_callback_server_.
Definition: resource-broker.cc:302

impala::ResourceBroker::expansion_requests_total_metric_
IntCounter * expansion_requests_total_metric_
Total number of expansion requests.
Definition: resource-broker.h:224

impala::LlamaNotificationThriftIf::~LlamaNotificationThriftIf
virtual ~LlamaNotificationThriftIf()
Definition: resource-broker.cc:83

impala::MetricGroup
MetricGroups may be organised hierarchically as a tree.
Definition: metrics.h:200

impala::ResourceBroker::expansion_rpc_time_metric_
StatsMetric< double > * expansion_rpc_time_metric_
Definition: resource-broker.h:215

impala::ResourceBroker::AllocatedRequest
Definition: resource-broker.h:344

impala::ResourceBroker::llama_callback_thrift_iface_
boost::shared_ptr< llama::LlamaNotificationServiceIf > llama_callback_thrift_iface_
Thrift API implementation which proxies Llama notifications onto this ResourceBroker.
Definition: resource-broker.h:258

impala::ResourceBroker::PendingRequest::is_expansion
bool is_expansion() const
Definition: resource-broker.h:310

stopwatch.h

impala::ResourceBroker::scheduler_
Scheduler * scheduler_
Definition: resource-broker.h:176

impala::ResourceBroker
Definition: resource-broker.h:44

impala::ResourceBroker::WaitForNotification
bool WaitForNotification(int64_t timeout, ResourceMap *resources, bool *timed_out, PendingRequest *reservation)
Definition: resource-broker.cc:472

impala::StatsMetric< double >

impala::MakeNetworkAddress
TNetworkAddress MakeNetworkAddress(const string &hostname, int port)
Definition: network-util.cc:96

impala::ResourceBroker::GetQueryResourceMgr
bool GetQueryResourceMgr(const TUniqueId &query_id, const TUniqueId &reservation_id, const TNetworkAddress &local_resource_address, QueryResourceMgr **res_mgr)
Definition: resource-broker.cc:779

impala::LlamaNotificationThriftIf::resource_broker_
ResourceBroker * resource_broker_
Definition: resource-broker.cc:86

impala::ResourceBroker::allocated_vcpus_metric_
UIntGauge * allocated_vcpus_metric_
Total number of vcpu cores currently allocated by Llama to this node.
Definition: resource-broker.h:244

impala::ResourceBroker::reservation_requests_failed_metric_
IntCounter * reservation_requests_failed_metric_
Definition: resource-broker.h:204

impala::ResourceBroker::active_llama_metric_
StringProperty * active_llama_metric_
Definition: resource-broker.h:180

impala::SleepForMs
void SleepForMs(const int64_t duration_ms)
Sleeps the current thread for at least duration_ms milliseconds.
Definition: time.cc:21

impala::ResourceBroker::PendingRequest
Definition: resource-broker.h:284

scheduler.h

impala::ResourceBroker::SendLlamaRpc
void SendLlamaRpc(ClientConnection< llama::LlamaAMServiceClient > *llama_client, const LlamaReqType &request, LlamaRespType *response)
Definition: resource-broker.cc:391

impala::PrettyPrinter::Print
static std::string Print(bool value, TUnit::type ignored, bool verbose=false)
Definition: pretty-printer.h:33

impala::ResourceBroker::ClearRequests
void ClearRequests(const TUniqueId &reservation_id, bool include_reservation)
Definition: resource-broker.cc:636

impala::ResourceBroker::pending_requests_lock_
boost::mutex pending_requests_lock_
Protects pending_requests_.
Definition: resource-broker.h:334

impala::ResourceBroker::expansion_requests_rejected_metric_
IntCounter * expansion_requests_rejected_metric_
Number of well-formed expansion requests rejected by the central scheduler.
Definition: resource-broker.h:234

impala::ResourceBroker::LlamaHasRestarted
bool LlamaHasRestarted(const llama::TStatus &status) const
Detects Llama restarts from the given return status of a Llama RPC.
Definition: resource-broker.cc:286

impala::ResourceBroker::expansion_requests_failed_metric_
IntCounter * expansion_requests_failed_metric_
Definition: resource-broker.h:231

impala::Status
Definition: status.h:81

llama::LlamaStatusToImpalaStatus
impala::Status LlamaStatusToImpalaStatus(const TStatus &status, const string &err_prefix)
Definition: llama-util.cc:127

DECLARE_int32
DECLARE_int32(resource_broker_cnxn_attempts)

VLOG_QUERY
#define VLOG_QUERY
Definition: logging.h:57

impala::ResourceBroker::Release
Status Release(const TResourceBrokerReleaseRequest &request, TResourceBrokerReleaseResponse *response)
Definition: resource-broker.cc:666

impala::ResourceBroker::reservation_requests_fulfilled_metric_
IntCounter * reservation_requests_fulfilled_metric_
Number of fulfilled reservation requests.
Definition: resource-broker.h:200

impala::ResourceBroker::active_llama_addr_idx_
int active_llama_addr_idx_
Definition: resource-broker.h:168

impala::ResourceBroker::pending_requests_
PendingRequestMap pending_requests_
Definition: resource-broker.h:340

impala::MetricGroup::AddProperty
SimpleMetric< T, TMetricKind::PROPERTY > * AddProperty(const std::string &key, const T &value, const std::string &description="")
Definition: metrics.h:231

impala::ResourceBroker::PendingRequest::reservation_id_
llama::TUniqueId reservation_id_
Definition: resource-broker.h:323

debug-util.h

thrift-server.h

impala::ResourceBroker::CreateLlamaReleaseRequest
void CreateLlamaReleaseRequest(const TResourceBrokerReleaseRequest &src, llama::TLlamaAMReleaseRequest &dest)
Creates a Llama release request from a resource broker release request.
Definition: resource-broker.cc:328

impala::ResourceBroker::UnregisterQueryResourceMgr
void UnregisterQueryResourceMgr(const TUniqueId &query_id)
Definition: resource-broker.cc:793

impala::LlamaNotificationThriftIf::NMNotification
virtual void NMNotification(llama::TLlamaNMNotificationResponse &response, const llama::TLlamaNMNotificationRequest &request)
Definition: resource-broker.cc:77

thrift-util.h

impala::ResourceBroker::expansion_response_time_metric_
StatsMetric< double > * expansion_response_time_metric_
Definition: resource-broker.h:221

uint64_t

impala::ResourceBroker::PendingRequest::promise
Promise< bool > * promise()
Definition: resource-broker.h:296

impala::StatsMetric::Update
void Update(const T &value)
Definition: collection-metrics.h:112

impala::MonotonicStopWatch::Start
void Start()
Definition: stopwatch.h:81

resource-broker.h

impala::ResourceBroker::allocated_requests_lock_
boost::mutex allocated_requests_lock_
Protectes allocated_requests_.
Definition: resource-broker.h:371

impala::ResourceBroker::llama_client_id_
boost::uuids::uuid llama_client_id_
Definition: resource-broker.h:255

impala::ThriftServer
Definition: thrift-server.h:39

impala::ResourceBroker::ResourceBroker
ResourceBroker(const std::vector< TNetworkAddress > &llama_addresses, const TNetworkAddress &llama_callback_address, MetricGroup *metrics)
Definition: resource-broker.cc:89

impala::Scheduler::HandlePreemptedResource
virtual void HandlePreemptedResource(const TUniqueId &client_resource_id)=0

impala::MonotonicStopWatch::ElapsedTime
uint64_t ElapsedTime() const
Returns time in nanosecond.
Definition: stopwatch.h:105

count
uint64_t count
Definition: partitioning-throughput-test.cc:35

impala::Promise::Get
const T & Get()
Definition: promise.h:59

impala::Scheduler::HandlePreemptedReservation
virtual void HandlePreemptedReservation(const TUniqueId &reservation_id)=0

impala::ResourceBroker::expansion_requests_fulfilled_metric_
IntCounter * expansion_requests_fulfilled_metric_
Number of fulfilled expansion requests.
Definition: resource-broker.h:227

impala::ResourceBroker::Init
Status Init()
Definition: resource-broker.cc:182

impala::ResourceBroker::RefreshLlamaNodes
Status RefreshLlamaNodes()
Retrieves the nodes known to Llama and stores them in llama_nodes_.
Definition: resource-broker.cc:766

impala::ResourceBroker::active_llama_handle_metric_
StringProperty * active_llama_handle_metric_
Definition: resource-broker.h:184

network-util.h

impala::ResourceBroker::expansion_requests_timedout_metric_
IntCounter * expansion_requests_timedout_metric_
Definition: resource-broker.h:238

uid-util.h

status.h

impala::LlamaNotificationThriftIf::LlamaNotificationThriftIf
LlamaNotificationThriftIf(ResourceBroker *resource_broker)
Definition: resource-broker.cc:69

impala::OK
Definition: webserver.cc:115

impala::LLAMA_RESTART_SEARCH_STRING
const string LLAMA_RESTART_SEARCH_STRING
Definition: resource-broker.cc:65

DECLARE_int64
DECLARE_int64(llama_registration_timeout_secs)

impala::MetricGroup::AddGauge
SimpleMetric< T > * AddGauge(const std::string &key, const T &value, const TUnit::type unit=TUnit::NONE, const std::string &description="")
Create a gauge metric object with given key and initial value (owned by this object) ...
Definition: metrics.h:223

impala::ResourceBroker::RegisterWithLlama
Status RegisterWithLlama()
Definition: resource-broker.cc:204

llama-util.h

impala::UUIDToTUniqueId
void UUIDToTUniqueId(const boost::uuids::uuid &uuid, T *unique_id)
Definition: uid-util.h:38

impala::ResourceBroker::metrics_
MetricGroup * metrics_
Definition: resource-broker.h:174

impala::ResourceBroker::llama_handle_
llama::TUniqueId llama_handle_
Handle received from Llama during registration. Set in RegisterWithLlama().
Definition: resource-broker.h:269

impala::ResourceBroker::llama_addresses_
std::vector< TNetworkAddress > llama_addresses_
Llama availability group.
Definition: resource-broker.h:164

impala::Status::OK
static const Status OK
Definition: status.h:87

VLOG_RPC
#define VLOG_RPC
Definition: logging.h:56

impala::ResourceBroker::ReRegisterWithLlama
Status ReRegisterWithLlama(const LlamaReqType &request, LlamaRespType *response)
Definition: resource-broker.cc:438

impala::MonotonicSeconds
int64_t MonotonicSeconds()
Definition: time.h:41

impala::ResourceBroker::llama_callback_server_
boost::scoped_ptr< ThriftServer > llama_callback_server_
Definition: resource-broker.h:259

impala::ResourceBroker::Expand
Status Expand(const TResourceBrokerExpansionRequest &request, TResourceBrokerExpansionResponse *response)
Definition: resource-broker.cc:503

names.h

impala::ResourceBroker::query_resource_mgrs_
QueryResourceMgrsMap query_resource_mgrs_
Definition: resource-broker.h:388

impala::ResourceBroker::query_resource_mgrs_lock_
boost::mutex query_resource_mgrs_lock_
Protects query_resource_mgrs_.
Definition: resource-broker.h:381

impala::ResourceBroker::llama_nodes_
std::vector< std::string > llama_nodes_
List of nodes registered with Llama. Set in RefreshLlamaNodes().
Definition: resource-broker.h:272

impala::LlamaNotificationThriftIf::AMNotification
virtual void AMNotification(llama::TLlamaAMNotificationResponse &response, const llama::TLlamaAMNotificationRequest &request)
Definition: resource-broker.cc:72

impala::ResourceBroker::reservation_requests_rejected_metric_
IntCounter * reservation_requests_rejected_metric_
Number of well-formed reservation requests rejected by the central scheduler.
Definition: resource-broker.h:207

impala::ClientCache
Definition: client-cache.h:187

impala::QueryResourceMgr
Only CPU-heavy threads need be managed using this class.
Definition: query-resource-mgr.h:94

impala::Status::ok
bool ok() const
Definition: status.h:172

impala::operator<<
ostream & operator<<(ostream &os, const map< TNetworkAddress, llama::TAllocatedResource > &resources)
Definition: resource-broker.cc:805

impala::ResourceBroker::ResourceMap
std::map< TNetworkAddress, llama::TAllocatedResource > ResourceMap
Definition: resource-broker.h:111

impala::ResourceBroker::PendingRequest::GetResources
void GetResources(ResourceMap *resources)
Definition: resource-broker.cc:450

impala::ResourceBroker::NMNotification
void NMNotification(const llama::TLlamaNMNotificationRequest &request, llama::TLlamaNMNotificationResponse &response)
Definition: resource-broker.cc:762

impala::ResourceBroker::reservation_response_time_metric_
StatsMetric< double > * reservation_response_time_metric_
Definition: resource-broker.h:194

impala::LlamaNotificationThriftIf
Definition: resource-broker.cc:67

impala::ResourceBroker::LlamaRpc
Status LlamaRpc(LlamaReqType *request, LlamaRespType *response, StatsMetric< double > *rpc_time_metric)
Definition: resource-broker.cc:336

impala::ResourceBroker::llama_client_cache_
boost::scoped_ptr< ClientCache< llama::LlamaAMServiceClient > > llama_client_cache_
Cache of Llama client connections.
Definition: resource-broker.h:262

impala::ResourceBroker::PendingRequest::SetResources
void SetResources(const std::vector< llama::TAllocatedResource > &resources)
Definition: resource-broker.cc:460

impala::ResourceBroker::CreateLlamaReservationRequest
void CreateLlamaReservationRequest(const TResourceBrokerReservationRequest &src, llama::TLlamaAMReservationRequest &dest)
Creates a Llama reservation request from a resource broker reservation request.
Definition: resource-broker.cc:310