[Notes] [Git][BuildGrid/buildgrid][arber/91-get-tree] Implement getTree

Arber Xhindoli pushed to branch arber/91-get-tree at BuildGrid / buildgrid

Commits:

3593108e

by Arber Xhindoli at 2018-11-15T22:40:21Z

Implement getTree without use of page_size or token.

3 changed files:

buildgrid/client/cas.py
buildgrid/server/cas/instance.py
buildgrid/server/cas/service.py

Changes:

buildgrid/client/cas.py

@@ -390,7 +390,7 @@ class Downloader:
                  assert digest.hash in directories
                  directory = directories[digest.hash]
 -                self._write_directory(digest.hash, directory_path,
 +                self._write_directory(directory, directory_path,
                                        directories=directories, root_barrier=directory_path)
                  directory_fetched = True

buildgrid/server/cas/instance.py

@@ -58,18 +58,26 @@ class ContentAddressableStorageInstance:
          return response
 -    def get_tree(self, request, directory_list, digest_list):
 -        """
 -        This function will start reading directories at request.root_digest.
 -        It will push the directories, and their corresponding digests into the
 -        directory_list and digest_list.
+-
 -        It will continue to do a level-order traversal until either: directory_list reaches the end,
 -        or we have made request.page_size reads. If the latter case, it will return len(directory_list) - 1 so
 -        subsequent calls can pick up where it left off.
 -        Otherwise, returns None, meaning we have read the directory tree.
 -        """
 -        return None
 +    def get_tree(self, request):
 +        storage = self._storage
++
 +        # Create getTreeResponse message
 +        # TODO: handle page_token, page_size
 +        response = re_pb2.GetTreeResponse()
++
 +        # Set to MAX_REQUEST_COUNT, will use in the future to limit size of GRPC response
 +        if not request.page_size:
 +            request.page_size = 500
++
 +        def _get_tree(node_digest):
 +            directory_from_digest = storage.get_message(node_digest, re_pb2.Directory)
 +            directories = [directory_from_digest]
 +            for directory in directory_from_digest.directories:
 +                directories.extend(_get_tree(directory.digest))
 +            return directories
++
 +        response.directories.extend(_get_tree(request.root_digest))
 +        yield response
  class ByteStreamInstance:

buildgrid/server/cas/service.py

@@ -87,56 +87,14 @@ class ContentAddressableStorageService(remote_execution_pb2_grpc.ContentAddressa
      def GetTree(self, request, context):
          self.__logger.debug("GetTree request from [%s]", context.peer())
 -        context.set_code(grpc.StatusCode.UNIMPLEMENTED)
 -        context.set_details('Method not implemented!')
+-
 -        # Stores the directories as long as a page token is returned.
 -        directories = []
 -        # Stores the digests of those directories
 -        digests = []
+-
 -        # if page_size is not set
 -        if request.page_size == 0:
 -            request.page_size = 500
+-
 -        # Set to 0, will be used to index into directory list,
 -        # and updated in instance.get_tree. This is the only way this makes sense to me.
 -        request.page_token = 0
+-
 -        # start at index 1, to not return root
 -        start_index = 1
+-
          try:
              instance = self._get_instance(request.instance_name)
 -            while True:
 -                self.logger.debug("GetTree request: [{}]".format(request))
 -                # Returns next page_token once page_size directories is reached.
 -                # The page_token, is essentially an index into the directories/digests list.
 -                page_token = instance.get_tree(
 -                    request, directories, digests)
+-
 -                response = remote_execution_pb2.GetTreeResponse()
 -                if not page_token:
 -                    # get directories from last request to the end since no page_token
 -                    response.directories = directories[start_index:]
 -                    response.page_token = None
 -                    # stop the generator no more directories
 -                    return response
 -                else:
 -                    # return from last request, to current request directories
 -                    response.directories = directories[start_index:page_token]
 -                    response.page_token = str(page_token)
 -                    yield response
+-
 -                # create new request using returned page token, update start_index
 -                request = remote_execution_pb2.GetTreeRequest()
 -                request.page_size = 500
 -                request.page_token = page_token
 -                request.root_digest = digests[page_token]
 -                start_index = page_token
 +            response = instance.get_tree(request)
++
 +            return response
          except InvalidArgumentError as e:
 -            self.logger.error(e)
 +            self.__logger.error(e)
              context.set_details(str(e))
              context.set_code(grpc.StatusCode.INVALID_ARGUMENT)

[Notes] [Git][BuildGrid/buildgrid][arber/91-get-tree] Implement getTree without use of page_size or token.

Arber Xhindoli pushed to branch arber/91-get-tree at BuildGrid / buildgrid

Commits:

3 changed files:

Changes: