[autotest] Check deployment progress every 1 min to print unfinished servers Poll the deployment progress every one minute and logging the servers which are still running. BUG=chromium:666101 TEST=unittest and test on testing servers Change-Id: Ibc1194507da45c8073ee0a2d383a4b3324ee8560 Reviewed-on: https://chromium-review.googlesource.com/436350 Commit-Ready: Shuqian Zhao <shuqianz@chromium.org> Tested-by: Shuqian Zhao <shuqianz@chromium.org> Reviewed-by: Prathmesh Prabhu <pprabhu@chromium.org>

commit: fad50674321c90591cbaf35a3565398d4184d45d [log] [tgz]
author: Shuqian Zhao <shuqianz@chromium.org> Thu Feb 02 16:46:03 2017 -0800
committer: chrome-bot <chrome-bot@chromium.org> Wed Feb 08 16:24:28 2017 -0800
tree: 21f4e62ac80b3b8dfa7a261d24140650ecc34639
parent: 627a75ebc4cc2f755ccad17d1c9f92c91cc2e776 [diff] [blame]
diff --git a/site_utils/deploy_server.py b/site_utils/deploy_server.py
index 69306de..d460b2a 100755
--- a/site_utils/deploy_server.py
+++ b/site_utils/deploy_server.py

@@ -4,7 +4,7 @@
 
 import argparse
 import logging
-import multiprocessing.pool
+import multiprocessing
 import os
 import subprocess
 import sys
@@ -174,6 +174,8 @@
     start = time.time()
     server = inputs['server']
     status = inputs['status']
+    # Shared list to record the finished server.
+    finished_servers = inputs['finished_servers']
     options = inputs['options']
     print('Updating server %s...' % server)
     if status == 'backup':
@@ -190,6 +192,7 @@
             try:
                 print('[%s/5] Try to update server %s' % (i, server))
                 output = infra.execute_command(server, cmd)
+                finished_servers.append(server)
                 break
             except subprocess.CalledProcessError as e:
                 print('%s: Command failed with error: %s' % (server, e))
@@ -208,23 +211,42 @@
 
     @returns A list of servers that failed to update.
     """
+    # Create a list to record all the finished servers.
+    manager = multiprocessing.Manager()
+    finished_servers = manager.list()
+
     args = []
     for server, status, _ in servers:
         args.append({'server': server,
                      'status': status,
+                     'finished_servers': finished_servers,
                      'options': options})
     # The update actions run in parallel. If any update failed, we should wait
     # for other running updates being finished. Abort in the middle of an update
     # may leave the server in a bad state.
     pool = multiprocessing.pool.ThreadPool(POOL_SIZE)
     failed_servers = []
-    results = pool.imap_unordered(update_server, args)
-    for server, success, output in results:
+    results = pool.map_async(update_server, args)
+    pool.close()
+
+    # Track the updating progress for current group of servers.
+    incomplete_servers = set()
+    server_names = set([s[0] for s in servers])
+    while not results.ready():
+        incomplete_servers = server_names - set(finished_servers)
+        print('Not finished yet. %d servers in this group. '
+              '%d servers are still running:\n%s\n' %
+              (len(servers), len(incomplete_servers), incomplete_servers))
+        # Check the progress every 1 mins
+        results.wait(60)
+
+    # After update finished, parse the result.
+    for server, success, output in results.get():
         if options.dryrun:
             print('Dry run, updating server %s is skipped.' % server)
         else:
             if success:
-                msg = ('Successfully updated server %s' % server)
+                msg = ('Successfully updated server %s.\n' % server)
                 if options.verbose:
                     print(output)
                     print()
commit	fad50674321c90591cbaf35a3565398d4184d45d	[log] [tgz]
author	Shuqian Zhao <shuqianz@chromium.org>	Thu Feb 02 16:46:03 2017 -0800
committer	chrome-bot <chrome-bot@chromium.org>	Wed Feb 08 16:24:28 2017 -0800
tree	21f4e62ac80b3b8dfa7a261d24140650ecc34639
parent	627a75ebc4cc2f755ccad17d1c9f92c91cc2e776 [diff] [blame]